본문 바로가기
728x90

t-test5

변수간의 관계성 상관분석 ==> > 두변수 간 관계성이 얼마나 큰가를 알아볼 때 >> 관찰값들의 분포를 설명 - 회귀분석으로 가기위해 꼭 거치는 관문 ** '상관'없는 '회귀'는 팥소없는 붕어빵과 같음 - 상관분석에서 가장 중요하게 다루는 것: 상관계수(correlation coefficient) 단순 회귀 분석 *상관계수를 제곱한 값 >> 하나의 요인으로 현상을 설명하기 >> 다음 관찰값들이 어떻게 관찰될지에 대한 예측 - 하나의 독립변수로 또 다른 종속 변수(결과 변수)를 예측하는 것 => 단순 선형 회귀 분석 ** 대개 우리의 연구는 관심을 두는 종속 변수(결과값)가 하나의 독립 변수로 충분히 설명되는 경우는 거의 없음!! >> 즉, 대개 적게는 서너개 또는 그 이상의 독립변수들을 고려해야 종속 변수가 그나마 예측.. 2023. 10. 30.
그룹간의 평균/비율 비교 실험/비교집단 분석(; t-test) -의미 있는 p-값(p-value, 데이터가 얼마나 특이한지를 나타내는 값) 찾기 ==> p윌콕슨 순위합 검정(; Wilcoxon rank-sum test) - 분석 조건: 결과값이 연속형 변수가 아닌 경우, 결과값이 연속형 변수이지만 정규 분포가 아닌 경우 ->웰치의 검정(; Welch's test) - 분석 조건: 결과값이 연속형 변수이고 정규 분포를 가지고 있지만 등분산이 아닌 경우 >>정규분포 확인하는 방법 ==> >등분산 확인하는 방법 ==> >t-검정을 하는 방법, 위 두 과정으로 확인한 후, - 그룹 간의 차이 평균을 비교하여, - p-값이 0.05 보다 작다면 , 두 그룹의 평균은 통계적으로 의미 있게 차이가 난다라고 볼 수 있다 p-값이 0.05 보다.. 2023. 10. 30.
기초통계적인 검정 및 분석 신뢰도/타당도 검증 신뢰구간(confidwnce interval, CI) - *예시/활용 * 이를 통해, 변수가 가지는 전반적인 특성을 파악할 수 있음 -> 조사 항목에 대한 설문 응답자, 실험 대상자의 분포와 빈도 및 비율을 확인할 수 있음 -> 빈도 분석에서 사용할 수 있는 척도: 명목 척도, 서열 척도, 등간 척도, 비율 척도 데이터 = 범주형 변수 + 연속형 변수 범주형 변수: 명목척도, 서열척도 연속형 변수: 등간척도, 비율척도 명목척도 -성별, 직업, 학력, 거주지 등 서열척도(; 순위척도) -나쁨, 보통, 좋음 처럼 명목 척도 같지만, 변수 사이에 서열(순위)이 존재하는 경우 예) 연령대 *연령(나이)은 연속형 변수 등간척도 -정수로 딱 떨어지는 값 -사람 수를 셀 때를 들수 있음. 학생 수.. 2023. 10. 29.
데이터 준비 데이터, 기초통계,신뢰구간,빈도분석,t-test,ANOVA,카이제곱교차분석,비모수검정,상관분석,회귀분석 ------------------------------------- 데이터 클리닝data cleaning, data cleansing -본격적인 분석에 앞서 테이터 정리하기 -raw 데이터를 통계 분석용 데이터로 정리하는 과정 -데이터마다 상황별로 적용해야할 클리닝 방법이 상이하므로 경우/상황에 맞게 데이터를 분류/정리해야 함 (실사례, 엉터리로 작업된(정리안된) 엑셀 내 데이터를 통계 프로그램에서 사용하기 쉽도록 다듬는 일 spreadsheet 스프레드시트 엑셀, 한셀, (공학용: origin, sigmaplot 등) *프로그램 실행화면 캡쳐 삽입 -데이터를 모으고 클리닝하는 프로그램 -데이터 시각화.. 2023. 10. 28.
728x90