통계 분석16 [Python] 일표본 t-검정(대응하는 비모수 검정) T-검정은 대표적인 모수검정 중 하나입니다. 이번 글에서는 T-검정의 종류와 파이썬에서의 사용법, 이에 대응하는 비모수적 검정법을 알아보도록 하겠습니다. T-검정의 종류 t-검정에는 일표본 t-검정, 독립 표본 t-검정, 대응 표본 t-검정등이 대표적인 t-검정법이 있습니다. 파이썬 scicpy 라이브러리의 stats모듈에서 여러가지 t-검정을 수행하는 함수를 제공하고 있습니다. 1. 일표본 t-검정 (One-sample t-test) 모집단의 평균을 알고 있을 때, 연구자가 분석하고자 하는 표본집단과 이미 알고 있는 모집단과의 평균 차이를 분석하기 위해 사용하는 검정법입니다. 이때, 모집단의 평균이 아닌 임의로 설정한 평균과 비교하는 것도 가능합니다. 일표본 T-검정의 전제조건 일표본 T-검정을 수행하.. 2023. 11. 8. [기초 통계] 신뢰수준, 신뢰구간, 유의확률(P-value), 유의수준 신뢰수준( Confidence Level ) 정의 : 특정 범위(신뢰구간)가 모집단의 모수를 포함할 확률 표본이 모집단을 대표하는 정도를 어느 정도까지 신뢰할 수 있는지를 뜻합니다. 95% 신뢰수준이라는 말은 표본의 개수가 100개라면 100번 중 5번은 전체 평균에서 벗어날 수 있다는 것을 의미합니다. 예시 : 95% 신뢰수준에서 평균은 10 ~ 20사이에 있을 것이다. 위 예시 문장의 의미는 동일한 실험을 100번 반복했을 때, 평균이 10~20이 나올 확률이 95번이라는 것을 뜻합니다. 신뢰수준이 높을수록 가설검정 기준이 엄격해지는 것입니다. 유의 수준( Significance Level ) 유의 수준은 α(알파)라고 표기합니다. 정의 : 통계적 가설 검정 검정에서 오류를 범할 가능성을 허용하는 최.. 2023. 10. 31. [표본 통계량의 분포] t분포 표본 통계량이란? 앞의 글에서 잠깐 이야기 했듯이 모집단 전체를 분석할 수 없기 때문에 표본을 추출하게 됩니다. 그 표본에서 구한값을 표본 통계량이라고 합니다.(ex. 표본평균, 표본분산,표본 비율) 이러한 값들을 표본을 추출할때마다 값이 변하기 때문에 확률변수 라고합니다. 위의 확률변수들이 가지는 분포를 확률 분포라고 합니다. 표본평균의 분포 우선 표본 평균의 식은 다음과 같습니다. 표본평균은의 분포는 중심극한정리에의해 표본의 수(n)가 많아 질수 록 정규분포에 근사합니다.(n>=30) 정규분포를 식으로 나타낸다면 아래와 같습니다. 이때 모집단의 표준편차 시그마를 모르는 경우가 발생합니다. 이때 표본의 표준편차를 사용하게 됩니다. 이때의 식은 아래와 같습니다. 위의 식은 정규분포가 아닌 t분포를 따릅니.. 2023. 10. 31. [Python] 정규성 검정 1. 정규성이란? 정규성이란 데이터의 분포가 정규 분포를 따르는지 나타내는 통계적 개념입니다. 정규 분포란 평균을 중심으로 양쪽으로 대칭인 종 모양의 분포를 말합니다. 평균(m)이 100, 표준편차(s)가 10인 그래프 2. 정규성 검정을 하는 이유 전의 글에서 말씀드렸듯이 모수 검정에서는 정규성이 만족이 되어야하는 전재조건이 있었습니다. 이러한 이유와 같이 많은 통계적 기법들은 데이터가 정규 분포를 따른다는 가정하에 개발이 되었기 때문입니다. 정규성을 만족하는 대표적인 통계적 기법들 아래와 같습니다. t-검정(T-test) 분산분석(Analysis of Variance, ANOVA) 회귀분석 3. 파이썬에서 정규성 검정 파이썬의 scipy.stats라이브러리에서 정규성 검정을 지원합니다. 정규성 검정을.. 2023. 10. 28. 이전 1 2 3 4 다음