통계컬럼

통계 개념과 연구 해석을 쉽게 풀어 쓴 StatEdu 컬럼입니다.

  • ANOVA 와 Post-Hoc test(사후분석) 결과가 다를 때

    ANOVA 에서 유의한 차이가 있는 경우 Tukey, Duncan, Scheffe 등의 사후분석(Post-Hoc test)를 하게 된다. 문제는 ANOVA 와 사후분석 결과가 일치하지 않는 경우가 종종 나올 때, 어떻게 해야되는지 고민을 하게 된다. 2가지 예를 들어 상황을 살펴보도록 한다. 1. ANOVA 에서는 유의하지 않은데, 사후분석에서 유의하게 나온 경우 위의 결과를 보면 ANOVA 결과, 집단간 유의한 차이가 없는 것으로 나타났다(p=.136>.05)

  • ANOVA 에서 등분산 가정을 만족하지 못하는 경우

    ANOVA 는 기본적으로 Independnent t-test 와 기본적인 개념이 동일한 분석이다. ANOVA 에서도 t-test 와 마찬가지로 정규성과 등분산 가정이 존재한다. 지금까지의 경우 t-test 의 등분산에 대해서는 엄격하게 적용을 해서 Levene 이나 Bartlett 의 등분산 검정을 해서, 등분산 조건을 만족한 경우에는 일반적인 t-test 를, 등분산 조건을 만족하지 못한 경우에는 등분산이 아닌 경우에 사용하는 t-test 를 사용했다. 하지만

  • [지수 기준] Cohen’s kappa (평가자간 일치도)

    평가자간 일치도를 측정하는 대표적인 통계량은 Cohne’s kappa 이다. Cohen’s kappa 는 두명의 평가자가 0/1 로 평가한 경우, 그 평가 결과가 얼마나 일치하는지를 측정하는 지표를 .80 이상 나와주어야 한다. κ = 0 이면 두명의 평가자가 완벽하게 서로 다르게 평가를 했다는 것이고, κ = 1 이면 완벽하게 일치한다는 것이다. 이때, Choen’s κ 의 기준으로 κ ≤ 0.2 : poor 0.2 κ ≤ 0.4 : fair 0.4 : mod

  • [지수 기준] Cronbah’s alpha

    신뢰도 분석에서 자주 쓰이는 Cronbach’s alpha 의 기준값에 대해서 살펴본다. 일반적으로 .6 이상이면 신뢰도가 있다라고 하는데, 신뢰도의 레퍼런스로 가장 많이 쓰이는 Nunnally 에 의하면 .7 이상이면 “신뢰할 만 하다”라고 한다. 이전의 사회과학 연구들을 보면 .6 이상이면 허용하였으나, 요즘 저널들의 추세를 살펴보면 .7 이상 나와야만 허용하는 쪽으로 방향을 바뀌어졌다. 따라서, 사회과학 연구에서는 어떤 척도를 사용하느냐가 연구에서 상당히

  • [지수 기준] 결정계수(R^2) 사회과학

    통계 분석을 하다보면, 유의수준이 없는 지수들의 기준값을 얼마로 적용해야 하는지에 대해 많은 고민을 하게 됩니다. 그래서, 앞으로 차근히 하나씩 올려가도록 하겠습니다. 회귀분석에서 많이 사용하는 결정계수의 값의 크기는 얼마 이상이어야 할까… 일반적으로 자연과학, 공학등에서는 70%, 사회과학에서는 30% 이상을 추천한다. 대표적인 학자 중의 한 분이 Cohen 에 의하면 작은 크기 : 2%(ES = 0.02) 중간 크기 : 13%(ES = 0.15) 큰 크기

  • 드라마 속의 여론조사와 출구조사

    드라마 속의 여론조사와 출구조사 – 이일현(통계학 박사) 오늘(2010. 10. 21, 목) TV에서 대물이라는 드라마를 시청하는 중간에 보니, 서혜림(고현정)의 선거구에 대한 여론주사 결과(선거기간 중간)와 투표 후 출구조사를 발표하는 뉴스 장면이 나왔다. 이를 보니 몇 가지 잘못된 내용이 나오는 것이 있어서 정정을 하고자 한다. 물론 드라마라고 생각하고 보면 아무 문제가 없다. 나도 물론 보면서 드라마니까… 하면서 넘어간 부분이기도 하고, 하지만 통계를

  • 위기탈출 넘버원 – 검은 옷을 입은 아이가 위험하다

    검은 옷을 입은 아이들이 밤에 위험하다 – 이일현 (통계학 박사) 위기탈출 넘버원이라는 프로그램에서 검은 옷을 입은 아이들이 밤에 운전자들에게 제대로 보이지 않아 사고를 당할 가능성이 크다는 취지의 실험을 했다. 아이를 키우는 아버지의 입장에서 관심있게 시청을 했다. 결론적으로 말하면 검은색 계통의 옷은 운전자에게 제대로 인식이 되지 않아서 위험하다는 것… 그래서 실험을 실시한 결과, 운전면허 학원의 주행 코스에 마네킹 8개를 배치하여, 검은색 옷을 입혀놓았

  • SNS 이용자가 국민 절반 넘는다.

    전체 인터넷 이용자의 65.7%가 SNS 를 이용하고 있다(방송통신위원회,한국인터넷진흥원, 2010년 9월 조사) ==> 전 국민의 65.7%가 SNS 를 이용하고 있다(한나라당 안효대 의원, 5일, 국감에서 방통위의 결과를 인용하면서…) 위 기사를 발단으로 정리한 글입니다. 잘못 인용된 통계의 사례 – SNS 이용자가 국민 절반을 넘는다. – 이일현(통계학 박사) “트위터 등 SNS 사용자, 국민 절반 넘는다”, 2010.09-29 / 헤럴드 경제 인터넷

  • 정규성 검정(Normarly Test)

    통계 분석에서 중요한 이론 중의 하나가 data 가 정규분포이어야 한다는 정규성 검정이다. 정규성 검정의 가설은 H0 : 정규분포이다 H1 : 정규분포가 아니다 이다. 따라서 정규성 검정을 할 경우에는 등분산 검정과 마찬가지로 p 값이 0.05 보다 커서 H0 가설을 채택하는 것이 좋다. 그래야만 정규성 가정을 만족하게 되며, 통계 분석들에서 수월하게 다음 단계의 진행이 될 수 있다. 정규성 검정에 쓰이는 대표적인 방법은 Kolmogolov-Sminov 검정과