사후검정(Post-Hoc, Multiple Comparison)
ANOVA라고 하는 분산분석은 T-test와 거의 같으나, 한가지 추가적인 개념이 있다.
T-test와 ANOVA의 가설을 살펴보면,
T-test의 가설은 다음과 같다.
H0 : μ1 = μ2
H1 : μ1 ≠ μ2
그럼 집단의 수가 3개일 때의 ANOVA의 가설을 살펴보면
H0 : μ1 = μ2 = μ3
H1 : μ1 ≠ μ2 ≠ μ3
위와 같을 것이라고 생각을 하게 된다. 하지만, 실제로는 위와 같은 형태가 나오지 않게 된다. 그 이유로는
μ1 ≠ μ2 = μ3 = μ1
μ1 = μ2 ≠ μ3 = μ1
μ1 = μ2 = μ3 ≠ μ1
μ1 ≠ μ2 ≠ μ3 = μ1
μ1 ≠ μ2 = μ3 ≠ μ1
μ1 = μ2 ≠ μ3 ≠ μ1
μ1 ≠ μ2 ≠ μ3 ≠ μ1
집단의 수가 3개일 경우에는 위와 같이 7개의 가설이 나오기 때문이다. 그래서, ANOVA에서 H1의 가설로는 다음과 같이 설정을 하게 된다.
H1 : 적어도 하나는 다르다.
즉, H1 가설은 7개 중의 어느 하나이기 때문에 그중에서 어떤 한 가지라고 하는 것이다. 집단의 수가 4개일 경우에는 H1 가설은 15개가 되며, 5 집단일 경우에는 31가지가 나오게 된다. 그래서, 그 모든 것을 쓸 수가 없기 때문에 위와 같은 형태로 가설을 설정하는 것이다.
문제는 ANOVA는 다르다라고 하는 것은 알지만, 집단간에 어떠한 차이가 있는지는 알 수가 없다. 이것이 바로 ANOVA의 한계.
그래서, 개발된 방법이 사후검정(Post-Hoc Test), 또는 다중비교(Multiple Comparison)이라고 하는 방법이다. 이것은 위의 7가지 가설중에 어떤 것인지를 좀더 확인하기 위해서 개발된 방법으로 분산분석 후에 추가적으로 분석했다라고 해서 사후검정이라고 하며, 여러개의 평균을 동시에 비교해서 분석했다라고 해서 다중비교라는 말을 붙이고 있다.
사후검정 방법으로는 LSD, Bonferroni, Sidak, Tukey, Duncan, Dunnett, Scheffe 등 여러가지 방법이 있다. 그 중에서도 가장 유명하고 자주 사용되는 3가지 방법에 대해 설명을 드리면 Tukey, Duncan, Scheffe 의 방법이다. 여기에서 명칭들은 모두 해당 방법을 개발한 학자의 이름이다. 간략하게 방법들에 대해 설명을 하게 되면,
Tukey와 Duncan은 집단의 수가 같을 때 사용하는 방법이다. 예를 들어, 중졸이하, 고졸, 대졸이상으로 조사를 했는데, 각 집단의 조사인원이 50명으로 동일해서 전체 150명을 조사한 경우에 사용하는 방법이라는 것이다. 하지만, 현재는 집단의 수가 달라도 쓸 수 있도록 보완되어 있다.
이 두 방법의 차이는 Tukey는 공학, Duncan은 사회과학쪽에서 활동한 분들이라서, 현재에도 자연과학, 공학 등에서 실험을 할 경우에는 Tukey의 방법을 주로 이용하며, 사회과학, 심리학, 교육학 등과 설문조사일 경우에는 주로 Duncan을 이용하고 있는 추세이다.
SPSS 의 경우, Tueky의 사후검정 시 집단의 수가 같으면 Tueky의 방법을 이용하며, 집단의 수가 다를 경우에는 보완된 방법인 Tukey-Kramer 검정을 이용하여 사후검정을 실시한다. Tukey-Kramer 방법이 Tueky 방법과 다른 점은 조화평균을 사용한다는 것이다.
Scheffe의 방법은 집단의 수가 다를 때 쓰도록 고안된 방법이다. 물론 집단의 수가 같아도 사용할 수 있다.
이 3가지 방법의 민감도에 대해 생각을 하면 Scheffe의 방법이 가장 타이트하고, Duncan의 방법이 가장 루즈하다. 즉, Duncan의 방법은 왠만큼 차이가 나면 차이가 난다라고 하지만, Scheffe의 방법은 확실한 차이가 나야만 비로소 차이가 있다라고 해준다. 그래서, Scheff에서 차이가 있다라고 하면 Duncan에서는 차이가 있다라고 나오지만, 그 역은 성립하지 않는다. 그리고, Tukey의 방법은 Duncan과 Scheffe의 중간 정도에 위치한다고 생각하면 된다.
댓글
김우진 (2007-08-07 16:46:42)
감사합니다^^ 그런데 가설이 보이지 않네요..
오미선 (2008-01-10 20:31:18)
개념 정리에 도움이 많이 되었습니다.
김기진 (2008-07-03 00:27:01)
감사합니다....다시한번..다지네요..^^
강민경 (2008-11-02 01:40:04)
고맙습니다 확실하게 정리되어지네요
David_Yeo (2009-01-27 07:29:51)
너무나 감사합니다...
주연 (2009-06-12 19:46:30)
고맙습니다. 도움이 많이 되었습니다.
김종근 (2009-07-05 10:50:45)
도움이 되었습니다. 그런데 가설이 보이지 않습니다. 가설이 보이게 해 주시기 바랍니다.
최경호 (2009-09-26 04:41:54)
확실하고 명쾌한 설명입니다. ^^
김태우 (2010-04-30 19:15:27)
첫번째 가설 집단이 3개일 때 7가지는
3개중 어느 하나만 다른 경우 (3가지) + 3개중 2가지가 다른경우 (3가지)+ 3개중 3개다 다른 경우 (1가지) 이렇게 총 7개.
두번째 가설 집단이 5개일 때 총 31가지나온 것도 위와 같은식..
저걸 다 적을 수 없으니 적어도 어느 하나는 다르다라고 표현 하는거...
짐승 (2012-07-25 10:39:44)
가설에서 틀린 부분이 있네요
μ1 = μ2 ≠ μ3 = μ1
이러한 경우는 존재하지 않습니다.
마찬가지로 가설 중 수학적으로 모순이 생기는 것이 몇 개 있네요~
이일현 (2012-07-26 11:53:50)
수학적 관점에서는 말이 안되는 모순이 맞습니다.
하지만, 통계학적 관점에서 보면 다르게 생각할 수 있습니다.
이 가설에서 말하고자 하는 것은 2집단과 3집단의 평균은 유의한 차이가 있지만, 1-2 집단간, 1-3 집단간에는 유의한 차이가 없다는 것을 의미합니다.
이준한 (2013-12-18 09:43:56)
감사합니다.
기존 StatEdu 렉쳐 글을 통계컬럼으로 이전했습니다. 원문: http://www.statedu.com/lecture/7393

댓글
로그인 후 댓글을 남길 수 있습니다.