통계컬럼

광우병 – 통계 분석 관점

분류: 통계이야기 글쓴이: 이일현 날짜: 2008-07-31 01:38

                                 ---  통계 분석 관점에서 살펴본 광우병  ---

                                                                                                            -- 이일현(통계학 박사)

통계학에서는 가설을 설정한 후 그 가설에 대한 검정을 통한 통계 분석을 하게 된다. 통계는 객관화된 증거를 바탕으로 하는 과학적인 학문이다.

사실상 현재의 거의 모든 과학 분야에서는 통계 분석을 사용하며, 이 통계 분석 결과를 자신들의 연구모형에 대한 검정으로 사용한다. 그러므로, 실질적으로 통계 분석이 모든 학문의 기초가 된다고 할 수도 있다.

이에 대해서 올해 가장 문제가 되고 있는 "광우병" 사태와 관련하여, 통계 분석 관점에서 기술해 보고자 한다.

통계학에서는 H0 라는 귀무가설과 H1 이라는 대립가설을 설정하여 이에 대한 분석을 하게 되는데, H0 의 귀무가설은 =, H1 이라는 대립가설은 not= 형태로 설정을 하게 된다. 따라서, 광우병에 대하여 가설을 설정하면,

                 H0 : 광우병이 없다.

                 H1 : 광우병이 있다.

위와 같이 설정을 하게 되며, 통계학에서는 이 2개의 가설 중의 어떤 하나를 선택하기 위해서 분석을 하게 된다.

이때, 통계 분석에서는 어떤 증거를 수집하고, 분석을 하는 것이가?

통계학에서는 H0 가 아니라는 증거를 수집한다. 즉, 광우병이 없다가 아니라는 증거를 수집하는 것이다. H0 인 " 광우병이 없다라는 증거를 수집하는 것이 아니다." 이렇게 말하면 상당히 어려우지므로, 좀 더 쉽게 말하면 H0 가 아니라는 증거, 즉 H1 라는 증거를 수집한다(엄밀하게 말하면 이 2가지는 차이가 있으나, 이와 같이 생각하는 것이 이해하기 쉽다).

사실상 H0 라고 밝힐 수 있는 방법은 없다. 미국의 소가 광우병이 없다라는 것을 밝힐 수 있는 방법은 현실적으로 없다. 미국의 소가 광우병이 없다라고 말하기 위해서는, 미국의 모든 소를 도축해서 광우병이 있는지를 검사해야 한다. 이것은 현실적으로 불가능하다.

일본의 경우에는 도축하는 모든 소(20개월 미만의 소 포함하여 도축하는 모든 소)에 대해서 광우병 검사를 실시하고 있다. 하지만, 이것만으로 과연 일본의 소가 광우병이 없다라고 할 수 있을까? 물론 그럴 가능성이 상당히 높을 것이다. 하지만, 도축되지 않은 소와 어린 소들 중에서 광우병이 없다라고 장담할 수 없다.

그렇지만, 최소한 판매되고 있는 도축된 소는 광우병이 없다라고 확실할 수 있을 것이다.

즉, 광우병이 없다라고 말하고자 한다면, 모든 소에 대해서 검사를 해야 하는 것이다.

하지만, 미국 소의 검사 비율은 1000 마리당 1마리이다. 이렇게 검사된 소에서 광우병이 없다고 해서, 과연 다른 모든 소에 광우병이 없다라고 할 수 있을까? 누가나 생각할 수 있듯이 이것은 그렇지 않다. 검사하지 않은 소에서 광우병이 걸려 있을 수 있다.

물론 실제 미국소에 광우병이 걸려있지 않다라고 한다면, 저 정도의 검사만으로도 충분할 것이다. 하지만, 이것은 오직 신만이 알 수 있는 문제이고, 인간은 알 수 없는 부분이다. 만약 이것을 알고 있다고 말하는 사람이 있다면, 자신은 신이라고 주장하는 정신병자인 셈이다. 광우병이 없다라는 H0 가 맞다는 것을 밝힐 수 있는 방법은 없는 것이다.

이에 통계학에서는 H0 가 맞다라는 증거를 수집하는 것이 아니라, H0 가 아니라는 증거 즉, H1 이라는 증거를 수집하는 것이다.

만약 미국의 도축된 소에서 광우병이 발견되었다면 이것은 무슨 의미를 가질까? 미국은 1000 마리 중의 1마리를 도축한다. 따라서, 광우병이 걸린 소가 1 마리 발견되었다면, 단순히 산술적으로 생각한다면, 도축된 소 중에서 1000 마리의 광우병이 걸린 소가 있다라는 것을 의미한다. 하지만, 그 소가 어떤 소인지는 알 수 없기 때문에, 동일 라인에서 도축된 모든 소에 대해 전수조사를 하거나, 모두 폐기 처분할 것이다.

하지만, 그렇다고 해서, 나머지 소들에 대해서는 광우병이 없을까? 이것은 상당히 위험한 발상이다. 현재 도축된 소에서 광우병이 발견되었다면, 도축되지 않은 나머지 소들에서도 광우병이 있을 수 있다는 것을 의미한다.

즉, 도축된 소에서 광우병이 발견되었다면(H1 이라는 증거가 많다면), 이것은 나머지 소들에서도 광우병이 있을 가능성이 상당히 높다라는 것을 의미한다.

통계학에서는 H0 가 아니라는 증거가 5% 미만일 때(H1 이라는 증거가 95% 이상일 때)에만, H0 를 선택하지 않고, H1 을 선택한다. 즉, H1 이라는 주장을 할 때는 상당한 증거(95% 이상)가 있다는 것을 의미하며, 이것은 반복, 재현성이 있다는 것과 일맥상통한다.

그렇다면 H0 는 언제 선택할까? 통계학에서는 오직 H1을 선택하지 못할 때 - H0 가 아니라는 증거가 상당부분 많지 않을 때(H1 이라는 증거가 모자랄 때) - H0 를 선택한다.

즉, H0 라는 증거가 많아서 H0 를 선택하는 것이 아니라, H1 을 선택하지 못하기 때문에, 어쩔 수 없이 H0 를 선택하는 것일 뿐이다. 따라서, H0 는 H1을 선택하지 못하기 때문에 선택하는 차선책일 뿐이다.

그러므로, H1 을 선택할 때는 그 증거가 상당부분(95% 이상) 있으므로, H1 는 반복, 재현성이 있는 충분한 증거가 있으므로, H1 은 그만큼 확실하다고 할 수 있다.

결론 :  미국소는 광우병이 없다라고 말하면서, 과학에 대해서 더 공부하라고 주장하라는 것은 나는 신이다. 따라서, 내말을 믿어라라고 말하는 것과 똑같은 주장이다.

말 안 돼 (2008-09-28 19:34:27)

님의 결론대로라면 통계학을 공부할 필요가 없네요. 통계는 H1의 (낮은) 확률로서 H0을 증명하는 것인데 님은 (현실적으로) H0을 증명할 방법이 없다는 논리로서 광우병이 없다고 할 수 없다고 주장하잖아요. 아무리 통계해도 H0를 부정할 수 없다면, 그러면 뭐하러 통계하나요?
이런, 님에 대한 신뢰가 이 글로서 반감되어 버렸네요,

이일현 (2008-10-09 14:30:38)

지난주에 제가 상당히 몸이 안좋아서 병원에 있는 관계로 늦게서야 글을 봤네요.

사실 이 부분이 통계학에서 가장 어려운 부분입니다. 그리고, 한가지 착각을 하고 계신 부분이 있네요. "H0를 부정할 수 없다"는 부분인데요. 이것은 증명할 수 있습니다. p 값이 0.05 보다 작으면 우리는 H0를 부정(기각)하는 것이고, 그때에 H1 을 선택하는 것입니다.
즉, H0를 기각하고, H1 을 선택하는 것은 통계적인 증거가 충분할 때 하며, 그것을 밝히고자 하는 것이죠.

이에 비해서 H0 는 H0 라는 증거가 많아서 H0 를 선택하는 것이 아니라, H0 가 아니라는 증거가 모자라기 때문에 H0 를 선택하는 것입니다.

얼마전에 SBS에서 "신의 저울" 이라는 TV 프로그램에서 배심원단 중에 한 사람이 이런 말을 하더군요.

"유죄라는 증거와 무죄라는 증거를 저울에 달아서 유죄라는 증거가 많을 때 유죄라고 선고하는 것이 아니라, 유죄라는 증거가 무죄라는 증거가 엄청나게 많아서, 저울이 완전이 기울었을 때 유죄라고 선고한다"

제가 강의할 때 가설에서 자주 사용하는 예제 중의 하나인데요. H0 와 H1 에서 H1 이라는 증거가 엄청나게 많을 때 H1 이라고 선택을 하는 것입니다. 그렇지 않을 때는 H0 를 선택하는 것이죠.

사실 위에서 쓴 광우병에 대한 글은 가설검정의 관점에서만 국한해서 설명한 부분이 많이 있습니다. 즉, 광우병이 있다는 증거가 아주 많을 때에 비로서 "광우병이 있다" 라고 말합니다. 이때에는 누구든지 태클을 걸 수 없죠. 왜냐 광우병이 걸린 소가 발견되었다면, 이보다 더 명백한 증거는 없기 때문이죠.

하지만, 광우병이 있는 소가 발견되지 않았을 경우, 우리는 광우병이 있다, 없다라는 논란이 나오는 것입니다. 그래서, 그밖의 다른 증거들을 바탕으로 광우병의 위험이 매우 높다, 낮다 라고 말하는 것입니다. 그래서, 그 위험성이 매우 높을 때에 H1 을 선택하는 것이고, 그리고, 광우병이 있다(가능성이 매우 높다) 라고 말하는 것이죠. 하지만, 그 증거가 모자랄 경우에는 H1 을 선택하지 못하기 때문에 H0 를 선택해서 광우병이 없다(가능성이 낮다) 라고 합니다.

하지만, 실제로 통계학에서는 H0 에 대해서는 확신을 하지 않습니다. 즉, "광우병이 없다" 라고 말하는 것은 통계학의 관점이 아니죠. 왜냐? 지금까지 위에서 계속 말씀드린 대로, 광우병이 있다라는 증거가 모자라기 때문에 H0 를 선택한 것이지.. 광우병이 없다라는 증거가 많아서 H0 를 선택한 것이 아니기 때문이죠. 그래서, 이 경우 통계학에서는

"광우병이 있다라고 할 수 없다"

라는 애매한 표현을 쓰죠...

지충선 (2009-10-13 15:05:11)

박사님의 명쾌한 설명에 동의합니다.

이시우 (2009-12-28 14:09:43)

우와..재밌다 ^^

김태우 (2010-04-30 21:08:54)

박사님 말에 공감합니다.
좀 길어서 복잡하긴 한데.. 공가설(Null)의 의미를 말해주는 글인거죠?

양춘식 (2010-05-15 17:13:37)

박사님 강의를 수강한적이 있는 회원입니다다.
박사님의 해박한 지식은 물론 열성적이고 정성이 담긴 질문들에 대한 답변을 보고 항상 존경하고 있습니다.
저는 박사님의 홈페이지를 수시로 방문하여 새로운 지식을 얻고 있습니다.

대단히 감사합니다.

기존 StatEdu 통계이야기 글을 통계컬럼으로 이전했습니다. 원문: http://www.statedu.com/lec_iyagi/1417

광우병 – 통계 분석 관점

댓글

댓글