Q&A – StatEdu통계연구소

[re] 자유도란 무엇입니까?

분류: process macro 글쓴이: StatEdu 날짜: 2002-08-19 14:27

결국 자유도에 관한 문제이네요. 그런데 사실 자유도(degree of freedom)라는 개념은 상당히 어려운 것에 속하게 됩니다. 너무 깊게 들어가면 상당히 난해하기 때문에 정확한 개념은 아니지만 이해할 수 있도록 비유를 들어 설명하도록 하겠습니다.

>1. 자유도는 통계학에서 어떤 개념 입니까?

Answer >
자유도(degree of freedom; df)는 말그래도 풀이하면 "자유스러운 정도"라고 할 수 있습니다. df의 개념을 이해하려면 편차의 합은 0 이라는 성질을 이해해야 합니다.

예를 들어, 남자 4명(A, B, C, D)과 여자 4명(a,b,c,d)가 미팅을 합니다. 이런 저런 얘기 끝에 파트너를 결정하기로 했는데, 그 방법으로 여자들이 차례로 남자를 결정하는 방식을 택했습니다.

첫번째 여자 a 는 4명의 남자들 중에서 자신의 파트너를 자유롭게 선택할 수 있습니다. D
두번째 여자 b 는 남은 3명의 남자(A, B, C) 중에서 자유롭게 선택할 수 있습니다. A
세번째 여자 c 는 남은 2명의 남자(B, C) 중에서 자유롭게 선택할 수 있습니다. B
마지막 여자 d 는 무조건 C라는 남자와 파트너를 해야됩니다.

이제 미팅이 끝나고 파트너를 정했습니다. 위에서 보면 a,b,c 3명의 여자는 파트너를 자유롭게 선택할 수 있었습니다. 즉, 자유롭게 선택할 수 있는 여자의 수는 자유도는 4-1 = 3 이 됩니다. 그래서 유명한 자유도 n-1 이 나오게 된 거죠.

이것을 편차와 결부시켜 생각을 하면 편차를 계산하려면 평균은 당연히 알고 있겠죠. 그리고 편차의 합은 0 이라는 성질을 이해하면 n-1 개의 값들은 어떤 값이던 자유롭게 될 수 있습니다. 그러나 마지막 하나의 값은 n-1 개의 값이 정해지면 그 값도 자동으로 결정이 나죠.
이것이 아래의 표준편차에서 n 이 아닌 n-1 로 나누어주는 이유중의 하나입니다.

>2. 분산을 계산할 때 모분산은 n으로 나누어주고, 샘플집단 분산은 n-1로 나누어 주는데....그 이유를 잘 모르겠네요..

Answer >
아래의 2식은 모표준편차와 표본표준편차의 식입니다. 통계학에서는 분산을 아주 중요시 하는데, 실제로는 분산이 아닌 표준편차입니다. 단지, 표준편차를 직접 계산하기 힘드니 분산을 이용한 다음 다시 표준편차를 계산하는 것이죠.

위의 2식을 살펴보면 서로 틀린 것은 N(n-1), mu(x bar) 라는 것의 차이입니다. 그중에서도 모표준편차는 N 이고 표본표준편차는 n-1 이라는 것이 가장 큰 차이가 되죠.

사실 모표준편차는 모집단 전체에서 계산한 것이기 때문에 별 문제가 없습니다. 그러나, 표본표준편차인 경우에는 모집단 전체가 아닌 표본에 의해서 구해지기 때문에 오차가 생기게 됩니다. 표본표준편차를 궁극적인 이유는 표본의 표준편차가 궁금한 것이 아니라 모집단의 표준편차를 아는 것이 중요합니다.

결국 위의 값이 0이 되기를 바라는 것이죠. 그러나, s는 표본에 의해서 구해졌기 때문에 0 이 아닌 다른 값이 나오게 될 가능성이 훨씬 높습니다. 그렇다면 우리는 그 값이 작을수록 좋을 것입니다. 이때 표본표준편차 s 의 계산식에서 n 을 사용한 경우와 n-1을 사용한 경우에 그 오차가 작은 것은 n-1 로 나누얼때에 휠씬 더 작게 됩니다.

그러므로, 자유도의 문제와 오차의 문제에 의해 n 이 아닌 n-1 로 나누는 것이 더 좋은 값을 얻을 수 있게 되는 것입니다.

... 언제나 최선을 다하는 StatEdu가 되길 빌며 ...

Legacy document_srl: 78454 / Legacy URL: http://www.statedu.com/QnA/78454

댓글은 로그인한 회원만 작성할 수 있습니다.