통계컬럼

Durbin-Watson 검정

분류: 렉쳐 글쓴이: 이일현 날짜: 2015-05-04 23:48

회귀분석에서는 여러 가지 기본적인 조건이 존재한다.
그 중에서 종속변수의 자기상관이 있으며 1차 자기상관은 Durbin-Watson 지수 d 를 이용하여 검정한다.
d 값은 0~4 사이에 나오며 2에 가까울수록 자기상관이 없이 독립이며, 독립인 경우 회귀분석을 사용할 수 있다.

하지만 d 값이 0 이나 4 에 가까우면 자기상관이 존재한다고 하며, 이 경우 회귀분석을 할 수 없으며, data 를 수를 추가하거나 중요한 독립변수를 추가하는 방법 사용한다. 이 방법으로도 해결되지 않을 경우 시계열 분석을 실시한다.

이때 d 값에 대한 기준은 다음 그림과 같이 설정한다.

DW.png

 d 값이 upper critical values 값이 dU 와 4-dU 사이에 존재하면 자기상관이 없이 독립이다.

lower critical values 값이 dL 보다 작거나 4-dL 보다 큰 경우에는 자기상관이 존재한다.

dL과 dU 사이, 또는 4-dU 와 4-dL 사이에 d 값이 있으면 불확실 영역으로 판정한다. 불확실 영역으로 판정되는 경우 대부분 표본 수가 작기 때문에 발생하는 문제이며, 이때에는 표본 수를 추가해서 재 분석을 한다.

자기상관을 검토하는 상한값과 하한값인 dU와 dL 을 찾기 위해서는 2 개의 값이 필요하다.

첫 번째는 표본의 크기 n 이며, 두 번째는 독립변수의 수 p 이다.

첨부된 EXCEL 파일은 n, p 를 입력하면 dU와 dL 값을 자동으로 계산해주면 Macro 파일이다.

Durbin_Watson_test.xlsx

예를 들어  n=223, p=5 인 경우 회귀분석을 실시한 결과 Durbin-Watson 지수 d=1.899 로 나왔다면

dU = 1.827

4-dU = 2.173

dL = 1.735

4-dL = 2.265

이다. 따라서 1.827=dU < d=1.899 < 2.173 = 4-dU 이므로 자기상관이 없이 독립이다.

따라서 이 자료는 회귀분석을 실시할 수 있다.

본 EXCEL macro 는 자료의 수 2000 개 와 독립변수 20개까지 가능하게 만들어졌습니다. 

범주형 변수의 경우에는 Dummy 변수로 변환해서 분석을 해야 하며, Dummy 변수의 수도 독립변수의 수가 계산해야 합니다. 

EXCEL macro 파일은 개인이라면 누구나 연구, 교육 목적으로 사용 가능합니다. 

Attachments

  • DW.png - 湲곗〈 寃쎈줈: ./files/attach/images/60/051/226/06ee4795c583f9de0e3220951d4a551c.png
  • Durbin_Watson_test.xlsx - 湲곗〈 寃쎈줈: ./files/attach/binaries/60/051/226/5709d10180111d70e6aba0785f7b0002

기존 StatEdu 렉쳐 글을 통계컬럼으로 이전했습니다. 원문: http://www.statedu.com/lecture/226051

댓글