Dummy(더미)변수 생성하기
①②
회귀분석에서 명목이나 서열척도인 범주형 독립변수(or 통제변수 등)가 포함되어 있는 경우 더미변수로 변환해서 분석해야 한다.
더미(Dummy) 변수를 만드는 여러 가지 방법이 있지만 그 중에서 가장 편하게 만들 수 있는 방법에 대해 소개한다.
1. 변환 --> 더미변수 생성

SPSS 에서 기본적으로 제공하는 메뉴는 아니지만 손쉽게 설치하여 매우 편하게 사용할 수 있는 방법이다.
기존의 SPSS 메뉴에 있는 아이콘과 다른 ![]()
모향이다.
아이콘은 SPSS 자체적으로 지원하는 메뉴가 아니라 추가적으로 설치하여 사용하는 메뉴이다.
(
더미변수 작성 메뉴가 없는 경우 : 설치하는 방법은 추가 강좌로 설명한다)
2. 메뉴 : 더미변수 작성

① 더미변수로 변환할 범주형 변수를 투입한다
② 생성될 더미변수의 이름을 작성한다
(※ 투입한 변수의 수만큼의 새 변수명을 입력한다.
변수명 사이에는 " , " 로 구분한다)
저자는 기존 변수명에 " D. " 를 추가하여 변수명을 생성한다. 예를 들어 sex 라는 변수의 Dummy 변수명은 D.sex 로 한다.
3. 결과

새로운 변수가 6개 생성된 것을 확인할 수 있다.
D.sex 변수는 D.sex_1 , D.sex_2
D.edu 변수는 D.edu_3, D.edu_4, D.edu_5 , D.edu_6
과 같이 생성된다.

sex 는 남자(1)와 여자(2) 의 2 집단(2 수준) 을 가지는 변수이며 sex 이 1 (남자) 인 경우 D.sex_1 의 값은 1 이고, D.sex_2 의 값은 0 으로 변환되었다.
sex 가 2(여자)인 경우 D.sex_1 은 0, D.sex_2 는 1 의 값을 가지게 된다.

edu 변수의 학력도 1(중졸 이하), 2(고졸), 3(대졸), 4(대학원 이상) 의 값은 D.edu_3, D.edu_4, D.edu_5, D.edu_6 의 변수에 1 의 값을 가지고 다른 값은 모두 0 으로 변환된 것을 확인할 수 있다.
sex 는 2 수준, edu 는 4 수준을 가지는 변수이므로 새로 생성된 Dummy 변수는 변수명 뒤에 차례 대로 _1, _2, _3, _4, _5, _6 과 같이 순서대로 숫자가 부여되는 것을 알 수 있다.
만약 Dummy 변수로 만들고자 하는 변수가 5 개가 있다면 "1. 변환 --> 더미변수 작성" 메뉴에서 ① 에 그 5개 변수를 투입하고, ② 에 새로운 변수명 5 개을 입력한다.
그런 후에 생성된 Dummy 변수의 개수는 5개 범주형 변수의 총 수준수 만큼 생성된다.

edu 변수에 "값"을 지정한 경우에는 위와 같이 레이블(label) 에 해당 값이 자동으로 레이블로 저장되는 것을 확인할 수 있다.
sex 은 "값"을 지정하지 않았으며, 이 경우에는 sex 에 입력한 값 1, 2 가 레이블에 입력된다.
분석은 이 6개 변수를 모두 투입해서 분석을 하면 된다.
하지만 저자의 경우 아래와 같은 추가 작업을 실시한 후 분석을 한다.
Dummy 변수에서 가장 중요한 것은 reference 와 event 의 개념이다.
또한 Dummy 변수는 " 수준수 - 1 " 개의 Dummy 변수를 생성해야 한다.
성별의 경우 수준이 남자, 여자의 2 이므로 Dummy 변수는 1 개, 학력은 중졸 이하, 고졸, 대졸, 대학원 이상 의 4 개이므로 3 개의 Dummy 변수가 필요하다.
그애서 위와 같이 D.sex_1, D.sex_2 에서 하나의 변수를 삭제한다. 이때 삭제하는 것은 refercene 의 값이 " 1 " 로 되어 있는 변수를 삭제한다.
sex 은 남자, edu 은 중졸 이하를 reference 로 잡을 경우, D.sex_1 과 D.edu_3 이 각각 남자, 중졸 이하가 " 1 " 로 되어 있는 reference 변수이므로 이 2 개의 변수를 삭제한다.
그런 다음 이 변수들의 이름으로 다시 지정해주는 것이 분석할 때와 분석 결과를 해석할 때 매우 편리하다.
저자의 경우 Dummy 변수의 이름 뒤에 event 값을 부여해서 입력한다.
예를 들어 sex 의 성별의 경우 남자를 reference , 여자를 event 로 설정한 경우에는 reference 에 해당하는 D.sex_1 은 삭제한 후 event 인 여자에 해당하는 D.sex_2 는 " D.sex.F " 로 변수명을 설정한다.
변수명이 D.sex.F 이면 " F(여자) " 가 event 인 Dummy 변수라는 뜻이다.
D.edu.대졸 이라면 " 대졸 " 이 event 인 Dummy 변수라는 것이고, 값이 없는 " 중졸 이하 " 는 reference 가 된다.
Attachments
- 1.메뉴.jpg - 湲곗〈 寃쎈줈: ./files/attach/images/60/006/244/9fc888f7acc1bb99662d8df16069208d.jpg
- 2.png - 湲곗〈 寃쎈줈: ./files/attach/images/60/006/244/227dd79a05ea50ede91e3ecadd342d43.png
- 3-1.png - 湲곗〈 寃쎈줈: ./files/attach/images/60/006/244/95c66eb2262f3226cbd87b08ee531b68.png
- 3-2.png - 湲곗〈 寃쎈줈: ./files/attach/images/60/006/244/0c2402726921a8d054b1004e0ffa4781.png
- 3-3.png - 湲곗〈 寃쎈줈: ./files/attach/images/60/006/244/6bc8ad71f042296a04a792f9e72df1c5.png
- icon.png - 湲곗〈 寃쎈줈: ./files/attach/images/60/006/244/121da8f51e9979f15e6fb0aa4e50e6d0.png
- 4.png - 湲곗〈 寃쎈줈: ./files/attach/images/60/006/244/f39424dd8a5835d38a1b25f3ffd3a631.png
- 5.JPG - 湲곗〈 寃쎈줈: ./files/attach/images/60/006/244/9e1103479ed4c345de0edb2da1a95a54.JPG
- 6.JPG - 湲곗〈 寃쎈줈: ./files/attach/images/60/006/244/5c94252f1b61e69112f8c432730fd42f.JPG
기존 StatEdu 렉쳐 글을 통계컬럼으로 이전했습니다. 원문: http://www.statedu.com/lecture/244006

댓글
로그인 후 댓글을 남길 수 있습니다.