회귀분석 B 와 beta
B : 비표준화 회귀계수
beta : 표준화 회귀계수
입니다.
회귀분석에서 가장 핵심적인 위치을 차지하고 있는 것이 바로 이 회귀계수입니다. 회귀분석은 중,고등학교 시설 1차 선형 함수인
y = ax + b
라는 식을 배웠을 것입니다. 이때 a 는 기울기이고, b 는 절편인데, 이 2개의 값을 회귀계수라고 하며, 특히 a 에 해당하는 기울기가 회귀분석에서는 핵심이며, 통계학에서는 B 로 표시를 합니다.
이 B 값은 부호의 의미가 중요하며,
+ ==> 독립변수 x 가 커지면, 종속변수 y 가 커진다
- ==> 독립변수 x 가 커지면, 종속변수 y 가 작아진다
라는 것을 의미합니다.
그런데, 이 회귀계수 B 값은 data의 단위와 밀접한 관계가 있습니다. 만약 x 의 단위가 굉장히 크다라고 한다면 B 값은 상대적으로 아주 작아지게 됩니다. 그러므로 B 값의 크기는 사실 중요하지 않습니다.
만약 2개의 변수가 있는데, 한 변수(x1)의 회귀계수는 3.38 이고, 다른 변수(x2)의 회귀계수는 2.36 인 경우를 살펴보면 x1 의 회귀계수가 더 크기 때문에 x2 보다 더 높은 영향을 줄것이다라고 생각을 하게 됩니다. 하지만 그렇지가 않습니다.
만약 x2 라는 변수 값을 10으로 나누어서 다시 회귀분석을 하게 되면 x2 의 회귀계수는 23.6 이 나옵니다. 즉, B 값은 data의 단위와 관계가 있다는 말이 되는 것이죠.
그래서, 나온 개념이 beta 입니다. 이 값은 회귀계수인 B 값의 단위를 통일시킨 것입니다. 즉, 단위를 통일시킨 표준화된 값이기 때문에 서로 비교를 할 수 있다는 장점이 생깁니다. 그래서, beta 값이 더 크면 영향력이 더 크다라고 생각해도 무방합니다.
기존 StatEdu 렉쳐 글을 통계컬럼으로 이전했습니다. 원문: http://www.statedu.com/lecture/262367

댓글
로그인 후 댓글을 남길 수 있습니다.