Q&A

안녕하세요 R기초통계량과 t검정에 대해 궁금한점이있습니다

분류: 기초통계 글쓴이: 통계처음합니다 날짜: 2025-11-27 21:04

안녕하세요 교수님 . 통계강의를 처음 접해보는 대학교 새내기입니다
교양으로 R로하는 통계학기초 강의를 듣는데 계속 공부를 하고있다가 문득 궁금한점이 생겨서요

1.
기초통계량이 데이터를 요약한걸로 알고있습니다
만약 상관,회귀분석전 로그변환할때 0이하인 데이터는 지우고
기초통계량을 뽑아야 맞는건지 아님 지우기전 기초통계량을 뽑아야 제대로된건지 궁금합니다

2.
만약 종속변수 독립변수 통제변수를 설정하고
t검정을 하려고하면 모집단을 둘로 나누어야 하는걸로 아는데

예를들어 소득이 부채증가에 미치는 요인에대해 분석한다고하면
종속 : 부채
독립 : 소득
통제 : 주택보유여부
이런식으로 설정했다고 했을때 T검정을 주택보유여부로 두 모집단으로 나누면 되는걸로 보이는데 (아닌가요 ㅠㅠ)

근데 궁금한게 또 다른 예로 나이가 자산에 미치는 영향을 분석한다 할때
종속 : 자산
독립 : 나이
통제 : 소득
주택보유처럼 0과1로 나눌수가없는 변수들인데
이런식으로 설정했다하면 T검정을 할때 어떻게 나누는지 궁금합니다

혹시 나이를 주제에맞게 몇세 이상과 그외 해서 0과 1로 나누고 그러는건지 아님 이런것은 T검정을 못하는 주제인가 궁금합니다

완전 왕초보라 개념이 아직 안잡혀있어서 횡설수설한 제 질문을 이해하실진 모르겠습니다만 감사합니다 ㅠ

댓글


이일현 (2025-12-02 11:00:53)

1. 선형성과 정규성을 만족한다면 로그변환이 필요없습니다. 

로그변환을 하는 가장 대표적인 이유가 위 2가지입니다. 

이때 0 이하의 값은 로그변환을 할 수 없습니다. 

그런 경우에는 최소값에서 -1 를 더한 다음 로그변환을 합니다. 

예를 들어 변수(x) 최소값이 -3.5(-3.5-1 = -4.5) 라면 ln(x+4.5) 합니다. 

2. 주택 보유 여부에 따른 부채의 차이를 분석하는 것이 t-test 입니다. 

모집단을 나눈다는 것이 아니라 주택을 보유한 집단, 주택을 보유하지 않은 집단 이렇게 2개의 모집단이 있다는 의미입니다. 

독립변수가 연속형 변수인 경우에는 회귀분석을 분석을 합니다. 

또는 독립+통제변수의 수가 2개 이상인 경우에도 회귀분석을 할 수 있습니다. 


Legacy document_srl: 308933 / Legacy URL: http://www.statedu.com/QnA/308933

댓글

댓글은 로그인한 회원만 작성할 수 있습니다.