Q&A

로지스틱 회귀분석 표본수 산출

분류: 로지스틱회귀분석 글쓴이: 아리아리 날짜: 2025-10-03 06:45

안녕하세요~ 
석사논문을 준비하고 있는 대학원생입니다. 설문조사를 완료한 상태에서 설문도구의 오점을 발견하고 좌절모드에서 헤어나오질 못하고 있습니다. ㅠ.ㅠ 해결을 위해 몇날몇일 관련논문이나 인터넷을 열심히 찾아보면서 박사님 블로그를 접하게 되었습니다. 


저는 다중회귀분석을 할 계획으로 설문조사를 실시하였는데. 설문조사 완료 후 코딩을 하고, SPSS를 돌려보는데 아무래도 종속변수값이 이상해서 살펴보니,,, 제 논문주제가 '중학생의 전자담배 수용성에 미치는 영향요인'으로
종속변수를 결정할때, 미래에 흡연을 할것이나 말것이냐 이분형 척도는 로지스틱 회귀분석을 해야 해서 표본수가 많이 필요하니, 종속변수를 연속형 범주로 측정하는 도구를 찾아서 전자담배 수용성이라는 개념으로 측정하려고 했습니다.
원도구는 종속변수인 전자담배 수용성을 3개의 문항으로 측정하고 각 문항에 4개의 보기가 있고, 3개의 문항 모두에서 1번을 선택한 학생들은 수용성이 낮은 집단 '0' 그 외에 다른 번호에 답변한 사람들은 수용성이 높은집단 '1'로 이분형척도로 구분하는 것인데, 제가 도구를 찾았을 당시 그 부분을 미쳐 파악하지 못하고 3개의 문항의 답변 점수의 총점으로 수용성을 판단하는 것으로 이해를 하고 연구를 진행했고, IRB승인 후 설문조사까지 마친상태입니다. 연속형 변수 인줄 알았던 종속변수가 하루아침에 이분형 변수가 되어 버렸습니다. 일반적 특성 7개와 독립변수 6개를 설정하였는데, 로지스틱 회귀분석 표본수 산출에 대한 국내, 국외논문을 찾아봐도 마땅히 참고할 만한 자료가 없어서요. 현재 제가 알고 있는 표본크기 산출은 변수 * EPV(10이상)을 곱해 기대사건 비율을 곱하는 방법으로 알고 있습니다. 현재 182건에서 수용성이 있다로 나온 n=38으로 제가 알고 있는 식에 적용해 보면 (13*10)/0.21로 약 620이 나옵니다ㅠ.ㅠ
중학생이랑 보호자 동의 받는 부분이 쉽지 않아서 현재로서는 추가로 400부 이상을 할 수 없을 듯 한데 이대로 연구를 엎어야 하는지. 독립변수 갯수를 줄여서 접근해보려 했지만 5개 이내로 변수를 줄이면 제 연구의 목적이 흐트러지는 것 같아 어찌해야 할지 정말 모르겠습니다.
올해 꼭 졸업논문 마무리하고 싶은데 저에게 빛과같은 해결의 실마리를 제공해주신다면 정말 감사하겠습니다.ㅠ.ㅠ


댓글


이일현 (2025-10-14 11:40:41)

로지스틱 회귀분석은 다른 분석에 비해 표본 수가 많이 필요합니다. 

최소 표본 수를 계산한다면 통제변수는 유의하지 않은 변수는 통제하지 않을 수 있으므로 독립변수 6개만 변수로 사용을 할 수 있습니다. 

통제변수인 일반적 특성 7개 중에서 최소 0개, 최대 7개 사이에서 표본 수를 결정할 수 있죠.


Legacy document_srl: 308337 / Legacy URL: http://www.statedu.com/QnA/308337

댓글

댓글은 로그인한 회원만 작성할 수 있습니다.