Q&A

복합표본분석 관련 문의드립니다.

분류: 복합표본분석 글쓴이: 노력하는연구자 날짜: 2026-03-19 15:07

안녕하세요?

소장님의 여러 강의와 Q&A 게시판을 통해 많이 배우고, 또 마음 깊이 감사해하고 있는 연구자입니다.

다름이 아니라 복합표본분석과 관련하여 몇 가지 여쭤보고자 글을 남기게 되었습니다.

질문이 좀 많지만.. 살펴봐주시면 감사하겠습니다.

1. 저는 '다단계층화집락추출법'을 사용한 패널 데이터로 LCGM, 다항 로지스틱, 다집단 LGM 분석을 하고자 합니다. (LCGM과 다집단 LGM은 R로, 다항 로지스틱은 SPSS로 진행하고자 합니다.) 이때, 이 3가지 분석 모두에 복합표본설계를 반영해야 하는지요? 선행연구를 찾아보았을 때, 다항 로지스틱 분석 시에는 complex sampling design을 반영했다고 보고한 논문들이 꽤 많지만 LCGM과 다집단 LGM에서 complex sampling design을 반영하였다고 표기한 최신 논문은 거의 찾지 못하였습니다. 그럼에도 LCGM, 다집단 LGM, 다항 로지스틱 3가지 분석 모두에서 복합표본설계를 반영해야 하는지 여쭙고 싶습니다.

2. 생성형 AI에서는 R에서 LCGM 분석 시 사용하는 lcmm에서 hlme()가 복합표본설계를 반영하는 기능이 없기 때문에 LCGM 단계에서는 복합표본설계를 반영할 수 없다고 합니다. 다만, 다항 로지스틱 분석이나 다집단 LGM에서는 가능한 범위 안에서 복합표본설계를 반영하라고 합니다. LCGM에서는 복합표본설계를 반영하지 않아도 괜찮을까요?

3. 가중치를 선택할 때 '종단면 원 가중치'와 '종단면 표준화 가중치'가 있습니다. 선행연구에서는 LCGM, 다항 로지스틱, 다집단 LGM에서 어떤 가중치를 적용하였는지 구체적으로 언급된 부분을 찾지 못하였습니다. 저는 분석의 원활함을 위해 '종단면 표준화 가중치'를 선택하려고 하였었는데, 각 분석에 따라 적합한 가중치가 다른 것일까요? 

4. 복합표본분석을 실시하고자 할 때, 실제 표본설계 단계에서 적용된 기준을 그대로 반영한 '층화변수'와 '집락변수'가 제가 사용하는 데이터에 포함되어있지 않습니다. 이런 경우에 두 변수를 제외하고 가중치만 이용하여 복합표본분석을 실시하는 것이 맞을까요?

5. 선행연구에서는 층화변수에 근접한 개념의 변수를 연구자가 층화변수로 설정하여 분석에 사용한 연구가 있었습니다. 연구자가 임의로 층화변수를 설정하여 분석해도 되는지 여쭙고 싶습니다.

6. 집락변수도 마찬가지입니다. 정확한 집락변수가 데이터에 제공되어 있지 않은데, 연구자가 임의로 집락변수를 지정하여 분석해도 되는지 함께 여쭙고 싶습니다. (제 데이터의 경우 조사대상은 class 전체이며, class보다 큰 단위의 변수만 있습니다.) 만약 가능하다면, 변수가 시간이 지남에 따라 변화하는데 sampling의 기준이 되었던 1차년도의 변수를 활용하면 되는지도 여쭤보고 싶습니다.

괜찮으시다면 답변 부탁드려도 될까요?

바쁘심에도 연구자들에게 귀한 도움 주셔서 진심으로 감사드립니다.

댓글


이일현 (2026-03-20 10:01:06)

1. 복합표본분석에서는 아직 지원되지 않습니다. 

2. 복합표본분석에서는 회귀분석과 (이항, 다항) 로지스틱 회귀분석까지 지원됩니다. 

3. 아직은 선택의 몫입니다. 

분석 방법에서 어떤 가중치를 적용했다고 기술하면 됩니다. 

4. 가중치만 적용한 복합표본설계로 가능합니다. 

5.6. 추천하지 않습니다. 집락변수와 층화변수는 집락층화추출로 추출할 때 생성되어야 하는 변수입니다. 이를 연구자가 임의로 만들 경우 편향(편의, bias)가 발생할 가능성이 높습니다. 


노력하는연구자 (2026-03-20 14:16:53)

소장님, 답변 정말 감사드립니다. 많은 도움이 되었습니다.

죄송하지만 한 가지 추가로 여쭤봐도 될까요?

1~2번 질문에 대해 주신 답이 혹시 R에서만 그렇다는 말씀이실까요?

생성형 AI가 Mplus는 mixture model에서도 복합표본설계를 반영할 수 있다고 하면서 LCGM도 복합표본분석이 가능하고, 다집단 LGM도 SEM 기반이라 가능하다고 답을 주어서 Mplus로는 가능한 것이 맞는지 여쭙고 싶습니다...

가능하시다면 한 번 살펴봐주시면 감사하겠습니다. 감사합니다, 소장님!


이일현 (2026-03-20 14:30:56)

spss, R 에서는 거의 안된다고 봐야 합니다. 

제대로 하려면 Mplus, SAS 에서 분석해야 합니다. 


노력하는연구자 (2026-03-20 16:03:32)

그렇군요, 소장님.. 답변 감사드립니다!!


Legacy document_srl: 309546 / Legacy URL: http://www.statedu.com/QnA/309546

댓글

댓글은 로그인한 회원만 작성할 수 있습니다.