교차상관분석 관련 문의드립니다.
안녕하세요 교수님
교수님께 많은 도움 받고 있습니다. 먼저 진심으로 감사드립니다.
제가 현재 월별 시계열 데이터로 교차상관분석을 해야하는데 진행중에 의문이 있어서 문의드립니다.
미세먼지 농도(PM2.5, PM10)와 게시글수(0인 구간이 있어서 Log(x+1)로 계산)의 월별데이터를 바탕으로 교차상관분석을 하려고 합니다. 분석상황은 다음과 같습니다.
ADF단위근 검정을 실시한 후 데이터 정상성 확인, 또한 자기상관을 파악하고자 ACF/PACF 확인했습니다. 또 Box–Ljung 테스트(Ljung–Box test)를 살펴보았습니다. 그 결과 정상성이 없고 자기상관이 있는 것으로 나와 차분1을 실시하였습니다. 그 후 차분한 변인들을 대상으로 교차상관분석을 실시하였습니다. 교차상관분석을 실시한 결과 lag=0이 모두 가장 큰 것으로 나타났고, p<0.05로 모두 유의하였습니다. (연구에서는 가장 높은 교차상관계수(lag=0) 위주로 보고하고, 그 외의 값은 보충자료에 보고하려고 합니다. )
그러나, 1 차분한 변인으로 정상성을 검정하니 정상성은 모두 있는것으로 나왔으나,
자기상관검증을 다시 해보니 box-ljung은 대부분 여전히 시차1일때를 제외하고 대부분 0.05보다 낮은것으로 나타났습니다. (시차1-16까지 spss에서 자동으로 검증), (일부 변수는 Box 통계량의 유의확률이 1-16시차 모두 <.001로 나왔습니다)
이러한 상황에서 다른 연구들은 ARIMA나 SARIMA모형을 통해 prewhitening 처리 뒤 교차상관분석을 수행한 것으로 보이는데,
두 변인간의 교차상관분석을 확인하기 위한 연구 목적으로 1차 차분의 결과로도 충분히 보고가 가능하다고 보시는지 여쭈어봅니다.
아니면 box 검정이 유의한것으로 나와서 ARIMA모델이나 SARIMA 모형을 꼭 해야하는지 문의드립니다.
감사드립니다.
댓글
이일현 (2025-03-24 10:24:30)
교차상관분석은 시차를 전제하는 분석입니다.
일단 차분 없이 law-data 로 해보세요.
자기상관이 있는 경우 1차 차분 뿐만 아니라 2,3 차 일 수도 있습니다.
대부분 1차 차분한 결과가 가장 적합한 경우가 많지만 절대적이지는 않습니다.
gree (2025-03-25 13:32:09)
감사드립니다 교수님! 차분 없이 시도해보았는데, 자기상관이 있어서 차분하고 다시 교차상관분석을 시행하였습니다. 그런데 정상성은 확보되었는데, 자기상관분석에서 Ljung-box를 살펴보니 변인 내에 시차1은 0.05보다 컸지만 이후 여러 시차(2-6시차 등)에서 0.05보다 작게 나타났습니다. 이런 경우에 이 결과를 논문에 보고해도 문제가 없는것일까요? 아니면 box 유의확률이 모든 시차에서 유의하지 않게 나올때까지 차분을 해야할지요?
Legacy document_srl: 306215 / Legacy URL: http://www.statedu.com/QnA/306215

댓글