Q&A

데이터 클리닝 추가 질문 드립니다.

분류: Q&A 글쓴이: 참살이 날짜: 2025-06-11 15:46

교수님, 안녕하세요

지난 번 요청 드렸던 데이터 클리닝 관련 추가 질문 드립니다.

제가 분석 전에 데이터 클리닝 관련 영상을 공부한 후 첫째로 코딩 후 엑셀 표에서 표준 편차로 0.5이하의 설문을 제거 하였고

그다음 이상치 제거를 위해 연속형 변수인 나이, 경력, 측정하고자 하는 리커트 변수 문항별로 데이터 탐색을 통해서 제거 하려고 하니 상당히 많은 설문을 제거하게 되었습니다. 

이렇게 제거하고 통계분석을 시작해도 되는지 궁금합니다.                          

댓글


이일현 (2025-06-11 16:35:48)

일단 표준편차 0.5 이하라는 기준은 명확한 기준은 없습니다. 

차후 왜 그 기준을 사용했는가에 대한 문제는 계속 제기될 가능성은 염두해 두어야 합니다. 

그리고 나이, 경력 등과 같은 변수는 극단적 이상값이 아니라면 굳이 제거할 필요는 없습니다. 

data handling & cleaning 과정에서 너무 많은 data 를 삭제하는 것은 자료의 왜곡이 발생할 수 있으므로 명확한 기준에 의해서 조심스럽게 작업해야 합니다. 


참살이 (2025-06-11 17:06:38)

감사합니다 교수님 주신 코멘트를 참고해서 분석에 도입하도록 하겠습니다.


Legacy document_srl: 307219 / Legacy URL: http://www.statedu.com/QnA/307219

댓글

댓글은 로그인한 회원만 작성할 수 있습니다.