Q&A

이런 것의 확률은 어떻게 구해야 하는 건지요?

분류: Q&A 글쓴이: 토니 날짜: 2002-08-20 00:53

아래 글은 SPSS Q&A에 제가 올린 것인데요, 확률을 전공한 분이 아실 수 있을 것 같다하여 이 게시판에서 다시 여쭤봅니다. 아시는 분 있으면 도움 부탁드려요. 전혀 방향을 못잡겠네요. ㅠ.ㅠ

- - - -

제가 현재 갖고 있는 데이타는 엑셀로 되어있고 관찰치는 음과 양의 실수로 되어있죠. 음수 또는 0은 '불만족', 양수는 '만족'이라고 하면 각각을 S와 U라고 표시하면 run test로 테스트 해볼 수 있겠더라구요.

이 엑셀 화일을 갖고 만족과 불만족 결과가 random한 분포를 갖는 지는 말씀하신데로 run test 기능을 써보면 될 것 같은데요.....

Sk = S가 연속 k번 나오는 run
Sk + Sm = k번 연속 S가 나온 후 m번 연속 S가 이어지는 run
ak = (Sk+S1)의 총 갯수
bk = (Sk+U1)의 총 갯수

라고 가정할 때,

제가 정말 궁극적으로 구하려고 하는 것은

Sk의 run이 발생했을 때 바로 다음에 S가 나올 확률과 U가 나올 확률입니다.

전 그저 언뜻 생각하기를

Sk run 이후에 S가 발생할 확률을 P(Sk+S1)이라고 한다면

P(Sk+S1) = P(ak) = ak / (ak + bk)

일 것이라고 생각했는데,

다른 한편으로 생각해 보니까, 사건의 발생이 끝나서 그 사건들에 대한 기록을 선택하는 것이 아니라, S와 U사건은 계속 발생하는 것이기 때문에, 이 사건이 random하게 나오는 확률적인 분포를 갖는다고 밝혀진다면(run test에 의해) 오히려 현재까지는 높은 빈도로 나타났을 경우 앞으로는 그 빈도가 낮아져 확률이 P(Sk+S1)은 P(ak)가 아니라 1-P(ak) = 1 - ak/(ak+bk) = bk / (ak + bk)가 되는 것이 아닌가 하는 생각도 들구요,

또, Sk이후에 S가 나올 확률과 U가 나오는 확률은 run 검정에서 결과와 달리 패턴의 발생이 이후에 발생할 사건에 영향을 미친다면 제가 전혀 예상치 못한 다른 수식으로 구해야 하는 건 아닌가 하는 생각도 들고... 예를 들어, 조건부 확률 이라던가...

쩝...

제 확률통계 지식으로는 도저히 상상도 안되고 추론은 더더욱 어렵네요. 어떤 걸로 시작해야 정답이 될런지...

과연 어떻게 구해야 할까요?

일단, 구하는 수식을 알 수 있고 그것을 SPSS로 프로그래밍 할 수 있다면, 엑셀 데이타를 SPSS에 넣는 작업만으로 바로 리포트까지 나오도록 할 수 있을테고, 정말 금상첨화 일텐데...


Legacy document_srl: 78458 / Legacy URL: http://www.statedu.com/QnA/78458

댓글

댓글은 로그인한 회원만 작성할 수 있습니다.