실습과제 8

Exercise 1: 젤리빈과 여드름의 비밀

아래 만화를 보고 통계 분석의 기본 개념과 한계를 생각해보자.

어떤 사람이 “젤리빈이 여드름을 유발한다”고 주장했다. 과학자들은 이 주장을 검증하기 위해 실험을 수행했고, “젤리빈과 여드름 사이에는 유의미한 관계가 없다 (p > 0.05)”는 결과를 얻었다. 그러자 또 다른 사람이 “그중 특정 색깔의 젤리빈이 문제일 수도 있다”고 주장했다. 과학자들은 20가지 색깔의 젤리빈 각각에 대해 별도의 검정을 수행했다. 그 결과, 단 하나의 색깔(초록색) 젤리빈만이 p < 0.05로 나타났다. 다음 날 신문에는 “초록색 젤리빈이 여드름을 유발한다!”는 기사가 실렸다.

A. 모집단(population), 표본(sample), 표집(sampling) 개념을 이용해, 이 실험의 구조를 설명해보자.

B. 영가설(null hypothesis)과 대립가설(alternative hypothesis)을 각각 어떻게 설정할 수 있을까?

C. 과학자들이 사용한 유의수준(\(\alpha\) = 0.05)은 무엇을 의미하는가?

D. 왜 20가지 색깔을 각각 따로 검정했을 때 하나쯤은 우연히 유의하게 나올 가능성이 높아지는가?

E. 마지막 신문 기사의 “95% 신뢰 수준에서 초록색 젤리빈은 여드름과 관련 있다”는 주장은 왜 올바른 해석인가 잘못된 해석인가? 왜 그러한가?