실습과제 6

실라버스에서 안내된 바와 같이 R, (Windows 사용자의 경우) Rtools, Rstudio, Quarto 및 필수 패키지들을 R에서 설치한 이후 다음의 내용들에 답하시오. 제출은 RMarkdown (.Rmd) 혹은 Quarto (.qmd) 확장자를 사용하되, html, pdf, docx 중 제한은 없다.

Exercise 1: 표본추출(Sampling)

4000개의 빨간 공과 6000개의 흰 공이 들어 있는 상자가 있다. 이 중 50개의 공을 비복원추출(without replacement) 방식으로 무작위로 뽑는 실험을 수행한다고 하자. 이 과정을 50회 반복하며, 각 표본에서 빨간 공이 몇 개 나왔는지와 빨간 공이 나올 확률을 계산하라.

A. 재현성을 위해 랜덤 시드를 123으로 설정하라. HINT: set.seed()

B. 빨간 공과 흰 공의 개수, 전체 시도 횟수, 각 표본 크기를 정의하라.

C. 각 실험 번호, 추출된 빨간 공의 수, 그리고 해당 확률을 저장할 벡터를 초기화하라.

D. 50회의 표본추출 실험을 수행하고 결과를 기록하라.

E. sample, red_balls, probability의 세 열을 가진 데이터 프레임을 생성하여 결과를 저장하라.

F. 생성된 데이터 프레임을 head()를 통해 제시하라.

G. 확률의 분포를 히스토그램으로 시각화하라. HINT: aes(x = probability)를 x축으로 사용

Exercise 2: 표본 크기 250일 때

같은 실험을 반복하되, 이번에는 표본 크기 250개, 실험 횟수 10회로 수행하라. 결과의 확률 분포를 히스토그램으로 시각화하라.

Exercise 3: 표본 크기 25일 때

같은 실험을 반복하되, 이번에는 표본 크기 25개, 실험 횟수 100회로 수행하라.
결과의 확률 분포를 히스토그램으로 시각화하라.

Exercise 4: 시각적 비교

세 실험의 결과를 시각적으로 비교하라. 어떤 표본추출 결과가 모집단의 빨간 공 비율(0.4)에 가장 근접하는가?