실습과제 4

실라버스에서 안내된 바와 같이 R, (Windows 사용자의 경우) Rtools, Rstudio, Quarto 및 필수 패키지들을 R에서 설치한 이후 다음의 내용들에 답하시오. 제출은 RMarkdown (.Rmd) 혹은 Quarto (.qmd) 확장자를 사용하되, html, pdf, docx 중 제한은 없다.

이루리의 예제 데이터 폴더에서 vdem 데이터를 다운받아 read_csv() 함수를 이용해 R로 불러와 vdem 이라는 객체로 저장하고 {tidyverse} 패키지를 로드하라.

Exercise 1

A. 명목형/분류형(categorical), 순서형(ordinal), 그리고 연속형(continuous) 변인에 각각 가장 적합한 중심경향성 척도가 무엇인지 답하라.

Exercise 2

명목형/분류형 변인

A. vdem 데이터에서 국가명(country_name), 국가 ID(countryid), 그리고 연도(year)를 제외한 변인 중 이항변인의 예제를 하나 이상 찾아 답하라.

B. vdem 데이터에서 국가명(country_name), 국가 ID(countryid), 그리고 연도(year)를 제외한 변인 중 하나 이상의 분류목(category)을 갖는 명목형/분류형 변인의 예제를 하나 이상 찾아 답하라.

C. AB에서 찾은 변인들에 대해 막대그래프를 그리고 그 결과를 PDF 파일로 저장하라. HINT {ggplot2} 패키지를 이용하여 그래프를 그린 후 ggsave() 함수를 활용할 것.

Exercise 3

순서형 변인

A. vdem 데이터에서 국가명(country_name), 국가 ID(countryid), 그리고 연도(year)를 제외한 변인 중 순위형 변인의 예제를 하나 이상 찾아 답하라.

B. A에서 찾은 변인에 대해 막대그래프를 그리고 그 결과를 PDF 파일로 저장하라. HINT {ggplot2} 패키지를 이용하여 그래프를 그린 후 ggsave() 함수를 활용할 것.

Exercise 4

연속형 변인

A. vdem 데이터에서 국가명(country_name), 국가 ID(countryid), 그리고 연도(year)를 제외한 변인 중 연속형 변인의 예제를 하나 이상 찾아 답하라.

B. A에서 찾은 연속형 변인에 대해 히스토그램을 그리고 그 결과를 PDF 파일로 저장하라. 그리고 그 변인의 중심경향성을 나타낼 수 있는 통계치를 최소 하나 이상 보고하라. HINT {ggplot2} 패키지를 이용하여 그래프를 그린 후 ggsave() 함수를 활용할 것.

Exercise 5

로그 변환값

A. vdem 데이터에서 e_gdppc의 분포와 그 값의 로그를 취한 새로운 변수 ln_gdppc의 변수를 비교하는 그래프를 각각 그리고 나란히 붙여 PDF로 저장하라. HINT. {ggplot2}를 이용해 그래프를 그린 뒤, {patchwork} 패키지를 설치하여 각각의 ggplot 객체를 나란히 배치하라.

B. 왜 로그값을 취한 값을 사용하는 것이 더 효율적일 수 있는지에 대해 설명하라.

Exercise 6

산점도

A. 산점도를 이용하여 vdem 데이터에서 v2x_polyarchy와 로그값을 취한 e_gdppc, 즉 ln_gdppc 간의 관계를 나타내라.

B. 두 변인 간의 관계를 서술하라.

Exercise 7

히스토그램

A. e_regionpol_6C의 각 카테고리별 v2x_polyarchy의 히스토그램을 만들어라.

B. 관찰된 각 e_regionpol_6C의 카테고리별 경향성이 어떠한가를 서술하라.

Exercise 8

박스플롯

A. vdem 데이터의 e_civil_war 각 카테고리별 v2x_polyarchy 의 분포를 박스플롯으로 나타내라.

B. A에서 그린 박스플롯을 해석하라.

Exercise 9

막대그래프

A. v2elembaut_ord의 빈도(frequency) 분포를 보여주는 막대 그래프를 그리되, 각 막대의 색을 다르게 칠하라. HINT. {ggplot2}를 이용해 그릴 때, aes()에서 fill = 옵션을 사용할 것.

B. 관찰된 경향성이 어떠한가를 서술하라.

Exercise 10

선 그래프

A. 멕시코의 시계열(연도에 따른) 1인당 GDP(e_gdppc)의 경향성을 나타내는 선 그래프를 그려라.

B. 관찰된 경향성이 어떠한가를 서술하라.