5. 확률과 통계적 추론 II: 정규분포와 신뢰구간

class: center, middle, inverse, title-slide

.title[
# 5. 확률과 통계적 추론 II: 정규분포와 신뢰구간
]
.subtitle[
## 정치와 데이터분석
]
.author[
### 박상훈 (<a href="mailto:sh.park.poli@gmail.com" class="email">sh.park.poli@gmail.com</a>)
]
.date[
### 강원대학교
]

---

# 오늘의 목표
## 10:10-11:00

지난 주차의 분포, 확률에 대한 개념 복습하기

## 11:10-12:05

모집단, 표본, 추론, 그리고 신뢰구간에 대해 이해하기 I.

## 12:15-12:45

모집단, 표본, 추론, 그리고 신뢰구간에 대해 이해하기 II.

실습과제 해설 및 질의응답

---
class: middle, center

# Part I. 잃어버린 확률과 분포를 찾아서

---
# Recap the Last Class!
## 확률분포의 유형

확률분포: 확률변수의 모든 가능한 값과 그 확률들의 분포

+ 주사위 눈금: 1~6 각 1/6 확률 → 균등한 분포 (이산형)

이산형 분포: 특정 값들이 떨어져 있음. 확률질량함수 (PMF)로 정의

+ 동전 앞면 개수 (`$0,1,2,\dots,n$`), 사건 발생 횟수 (`$0,1,2,\dots$`) 등

연속형 분포: 값이 연속적인 범위. 확률밀도함수 (PDF)로 정의

+ 키, 몸무게, 시험 점수 등의 분포 (연속값)

---
# Recap the Last Class!
## 기대값과 분산

기대값 `$\mathbb{E}[X]$`: 확률변수 `$X$`의 평균적인 값 (확률 가중 평균)

+ 이산형: `$\mathbb{E}[X] = \sum x \cdot \Pr(X=x)$`

+ 연속형: `$\mathbb{E}[X] = \int_{-\infty}^{\infty} x f(x) dx$`

+ 분포의 중심 경향을 나타냄(장기적 평균).

분산 `$\mathrm{Var}(X)$`: 분포의 산포(변동성) 측도 = `$\mathbb{E}[(X - \mathbb{E}[X])^2]$`

+ 표준편차 `$\sigma = \sqrt{\mathrm{Var}(X)}$`는 분산의 양의 제곱근 (단위 일치)

+ 분산/표준편차가 클수록 분포가 퍼져 있음(데이터 변동성 높음).

---
# Recap the Last Class!
## 이항(Binomial) 분포

이항분포: `$n$`번의 독립 시도에서 특정 사건의 성공 횟수 분포

+ 각 시도 성공확률 `$p$` (변하지 않음), 실패확률 `$1-p$`

+ 확률질량함수: `$\Pr(X=k) = \binom{n}{k} p^k (1-p)^{,n-k},\quad k=0,1,\dots,n$`

+ 기댓값 `$\mathbb{E}[X]=np$`, 분산 `$\mathrm{Var}(X)=np(1-p)$`

+ 10개 선거구 중 후보 A가 선거구당 당선 확률 0.6일 때, 당선된 선거구 수 `$X\sim \text{Binomial}(n=10, p=0.6)$`

+ `$\Pr(X=6) = \binom{10}{6} (0.6)^6 (0.4)^4 \approx 0.2508$` (가장 확률 높은 경우는 `$k=6$`)

---
# Recap the Last Class!
## 포아송(Poisson) 분포

포아송분포: 일정 시간/공간 내에 발생하는 드문 사건의 횟수 모델

+ 모수 `$\lambda$` = 단위 시간당 평균 발생횟수 (기댓값)

+ 확률질량함수: `$\Pr(X=k) = \frac{\lambda^k e^{-\lambda}}{k!},\quad k=0,1,2,\dots$`

+ 기댓값 `$\mathbb{E}[X]=\lambda$`, 분산 `$\mathrm{Var}(X)=\lambda$` (평균=분산)

+ 한 시간에 콜센터로 걸려오는 전화 건수 `$X\sim \text{Poisson}(\lambda=20)$` (평균 20건)

+ `$\Pr(X=25) = \frac{20^{25} e^{-20}}{25!} \approx 0.044$` (25건 발생할 확률)

+ 포아송분포는 `$n$` 크고 `$p$` 매우 작을 때 `$\text{Binomial}(n,p)$`의 극한으로 수렴(평균 `$\lambda=np$`)

---
# Recap the Last Class!
## 정규(Normal) 분포

정규분포(Gaussian 분포): 연속분포의 한 종류, 종(bell) 모양 대칭 곡선

+ 모수: 평균 `$\mu$` (중심)와 분산 `$\sigma^2$` (퍼짐 정도)

+ 밀도함수: `$f(x) = \frac{1}{\sigma\sqrt{2\pi}} \exp!\Big(-\frac{(x-\mu)^2}{2\sigma^2}\Big)$`

+ 평균을 중심으로 좌우 대칭, `$\sigma$`가 클수록 곡선이 낮고 넓게 퍼짐.

+ **중심극한정리: 표본크기 `$n$`이 충분히 크면, 표본평균 분포가 정규분포에 근사**

+ 여러 확률모형에서 정규분포는 실질적인 한계분포로 중요

+ 표본평균, 오차항 분포 등 다양한 통계량이 근사적으로 정규분포 따름.

---
# Recap the Last Class!
## 정규분포의 특징

표준정규화: 정규분포 `$X\sim N(\mu,\sigma^2)$`에서 `$Z = \frac{X-\mu}{\sigma} \sim N(0,1)$` (평균0, 분산1)

+ 정규분포 확률 계산은 표준정규분포 `$N(0,1)$` 표로부터 얻음

+ 분포의 68–95–99% 법칙: 정규분포에서 평균 기준

+ 약 **68%**의 값이 `$\mu \pm 1\sigma$` 범위 내

+ 약 **95%**의 값이 `$\mu \pm 2\sigma$` (정확히 `$\mu \pm 1.96\sigma$`) 범위 내

+ 약 **99.7%**의 값이 `$\mu \pm 3\sigma$` 범위 내

정규분포는 극단치(outlier) 확률이 낮음(꼬리 쪽 급격히 감소).

---
# Recap the Last Class!
## 정규분포의 특징

95% 범위와 `$\pm 1.96 \sigma$`

+ 정규분포에서 평균 주변 약 95% 확률질량이 `$\mu \pm 1.96\sigma$` 구간에 포함됨.

+ 즉, `$P(\mu-1.96\sigma \le X \le \mu+1.96\sigma) \approx 0.95$`

+ 1.96은 표준정규분포에서 누적확률 0.975에 해당하는 값 (상위 2.5% 지점)

+ 이를 활용해 표본평균의 신뢰구간을 구축할 수 있음.

---
# Recap the Last Class!
## 정규분포의 특징

![](06-slides_files/figure-html/unnamed-chunk-7-1.png)

표준정규분포 `$N(0,1)$`에서 파란 부분은 전체 확률의 약 95%를 차지

빨간 점선은 `$Z=\pm1.96$` 위치 (경계), 양쪽 꼬리 각 2.5% 확률 영역

---
# Recap the Last Class!
## 모집단과 표본

과학적 연구의 목표는 **모집단(population)** 전체에 대한 결론을 내리는 것

하지만 현실적으로 **모집단 전체를 조사하는 것은 불가능**

따라서 우리는 **표본(sample)** 을 사용

+ 표본은 모집단을 축소한, '관측한 모집단의 하위집단'이지만,  모집단의 특성을 제대로 반영해야 함.

+ 이를 **대표성 있는** 표본(representative sample)이라고 함.

---
# Recap the Last Class!
## 모집단과 표본

💡 **대표성(representativeness)** 이란?

> 표본의 특성이 모집단의 특성과 유사한 정도

+ 대표성이 떨어지면 아무리 복잡한 통계기법을 써도 **잘못된 결론**을 얻을 수 있음.

**대표성을 담보하는 핵심: 무작위화(Randomization)**

대표성을 확보하는 가장 기본적인 방법: **무작위추출(random sampling)**

+ 모집단의 모든 구성원이 **동등한 확률**로 표본에 포함될 기회를 갖도록 하는 것

+ 특정 집단이 과대 혹은 과소 대표되지 않도록 함.

+ 체계적 편향(systematic bias)을 방지하고,  표본 오차(sampling error)를 계산 가능하게 만들어 줌.

---
# Recap the Last Class!
## 모집단과 표본

💡 **대표성(representativeness)** 이란?

> 표본의 특성이 모집단의 특성과 유사한 정도

+ 대표성이 떨어지면 아무리 복잡한 통계기법을 써도 **잘못된 결론**을 얻을 수 있음.

**대표성을 담보하는 핵심: 무작위화(Randomization)**

대표성을 확보하는 가장 기본적인 방법: **무작위추출(random sampling)**

🔍 **예시**

+ "대학생 여론조사"를 할 때, 오직 오전 수업에만 참여한 학생들을 조사한다면 편향된 표본

+ 반면, 학과·학년·시간대와 무관하게 무작위로 선정하면 **대표성 확보**

---
# Recap the Last Class!
## 모집단과 표본

💡 **대표성(representativeness)** 이란?

> 표본의 특성이 모집단의 특성과 유사한 정도

+ 대표성이 떨어지면 아무리 복잡한 통계기법을 써도 **잘못된 결론**을 얻을 수 있음.

**대표성을 담보하는 핵심: 무작위화(Randomization)**

대표성을 확보하는 가장 기본적인 방법: **무작위추출(random sampling)**

🎯 무작위화는 ‘운에 맡긴다’가 아니라, **편향을 줄이고 과학적 추론의 기반을 만드는 것**

---
class: middle, center

# Part II. 정규분포와 신뢰구간

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## KBS 세대 인식조사

KBS 세대 인식조사 자료를 통해 분석한 "주관적 계층 의식과 세대 및 성별 간 관계"

.left-column[
<img src="fig/w5_fig1.jpg" width="100%" />

]

.right-column[

KBS-한국리서치 온라인 설문자료

청년세대(20-34세)와 586세대 간 상호인식이 어떠한가?

+ 종속변수: 도움을 줄 의사가 있다(1) or 없다(0)

연구진의 주장: <br><br>"50대 남녀 및 20-34세 여성과 달리, 20-34세 남성은 자신이 소속한 계층이 높다고 생각할수록 우리 사회의 어려운 사람들을 위해 내가 가진 것을 나누어주고 싶다는 생각을 덜 한다."
]

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 무엇이 문제였을까?

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 무엇이 문제였을까?

[2021년 6월 29일 조선일보 기사](https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=101&oid=023&aid=0003623155&fbclid=IwAR1tEFK55Z3vmfo_WLYCrfmamN8gkWVexG_vTgLmYrWbB1QE_eSOnmMBhMI)에 정리된 다섯 가지 질문들

+ Q1. `$X$` 축의 10개로 나뉜 소득 수준마다 충분한 응답 수가 모였는지?

+ Q2. 2030 남성 응답자 300명이 충분한 표본크기인지?

+ Q3. 설문 결과가 이렇게 예쁜 선으로 표현되는 게 가능한지?

+ Q4. 회귀분석 대신, 각 구간별 ‘네’라고 답한 비율을 표시해주는 간단한 방식을 사용하는 것은 어떨지?

+ Q5. 이 그래프가 제대로 된 결과물일 가능성?

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간이란?

모집단의 정확한 값을 아는 것은 거의 불가능

+ 우리는 표본을 통해 **'그럴 듯한 범위'**를 추정(estimate)

+ 이때 사용하는 것이 **신뢰구간(confidence interval)**

일반적으로 사용하는 95% 신뢰구간이란, 같은 방식으로 100번 표본을 뽑으면 약 **95번은 실제 모집단의 값을 포함하게 되는 구간**을 의미. 
--
💬 쉽게 말하면,

+ 정확한 한 점(점추정)을 맞추는 대신,  그 근처의 .p1-red[.bold[믿을 만한 구간]]을 제시하는 방법

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간이란? 점추정과 구간추정

점추정(point estimate)은  **창으로 물고기 한 마리를 찌르려는 시도**

신뢰구간(interval estimate)은  **그물을 던져서 그 안에 물고기가 들어오기를 기대하는 방법**

+ 그물은 넓지만 실제 물고기를 잡을 가능성이 높음.

+ 표본이 많을수록 그물은 조밀해지고, 신뢰구간은 좁아짐.

+ 신뢰수준이 높을수록(예: 99%) 그물은 더 넓어짐.

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간이란? 점추정과 구간추정

점추정(point estimate)은  **창으로 물고기 한 마리를 찌르려는 시도**

신뢰구간(interval estimate)은  **그물을 던져서 그 안에 물고기가 들어오기를 기대하는 방법**

![](06-slides_files/figure-html/unnamed-chunk-10-1.png)

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간이란? 
### 예시로 이해하기: 대학생의 하루 평균 수면시간

대학생 100명을 조사했더니 하루 평균 수면시간은 **6.8시간**,  표준편차는 **0.9시간**이었다고 하자.

이때, 95% 신뢰구간 계산은 다음과 같음.

$$
6.8 \pm 1.96 \times \frac{0.9}{\sqrt{100}} = [6.62, 6.98]
$$

+ 이 구간은 진짜 평균이 이 안에 있을 확률이 95%라는 뜻이 .p1-red[.bold[아님]].

+ **이 과정을 100번 반복하면 95개의 구간이 실제 평균을 포함한다**는 뜻

+ 즉, 신뢰구간은 하나의 구간이 아니라, **추정 절차의 신뢰도**

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간이란? 
### 예시로 이해하기: 공장 생산제품의 내구도

어떤 공장에서 생산되는 물건의 평균 수명을 알고 싶어,  25개를 랜덤 추출해 **95% 신뢰도로 구간추정**을 했더니  결과는 **[98.3, 102.2]일**이었다고 하자. 💡 이 신뢰구간에 대해 올바른 해석은 무엇일까?

A. 해당 물건의 평균 수명은 95% 확률로 98.3~102.2일 사이에 있다.

B. [98.3, 102.2]일이라는 신뢰구간은 95% 확률로 정확하다.

C. 이 신뢰구간 하나에 대한 확률적 진술은 불가능하다.

D. [98.3, 102.2]일이라는 신뢰구간은 95% 믿을 수 있다.

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간이란? 
### 예시로 이해하기: 공장 생산제품의 내구도

A. 해당 물건의 평균 수명은 95% 확률로 98.3~102.2일 사이에 있다.

B. [98.3, 102.2]일이라는 신뢰구간은 95% 확률로 정확하다.

**C. 이 신뢰구간 하나에 대한 확률적 진술은 불가능하다.**

D. [98.3, 102.2]일이라는 신뢰구간은 95% 믿을 수 있다.

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간이란? 
### 예시로 이해하기: 공장 생산제품의 내구도

95% 신뢰수준/신뢰구간이란 [98.3, 102.2]이라는 **구간이 참값을 포함할 확률이 95%라는 뜻이 아님.**

+ 신뢰수준은 **신뢰구간을 만드는 절차 자체의 정확성**을 의미

+ 즉, 같은 방식으로 표본을 반복 추출해 신뢰구간을 여러 번 만들면,  그 중 **약 95%의 구간이 모평균의 참값을 포함**하게 됨.

+ [98.3, 102.2]라는 구간은 **이미 고정된 값**

+ 참 모평균은 그 안에 **들어 있거나(1)**, **안 들어 있거나(0)**  둘 중 하나일 뿐

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간, 모집단, 표본

**모집단(population)**: 우리가 알고 싶은 전체 집단의 특성으로, 예를 들면 "이 공장에서 생산된 모든 제품의 평균 수명"

**표본(sample)**: 모집단의 일부를 추출한 것으로, 예를 들면 "그중 25개의 제품을 무작위로 뽑아 관찰한 것"

<table class="table" style="color: black; margin-left: auto; margin-right: auto;">
 <thead>
  <tr>
   <th style="text-align:center;"> 구분 </th>
   <th style="text-align:center;"> 모집단 </th>
   <th style="text-align:center;"> 표본 </th>
  </tr>
 </thead>
<tbody>
  <tr>
   <td style="text-align:center;width: 6em; "> 대상 </td>
   <td style="text-align:center;width: 15em; "> 전체 (모든 단위) </td>
   <td style="text-align:center;width: 15em; "> 일부 (추출된 단위) </td>
  </tr>
  <tr>
   <td style="text-align:center;width: 6em; "> 값 </td>
   <td style="text-align:center;width: 15em; "> 모수(parameter) </td>
   <td style="text-align:center;width: 15em; "> 통계치(statistic) </td>
  </tr>
  <tr>
   <td style="text-align:center;width: 6em; "> 특성 </td>
   <td style="text-align:center;width: 15em; "> 고정(fixed) </td>
   <td style="text-align:center;width: 15em; "> 확률(random) </td>
  </tr>
</tbody>
</table>

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간, 모집단, 표본: 고정된 모수, 확률적 통계치

**모수(parameter)**: 모집단의 **진짜** 평균, 비율, 회귀계수 등

+ 실제로 존재하지만 우리가 직접 알 수 없음. 따라서 **고정값(fixed value)**

**통계치(statistic)**: 표본으로부터 계산한 추정치. 표본의 평균, 비율, `$\hat{\beta}$` 등

+ 표본을 다르게 뽑으면 값이 달라질 수 있으므로 **확률변수(random variable)**

<usc-blockquote>
📊  **즉,** 모수는 움직이지 않지만, 통계치는 표본이 바뀔 때마다 '흔들리는' 값
</usc-blockquote>

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간, 모집단, 표본: 고정된 모수, 확률적 통계치
### 확률적이다?

**확률적**이라는 말은 **우리가 뽑은 표본이 달라질 수 있다**는 뜻

+ 표본평균 `$\bar{X}$`는 매번 달라질 수 있지만 그 분포는 예측 가능: **표본평균의 분포(표집분포)**

+ 결국, 우리는 모집단의 모수를 직접 알 수 없기 때문에

+ 표본의 변동성을 통계적으로 모델링하여  
  
  + "이 안에 참값이 있을 것이다"라는 구간(신뢰구간)을 설정

📈 **따라서 신뢰구간의 확률은** 구간이 아니라, **그 구간을 만드는 절차가 신뢰할 만한 확률적 성질**을 가진다는 의미

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간이란?

**신뢰구간(confidence interval)**

+ 모수(parameter)가 특정 확률적 신뢰수준으로 포함되는 값의 범위

+ "모평균은 95% 신뢰수준에서 [a, b] 사이에 있다"고 표현

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 95% 신뢰구간

**신뢰수준 95%**란 의미

+ 동일한 추정 과정을 100번 반복하면 약 95번은 구간이 참된 모수를 포함

+ 주의할 점은 .p1-red[특정 연구에서 구한 하나의 신뢰구간이 모수를 포함할 확률이 95%라는 의미는 아님] (모수는 고정되어 있고, 구간이 확률적).

올바른 해석: .p1-red[추출된 표본에 기반한 추정 방법의 장기적 신뢰도가 95%라는 것]이며 일반적으로 신뢰구간 = 점추정 `$\pm$` (임계값) `$\cdot$` (표준오차) 형태로 산출

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 95% 신뢰구간

모집단 평균 `$\mu$`에 대한 95% 신뢰구간을 유도: 표본평균 `$\bar{X}$` 사용

표본평균의 분포 (표본크기 `$n$` 충분히 크다고 가정): `$\bar{X} \sim N!\Big(\mu, \frac{\sigma^2}{n}\Big)$`

+ 표준오차 (모평균 추정의 표준편차) = `$\displaystyle \frac{\sigma}{\sqrt{n}}$`

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 95% 신뢰구간

정규분포 성질 이용: `$\Pr\Big(-1.96 < \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} < 1.96 \Big) = 0.95$`

이 부등식을 `$\mu$`에 대해서 풀면: `$\Pr\Big(\bar{X} - 1.96\frac{\sigma}{\sqrt{n}}\leq \mu \leq \bar{X} + 1.96\frac{\sigma}{\sqrt{n}}\Big) = 0.95$`

따라서 **95% 신뢰구간**: `$\displaystyle \Big[\bar{X} - 1.96\frac{\sigma}{\sqrt{n}}, \bar{X} + 1.96\frac{\sigma}{\sqrt{n}}\Big]$`

+ 모표준편차 `$\sigma$`를 알 경우 (또는 `$n$`이 충분히 커서 추정 `$\hat\sigma$`로 대체) 적용 가능

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 95% 신뢰구간: 여론조사에서 모비율 신뢰구간

한 여론조사에서 표본 비율 `$\bar{p} = 0.43$` (43%)를 얻었다고 하자(응답자 수 `$n = 900$`).

+ 관심 모수: 모집단 비율 `$p$` (전체 유권자 중 지지율)

+ 표본비율의 표준오차: `$\displaystyle \text{SE} = \sqrt{\frac{\bar{p}(1-\bar{p})}{n}} \approx \sqrt{\frac{0.43 \times 0.57}{900}} \approx 0.0165$` (1.65%p)

+ 95% 신뢰구간: `$\bar{p} \pm 1.96 \times \text{SE} = 0.43 \pm 1.96(0.0165)$`

+ 계산: `$1.96 \times 0.0165 \approx 0.0323$` (약 3.2%p)

+ CI: [0.398, 0.462], 즉 39.8% ~ 46.2%

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 95% 신뢰구간: 여론조사에서 모비율 신뢰구간

**해석: "모집단 지지율 `$p$`가 95% 신뢰수준에서 약 40%에서 46% 사이"**

+ **신뢰수준 95%**로 모비율 `$p$`가 39.8%~46.2% 사이에 있다고 표현

+ 우리가 이런 조사/추정을 반복하면, 95%의 경우 참 `$p$`가 해당 범위에 들 것이라는 의미

.p1-red[.bold[잘못된 해석: "참 값이 95% 확률로 이 구간 안에 있다." (X)]]

+ 모수 `$p$`는 고정값이므로 틀린 진술 (확률개념은 구간 추출 과정에 대한 것)

신뢰구간은 표본오차의 범위를 직관적으로 보여줌: 표본평균 `$\pm$` 오차범위(margin of error)

+ 위 예에서 `$\pm$` 3.2%p가 오차범위; 언론에서는 "표본오차 `$\pm$` 3.2%p (95% 신뢰수준)"으로 표기

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰수준(confidence level)과 유의수준(significance level)

**신뢰수준 (`$1-\alpha$`)**: 구간추정이나 검정에서 우리가 **틀리지 않기를 바라는 정도**

**유의수준 (`$\alpha$`)**:  우리가 허용하는 최대 오류 확률 (보통 0.05, 즉 5%)

+ 95% 신뢰수준 `$\rightarrow$` `$\alpha$` = 0.05

+ 99% 신뢰수준 `$\rightarrow$` `$\alpha$` = 0.01

신뢰수준과 유의수준은 서로 보완적: 신뢰수준 = `$1 - \alpha$`

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰수준(confidence level)과 유의수준(significance level)

**유의수준 (`$\alpha$`)**: "우리가 잘못 기각할 위험을 감수하는 확률"

+ `$\alpha$` = 0.05 란 95%의 신뢰수준을 의미하며, 동시에 실제로 차이가 없는데도 5%의 확률로 "차이가 있다"고 결론낼 위험을 의미

<table class="table" style="font-size: 16px; color: black; margin-left: auto; margin-right: auto;">
 <thead>
  <tr>
   <th style="text-align:center;"> 구분 </th>
   <th style="text-align:center;"> 의미 </th>
   <th style="text-align:center;"> 예시 </th>
   <th style="text-align:center;"> 확률 </th>
  </tr>
 </thead>
<tbody>
  <tr>
   <td style="text-align:center;width: 6em; "> 1종 오류(Type I) </td>
   <td style="text-align:center;width: 18em; "> H₀이 참인데 기각 </td>
   <td style="text-align:center;width: 28em; "> 코로나19에 걸리지 않았는데 양성이라고 판단 (false positive) </td>
   <td style="text-align:center;width: 6em; "> α </td>
  </tr>
  <tr>
   <td style="text-align:center;width: 6em; "> 2종 오류(Type II) </td>
   <td style="text-align:center;width: 18em; "> H₀이 거짓인데 기각하지 않음 </td>
   <td style="text-align:center;width: 28em; "> 코로나19에 걸렸는데 음성이라고 판단 (false negative) </td>
   <td style="text-align:center;width: 6em; "> β </td>
  </tr>
  <tr>
   <td style="text-align:center;width: 6em; "> 검정력(Power) </td>
   <td style="text-align:center;width: 18em; "> H₀이 거짓일 때 기각할 확률 </td>
   <td style="text-align:center;width: 28em; "> 코로나19에 걸렸을 때 양성으로 정확히 판단할 확률 </td>
   <td style="text-align:center;width: 6em; "> 1−β </td>
  </tr>
</tbody>
</table>

`$\alpha$`는 너무 엄격하게 설정해도 검정력이 줄어드는 상충관계(trade-off)가 존재

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰수준(confidence level)과 유의수준(significance level)
### 임계값(critical value)

임계값은 귀무가설을 기각할지 말지를 결정하는 **경계선**

+ 양측검정에서 `$\alpha$` = 0.05 `$\rightarrow$` 각 꼬리에 0.025씩

+ 표준정규분포 기준 임계값: `$\pm$` 1.96

표본이 평균에서 `$\pm$` 1.96 표준오차 이상 떨어져 있으면, 귀무가설로부터 너무 멀다 `$\rightarrow$` 기각

+ 다음 주의 가설검정 파트에서 더 자세히 배울 것임. 특히, "기각"(reject)이라는 것에 대해.

+ 기본적으로 '마땅히 그러한 것'으로부터 아주 큰 차이가 있는 '보기 드문 결과'인지 여부를 확인하는 것이라고 이해하면 됨.

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰수준(confidence level)과 유의수준(significance level)
### 임계값(critical value)

![](06-slides_files/figure-html/unnamed-chunk-13-1.png)

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰수준과 구간 폭

신뢰수준 선택에 따라 구간의 폭이 달라짐.

+ 90% 신뢰구간: 약 `$\bar{X} \pm 1.645,\text{SE}$` (조금 더 좁은 구간)

+ 95% 신뢰구간: `$\bar{X} \pm 1.96,\text{SE}$`

+ 99% 신뢰구간: 약 `$\bar{X} \pm 2.576,\text{SE}$` (더 넓은 구간)

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰수준과 구간 폭

신뢰수준 `$\uparrow$` `$\Rightarrow$` 구간 폭 `$\uparrow$` (더 높은 신뢰 확보 위해 범위를 넓게 잡음)

+ 앞서 여론조사 예에서 99% 신뢰구간은 43% `$\pm$` 4.2%p `$\rightarrow$` [38.8%, 47.2%] (약 8.4%p 폭)

+ 90% 신뢰구간은 43% `$\pm$` 2.7%p `$\rightarrow$` [40.3%, 45.7%] (약 5.4%p 폭)

연구 목적에 따라 90%, 95%, 99% 등 신뢰수준 선택 (95%가 관행적으로 많이 사용)

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰수준과 `$p$`-값

귀무가설이 참일 때, 현재의 데이터보다 더 극단적인 결과가 나올 확률

+ 가설검정 파트에서 자세히 배우겠지만, 어떤 원인이 결과에 미치는 효과를 기대할 때 우리는 "그 효과가 없을 것"(`$H_0$` = 0, 귀무가설 = 효과가 없음)이라고 가설을 설정

+ 그리고 데이터를 통해 그러한 귀무가설(효과가 없다는 가설)의 주장과는 달리 0보다 유의미하게 더 큰 효과를 발견했을 때, "효과가 없다"는 경험적 근거가 없다(귀무가설의 기각)고 주장하며 기대한 효과를 간접적으로 검정

+ `$p$` = 0.03일 때, 이는 '귀무가설이 참'(효과가 실제로 없다)일 때 이런 데이터가 나올 확률은 3%라는 것을 의미

+ 즉, 매우 드문 일이므로 귀무가설이 참(효과가 없다)이라는 가설을 기각
  
  + `$p \leq \alpha$` 이면 귀무가설을 기각(유의미한 차이), `$p > \alpha$`이면 기각 불가

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰수준과 `$p$`-값

`$p$`-값은 표본에서 계산된 `$t$`-통계량의 위치를 기준으로 그보다 **더 극단적인 값이 나올 확률**을 면적으로 계산한 것

![](06-slides_files/figure-html/unnamed-chunk-14-1.png)

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰수준, 임계값, 그리고 `$p$`-값
### 임계값 접근 vs `$p$`-값 접근

계산한 `$|t|$` 값을 임계값과 비교

+ `$|t| \geq t$`-통계량 `$\leftrightarrow$` `$p \leq \alpha$` 이면 `$H_0$` 기각

+ `$|t| < t$`-통계량 `$\leftrightarrow$` `$p > \alpha$` 이면 `$H_0$` 기각 불가

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간의 의미 확인: 시뮬레이션

모집단 분포를 알고 있을 때, 구한 신뢰구간들이 얼마나 모수를 포함하는지 확인

+ 모집단: `$N(\mu=100,\sigma=15)$`에서 20개의 표본 추출 (각 표본크기 `$n=30$`)

+ 각 표본마다 95% 신뢰구간 계산

**20개 신뢰구간 중 대략 95%인 19개 정도가 모평균 100을 포함하리라 기대**

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 신뢰구간의 의미 확인: 시뮬레이션

.panelset[
.panel[.panel-name[R Code]

]
.panel[.panel-name[Visualization]

]
.panel[.panel-name[Plot]
![](06-slides_files/figure-html/unnamed-chunk-17-1.png)

]
.panel[.panel-name[Results]

위 그림에서 각 가로선은 하나의 표본에 대한 95% 신뢰구간 (점은 표본평균)

+ 검은색 구간은 모집단 평균 100을 포함, 붉은색 구간은 포함하지 못한 경우

+ 20개의 구간 중 19개가 모평균 100을 포함 (약 95%에 해당)

+ 이 실험에서 약 95%의 신뢰수준이 제대로 구현되었음을 확인

]
]

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 표본크기의 영향

**표본 크기 `$n$`**에 따라 **표준오차(SE)**가 달라짐: `$\displaystyle \text{SE} \propto \frac{1}{\sqrt{n}}$`

`$n$`이 커질수록 `$\sqrt{n}$` 증가 `$\rightarrow$` SE 감소 `$\rightarrow$` 신뢰구간 폭 감소 (정밀도 증가)

같은 95% 신뢰수준에서 표본크기의 효과 변화

+ `$n \approx 1,000$`일 때 오차범위 `$\pm$` 3%p (여론조사에서 흔히 보는 크기)

+ `$n \approx 2,500$`일 때 오차범위 `$\pm$` 2%p (표본 2.5배로 약 1%p 감소)

+ `$n \approx 10,000$`일 때 오차범위 ±1%p (표본 10배로 오차 ~1/3)

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 표본크기의 영향

**표본 크기 `$n$`**에 따라 **표준오차(SE)**가 달라짐: `$\displaystyle \text{SE} \propto \frac{1}{\sqrt{n}}$`

`$n$`이 커질수록 `$\sqrt{n}$` 증가 `$\rightarrow$` SE 감소 `$\rightarrow$` 신뢰구간 폭 감소 (정밀도 증가)

같은 95% 신뢰수준에서 표본크기의 효과 변화

**표본 증가의 한계**: 정밀도 높이려면 `$n$`을 **크게** 늘려야 함 (비용 `$\uparrow$`)

**통계적으로 유의미한 개선에는 큰 표본 증가 필요 (수확체감 발생)**

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 데이터 변동성과 구간 폭

**모집단의 변동성(`$\sigma$`)**이 클수록 표본평균의 표준오차도 커짐 `$\rightarrow$` 신뢰구간이 넓어짐.

+ 표본 100명으로 평균 키 추정 vs 평균 수입 추정: 수입이 변동성이 더 크면 CI도 더 넓음.

**신뢰구간 폭은 세 요인의 함수**
--
: 구간폭 `$\propto$` z값 `$\times$` `$\sigma/\sqrt{n}$`

+ `$z$`: 신뢰수준에 따른 임계값 (높은 신뢰수준일수록 큼)

+ `$σ$`: 모표준편차 (데이터 산포)

+ `$n$`: 표본크기

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 데이터 변동성과 구간 폭

구간폭 줄이는 법

+ 신뢰수준을 낮추거나 (`$z \downarrow$`)
--
, .p1-red[하지만 신뢰 하락]

+ 표본크기 크게 (`$n \uparrow$`)
--
, .p1-red[비용/시간 제약 고려]

+ 변동성 낮은 모집단 연구
--
, .p1-red[연구 주제에 따라 한계 있음]

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 검정
### 우리는 '차이'를 알고 싶다

신뢰구간은 모평균이 어디쯤 있을지를 알려주는 일종의 '추정'

하지만 연구자는 종종 이러한 질문을 가지게 됨:

> 우리가 가진 이 표본'들'이 하나의 모집단에서 비롯된 것일까?

> 혹은 하나의 모집단에서 서로 다른 표본들이 '우연히' 차이가 나게된 것일까?

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 검정
### 우리는 '차이'를 알고 싶다

사실, **신뢰구간과 (가설)검정은 같은 논리의 두 표현**

<table class="table" style="color: black; margin-left: auto; margin-right: auto;">
 <thead>
  <tr>
   <th style="text-align:center;"> 접근 </th>
   <th style="text-align:center;"> 질문 </th>
   <th style="text-align:center;"> 해석 </th>
  </tr>
 </thead>
<tbody>
  <tr>
   <td style="text-align:center;width: 6em; "> 신뢰구간 </td>
   <td style="text-align:center;width: 20em; "> 참값이 이 범위 안에 있을까? </td>
   <td style="text-align:center;width: 20em; "> 기준값과 통계적으로 다른가? </td>
  </tr>
  <tr>
   <td style="text-align:center;width: 6em; "> 가설검정 </td>
   <td style="text-align:center;width: 20em; "> 범위 안/밖으로 판단 </td>
   <td style="text-align:center;width: 20em; "> 기각 / 비기각으로 판단 </td>
  </tr>
</tbody>
</table>

두 집단의 차이가 존재하는지를 확인하고자 할 때, 95% 신뢰구간이 [6.2, 7.1]일 때

- 관측한 두 집단의 차이가 7.0이면 → **유의미한 차이가 없음** (구간 안)  
  
- 관측한 두 집단의 차이가 8.0이면 → **유의미한 차이가 있음** (구간 밖)

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 검정
### 일표본 검정 (One-sample t-test)

하나의 표본 평균이 **특정 기준(모평균)**과 다른지를 검정하는 방법

.pull-left[

- 귀무가설 `$H_0$`: `$\mu = \mu_0$`

- 대립가설 `$H_A$`: `$\mu \neq \mu_0$`
> 어떤 에너지드링크의 카페인 함량 표준은 80mg이라 할 때,  표본 30개의 평균이 83mg, 표준편차 10mg이었다면?

]

.pull-right[

95% 신뢰구간:  
$$
83 \pm 1.96 \times \frac{10}{\sqrt{30}} = [79.4, 86.6]
$$  
80mg이 구간 안에 있음 `$\rightarrow$` `$H_0$` **기각 불가**

]

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 검정
### 일표본 검정 (One-sample t-test)

![](06-slides_files/figure-html/unnamed-chunk-19-1.png)

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 검정
### 일표본 검정 (One-sample t-test)

신뢰구간 관점: 기준값(`$\mu_0$`)이 95% 신뢰구간 안에 있다면, 유의미한 차이 없음.

검정통계량 관점: `$t = \frac{\bar{X}-\mu_0}{s/\sqrt{n}}$`

+ 예시에서 `$t = \frac{83 - 80}{10/\sqrt{30}} = 1.64$`

+ 임계값 1.96보다 작음 `$\rightarrow$` `$H_0$` 기각 불가

*두 접근은 동일한 결론을 준다.**
--
: 표본평균이 기준값과 다르다고 할 근거는 없다.

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 검정
### 이표본 검정 (Independent two-sample test)

두 개의 독립된 집단 평균이 통계적으로 같은지 다른지를 검정

- 귀무가설 `$H_0$`: `$\mu_1 = \mu_2$`

- 대립가설 `$H_A$`: `$\mu_1 \neq \mu_2$`

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 가설검정
### 이표본 검정 (Independent two-sample test)

남학생 40명: 평균 172.5cm, SD 6.8

여학생 35명: 평균 168.3cm, SD 7.1

95% 신뢰구간 `$(\mu_1 - \mu_2)$`: `$(172.5 - 168.3) \pm 1.96 \times SE = [2.1, 6.3]$`

+ 0이 포함되지 않으므로 통계적으로 **유의미한 차이 있음.**

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 가설검정
### 이표본 검정 (Independent two-sample test)

![](06-slides_files/figure-html/unnamed-chunk-20-1.png)

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 가설검정
### 이표본 검정 (Independent two-sample test)

신뢰구간 접근: `$(\mu_1 - \mu_2)$`의 신뢰구간이 0을 포함하지 않으면, 두 집단 평균의 차이가 통계적으로 유의함.

검정통계량 접근: `$t = \frac{\bar{X}_1 - \bar{X}_2}{SE(\bar{X}_1 - \bar{X}_2)}$`

+ 예시에서 `$t = \frac{4.2}{1.05} = 4.0$`

+ 임계값 1.96보다 큼 → `$H_0$` 기각 (p < 0.001)

**신뢰구간과 `$t$`검정은 같은 이야기를 서로 다른 언어로 표현한 것**

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 가설검정
### 일표본 vs 이표본 검정

<table class="table" style="color: black; margin-left: auto; margin-right: auto;">
 <thead>
  <tr>
   <th style="text-align:center;"> 구분 </th>
   <th style="text-align:center;"> 일표본 검정 </th>
   <th style="text-align:center;"> 이표본 검정 </th>
  </tr>
 </thead>
<tbody>
  <tr>
   <td style="text-align:center;width: 5em; "> 비교 대상 </td>
   <td style="text-align:center;width: 18em; "> 기준값(μ₀) </td>
   <td style="text-align:center;width: 18em; "> 두 집단의 평균(μ₁ vs μ₂) </td>
  </tr>
  <tr>
   <td style="text-align:center;width: 5em; "> 귀무가설 </td>
   <td style="text-align:center;width: 18em; "> μ = μ₀ </td>
   <td style="text-align:center;width: 18em; "> μ₁ = μ₂ </td>
  </tr>
  <tr>
   <td style="text-align:center;width: 5em; "> 검정 기준 </td>
   <td style="text-align:center;width: 18em; "> μ₀가 신뢰구간 안에 있는가? </td>
   <td style="text-align:center;width: 18em; "> (μ₁−μ₂)의 신뢰구간에 0이 포함되는가? </td>
  </tr>
  <tr>
   <td style="text-align:center;width: 5em; "> 주요 해석 </td>
   <td style="text-align:center;width: 18em; "> 한 집단의 평균이 특정 기준과 다른가 </td>
   <td style="text-align:center;width: 18em; "> 두 집단의 평균이 서로 다른가 </td>
  </tr>
</tbody>
</table>

🎯 **신뢰구간과 가설검정은 서로 보완적**
--
: 구간 안에 있다/없다 = 기각한다/하지 않는다

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 가설검정
### 퀴즈: 일표본 검정

표본: 30개 제품의 평균 수명 83일, 표준편차 10일

가정: `$H_0$`: `$\mu$` = 80

이때의 `$t$`-통계량은? **HINT**: `$t = \frac{\bar{X} - \mu}{\s/\sqrt{n}}$`

+ `$t = \frac{83-80}{10/\sqrt{30}} = 1.64$`

+ p = 0.11 (단측검정), p = 0.22 (양측검정)

+ `$\alpha$` = 0.05 기준으로는 `$p$` > 0.05이므로 `$H_0$` 기각 불가. 즉, 차이가 있다고 보기 어렵다.

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 가설검정
### 퀴즈: 이표본 검정

남학생 평균 172.5, 여학생 평균 168.3, `$n_{\text{남학생}} = 40$`, `$n_{\text{여학생}} = 35$`, `$s_{\text{남학생}} = 6.8$`, `$n_{\text{여학생}} = 7.1$`

이때의 `$t$`-통계량은? **HINT**: `$t = \frac{\bar{X_1} - \bar{X_2}}{\sqrt{\frac{s_1^{2}}{n_1} + \frac{s_2^{2}}{n_2}}}$`

+ `$t = \frac{172.5 - 168.3}{\sqrt{6.8^2/40 + 7.1^2/35}} \approx 2.61$`

+ p `$\approx$` 0.001 (양측검정): 두 집단 평균은 통계적으로 다르다(`$H_0$` 기각)

---
# 확률과 통계적 추론 II: 정규분포와 신뢰구간
## 약간 맛보기: 신뢰구간과 가설검정
### 신뢰수준, 유의수준, `$p$`-값의 연결구조

신뢰수준이 높을수록(예: 99%) 유의수준이 작아지며 기각하기 어려워짐.

유의수준 `$\alpha$`가 작을수록 임계값이 커지므로 더 엄격한 검정을 수행하는 것이 됨.

`$p$`-값은 데이터가 얼마나 극단적인지 나타내며, `$p$`-값이 유의수준보다 작거나 같으면 귀무가설을 기각

신뢰구간 밖에 있다는 이야기는 `$p$`-값이 유의수준보다 작거나 같다는 얘기와 같으며, 통계적으로 유의미한 차이가 존재한다는 것

🎯 **결론**: 신뢰구간, 임계값, p-value는 모두 같은 질문을 다른 방식으로 표현한 것

**이 표본이 정말 우연일까?”**

---
class: middle, center

# Part III. R을 이용한 시각화 실습 및 질의응답

다음 강의에는 가설검정의 논리에 대해 살펴볼 것

---
class: center, middle
background-image: url("knu_wide.png")
background-size: 300px
background-position: 11% 15%

# 감사합니다!

## 궁금한 것이 있으면 언제든 연락하세요.

강사 연락처

|                   연락처                         |     박상훈                                    |
| :-----------------------------------------------: | :--------------------------------------------------: |
| <svg viewBox="0 0 512 512" style="height:1em;position:relative;display:inline-block;top:.1em;" xmlns="http://www.w3.org/2000/svg">  <path d="M440 6.5L24 246.4c-34.4 19.9-31.1 70.8 5.7 85.9L144 379.6V464c0 46.4 59.2 65.5 86.6 28.6l43.8-59.1 111.9 46.2c5.9 2.4 12.1 3.6 18.3 3.6 8.2 0 16.3-2.1 23.6-6.2 12.8-7.2 21.6-20 23.9-34.5l59.4-387.2c6.1-40.1-36.9-68.8-71.5-48.9zM192 464v-64.6l36.6 15.1L192 464zm212.6-28.7l-153.8-63.5L391 169.5c10.7-15.5-9.5-33.5-23.7-21.2L155.8 332.6 48 288 464 48l-59.4 387.3z"></path></svg>             | [sh.park.poli@gmail.com](sh.park.poli@gmail.com)               |
| <svg viewBox="0 0 576 512" style="height:1em;position:relative;display:inline-block;top:.1em;" xmlns="http://www.w3.org/2000/svg">  <path d="M528 32H48C21.5 32 0 53.5 0 80v352c0 26.5 21.5 48 48 48h480c26.5 0 48-21.5 48-48V80c0-26.5-21.5-48-48-48zm0 400H303.2c.9-4.5.8 3.6.8-22.4 0-31.8-30.1-57.6-67.2-57.6-10.8 0-18.7 8-44.8 8-26.9 0-33.4-8-44.8-8-37.1 0-67.2 25.8-67.2 57.6 0 26-.2 17.9.8 22.4H48V144h480v288zm-168-80h112c4.4 0 8-3.6 8-8v-16c0-4.4-3.6-8-8-8H360c-4.4 0-8 3.6-8 8v16c0 4.4 3.6 8 8 8zm0-64h112c4.4 0 8-3.6 8-8v-16c0-4.4-3.6-8-8-8H360c-4.4 0-8 3.6-8 8v16c0 4.4 3.6 8 8 8zm0-64h112c4.4 0 8-3.6 8-8v-16c0-4.4-3.6-8-8-8H360c-4.4 0-8 3.6-8 8v16c0 4.4 3.6 8 8 8zm-168 96c35.3 0 64-28.7 64-64s-28.7-64-64-64-64 28.7-64 64 28.7 64 64 64z"></path></svg>                 | [sanghoon-park.com/](https://www.sanghoon-park.com/) |
| <svg viewBox="0 0 448 512" style="height:1em;position:relative;display:inline-block;top:.1em;" xmlns="http://www.w3.org/2000/svg">  <path d="M128 148v-40c0-6.6 5.4-12 12-12h40c6.6 0 12 5.4 12 12v40c0 6.6-5.4 12-12 12h-40c-6.6 0-12-5.4-12-12zm140 12h40c6.6 0 12-5.4 12-12v-40c0-6.6-5.4-12-12-12h-40c-6.6 0-12 5.4-12 12v40c0 6.6 5.4 12 12 12zm-128 96h40c6.6 0 12-5.4 12-12v-40c0-6.6-5.4-12-12-12h-40c-6.6 0-12 5.4-12 12v40c0 6.6 5.4 12 12 12zm128 0h40c6.6 0 12-5.4 12-12v-40c0-6.6-5.4-12-12-12h-40c-6.6 0-12 5.4-12 12v40c0 6.6 5.4 12 12 12zm-76 84v-40c0-6.6-5.4-12-12-12h-40c-6.6 0-12 5.4-12 12v40c0 6.6 5.4 12 12 12h40c6.6 0 12-5.4 12-12zm76 12h40c6.6 0 12-5.4 12-12v-40c0-6.6-5.4-12-12-12h-40c-6.6 0-12 5.4-12 12v40c0 6.6 5.4 12 12 12zm180 124v36H0v-36c0-6.6 5.4-12 12-12h19.5V24c0-13.3 10.7-24 24-24h337c13.3 0 24 10.7 24 24v440H436c6.6 0 12 5.4 12 12zM79.5 463H192v-67c0-6.6 5.4-12 12-12h40c6.6 0 12 5.4 12 12v67h112.5V49L80 48l-.5 415z"></path></svg>                | 영상바이오관 405                                        |