일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Today
- Total
- activation function
- AdaGrad
- adaptive learning rate
- arithmetic reasoning
- Attention is all you need
- attention mechanism
- auto encoder
- Back Propagation Trough Time
- Backpropagation
- Bayes Theorem
- BCE
- Bert
- Bidirectional Encoder Representation from Transformer
- Binary classification
- BPTT
- Chain-of-Thought
- CNN
- commonsense reasoning
- Computer Vision
- Confusion Matrix
- convolutional neural network
- Cot
- cot reasoning
- counting
- Cross Entropy Loss
- deep learning
- degradation
- Dimension Reduction
- Few-shot
- fine-tuning
데이터 분석 일지
[Statistics] 가설 검정 본문
0. 용어 정리
아래는 가설 검정에 대해 설명하기 전 알아야 할 기본 개념들을 설명한다.
모집단(population): 연구나 조사의 대상이 되는 전체 집단이나 집합
모수(parameter): 모집단의 특성을 나타내는 수치적 값 (모평균, 모분산, 모비율 등)
표본(sample): 모집단에서 무작위로 선택된 일부 개체나 단위의 집합
가설(hypothesis): 모수에 대한 주장 (귀무가설, 대립가설)
위 기본 개념을 토대로 가설 검정을 설명한다.
1. 가설 검정의 개요
먼저 모수에 대한 주장을 가설로 세운다. 이 가설이 타당한지에 대해 검정하는 것을 가설 검정이라고 한다. 이는 연구 결과를 통계적으로 평가하고, 특히 표본을 사용하여 모집단에 대한 일반적인 판단을 내리는 데 사용된다.
1. 1. 예시
여론 조사를 수행한 후 모집단에서 표본으로 100명의 사람을 추출하였을 때 찬성률(표본비율)이 55%이다. 이때 찬성률(모비율)이 50% 이상이라고 판단해도 되는지를 판단한다. 이러한 예시에서 가설 검정을 하기 위해서는 찬성률이 50%인데도 이런 숫자가 나올 가능성을 계산할 수 있다.
다음 예시로 어느 영업점에서 사원들의 실적을 조사한다. 이중 남녀사원 각 30명의 7월 실적을 조사할 때 남자 평균 1000만 원, 여자 평균 800만 원이다. 이때 남자 사원의 실적이 더 높다고 판단해도 되는지를 판단한다. 이때 남녀실적이 같더라도 우연히 이러한 결과를 나타낼 가능성을 계산할 수 있다. \
1. 2. 종류
보통 가설은 귀무가설과 대립가설로 나누어 주장할 수 있다. 각각은 서로 반대되는 개념으로 가설 검정을 수행할 때 귀무가설이 채택(기각)되면 대립가설은 기각(채택)되는 관계이다.
먼저 귀무가설은 과거의 보수적인 주장으로, H_0으로 쓰이고 영가설이라고도 불린다. 이 가설은 관습적이고 보수적인 주장을 포함한다. 이러한 가설은 차이없다, 0이다, 효과 없다, 관계없다 등의 표현으로 쓰인다. 각 예시에서의 귀무가설은 아래와 같은 수식으로 나타낼 수 있다.
- H_0: p = 0.5
- H_0: µ_1 = µ_2
다음으로 대립가설은 새롭게 입증하고자하는 주장으로, H_1로 쓰이고 연구가설이라고도 불린다. 이 가설은 적극적이고 입증하고자 하는 주장을 포함한다. 이러한 가설은 차이 있다, 0이 아니다, 효과 있다, 관계있다 등의 표현으로 쓰인다. 각 예시에서의 대립가설은 아래와 같은 수식으로 나타낼 수 있다.
- H_1: p > 0.5
- H_1: µ_1 > µ_2
1. 3. 검정 통계량
검정 통계량은 어느 가설이 맞는지를 판정할 때 기준이 되는 값을 의미한다. 이는 표본을 기반으로 계산되기 때문에 상수가 아닌 확률변수이다. 따라서 검정 통계량의 값으로 판단하더라도 틀릴 가능성은 존재한다. 첫 번째 예시에서의 판단의 기준은 표본 비율이 되고, 두 번째 예시에서의 판단의 기준은 표본 평균의 차이가 될 수 있다.
1. 4. 기각역
기각역은 귀무가설을 기각하는 기준이 되는 검정 통계량의 범위를 의미한다. 각 예시에 대해서는 표본 비율의 값이 0.6 이상이면 귀무가설을 기각하거나 표본 평균의 차이가 100 이상이면 귀무가설을 기각하는 것 등으로 나타낼 수 있다. 기각역은 유의 수준에 의해 계산되며, 해당 영역에 속하는 검정 통계량 값은 귀무가설을 기각한다.
1. 5. 유의 수준
유의 수준은 귀무가설이 사실임에도 불구하고 기각될 확률을 의미한다. 이는 아래의 수식처럼 나타내고, 제1종의 오류라고 말한다. 일반적으로 5%의 유의수준을 주로 사용한다. 이 부분에 해당하는 검정 통계량 값이 나오면, 귀무가설을 기각하게 된다. 귀무가설을 기각하거나 채택할 때 유의 수준도 함께 나타낸다. 쉽게 말해 H_0이 기각이고 α = 0.05라고 나타난다면 이는 0.05의 확률로 틀릴 수 있다는 것이다.
$$\alpha = P(H_0 기각 | H_0 사실)$$
1. 6. p-value (유의확률)
p-value는 귀무가설이 사실임에도 불구하고 실제 표본에서의 관측 결과가 나타날 확률을 의미한다. 이는 아래의 수식처럼 나타낸다. 만약 아래의 수식을 통해 p-value가 작은 값이 나왔다면, 이는 귀무가설이 사실일 때 실제 표본에서의 관측 결과가 나타날 확률이 작다는 것이기 때문에 귀무가설을 기각해야한다는 것을 의미한다. p-value에 의한 검정을 수행할 때 p-value가 작다는 기준은 유의 수준을 기준으로 한다. 반대로 유의 수준보다 p-value가 크면 귀무가설을 채택한다.
$$p-value = P(결과 | H_0 사실)$$
2. 모평균의 검정
모평균의 검정은 모평균 가설을 검정하는 것을 의미한다. 이때의 가설은 아래와 같이 세울 수 있다.
- H_0: 모평균이 μ이다
- H_1: 모평균이 μ가 아니다 / 모평균이 μ보다 크다 / 모평균이 μ보다 작다
귀무가설은 한 가지로 표현하지만, 대립가설은 크게 세 가지로 나누어 표현할 수 있다. [모평균이 μ가 아니다]와 같은 경우는 양쪽의 가설을 검정하기 때문에 양측 검정이라고 하고, [모평균이 μ보다 크다] 또는 [모평균이 μ보다 작다]와 같은 경우는 단측 검정이라고 한다. 일반적으로는 양측 검정을 사용한다. (본 예제에서는 단측 검정을 가지고 설명)
2. 1. 예제
한 대학 경영학부 학생들의 평균 IQ를 조사한다. 이 중 25명만 임의로 추출하여 평균을 계산하니 평균 IQ가 115(= 표본평균)가 나왔다. 또한 일반인들의 IQ는 평균 = 110, 표준편차 = 10이다. 이때 이 집단은 일반인들에 비해서 높다고 이야기 할 수 있는지 알아보자. 이때의 가설은 아래와 같이 세울 수 있다.
- H_0: μ = 110
- H_1: μ > 110
2. 1. 1. 가설 검정의 절차
가설 검정은 기본적으로 기존의 사실(귀무가설)을 중시한다. 귀무가설에서 많이 벗어나야 대립가설이 맞다고 판단하게 된다는 것이다. 이는 모평균의 점추정값인 표본평균으로 판단할 수 있다. 표본평균의 값이 귀무가설이 사실일 때 나올 수 있는 범위를 그려보고, 관측된 표본평균값이 여기서 많이 벗어난다고 판단된다면 대립가설이 맞는 것으로 결정한다. 이때 '많이 벗어난다'의 기준은 유의수준으로 결정할 수 있다.
2. 1. 2. 귀무가설이 사실일 경우
귀무가설이 사실일 경우, 즉 H_0: μ = 110일 경우의 표본평균의 정규분포는 아래의 수식과 같이 정의할 수 있다.
$$ \bar{X} \sim N( \mu, \frac{\sigma^2}{n}) = N(110, \frac{10^2}{25})$$
위의 수식에서 평균은 110이고 표준편차는 2(= σ)이다.
2. 2. 기각역에 의한 검정
유의 수준 α를 통하여 기각역을 계산하고 기각역에 표본평균이 포함된다면 귀무가설을 기각하면 된다.
2. 2. 1. α = 0.05일 경우
α = 0.05은 정규분포에서 상위 5%가 되는 부분을 의미한다. 상위 5%가 되는 값이 표준정규분포일 경우에 1.645이므로 위 예제의 표본평균의 정규분포를 표준화하여 기각역을 구할 수 있다. k를 표준화하였을 때 1.645가 되는 k 값을 계산하면 k = 113.29이다. 따라서 기각역이 113.29이므로 표준평균 115는 기각역에 속하고, 귀무가설을 기각하여야 한다. 이는 모평균이 110보다 크다고 판단한다.
$$\bar{X} \geq 113.29$$ $$\therefore H_0 기각 (\alpha = 0.05)$$
2. 2. 2. α = 0.01일 경우
α = 0.01은 정규분포에서 상위 1%가 되는 부분을 의미한다. 위와 같은 방법으로 계산하면 기각역 k = 114.65이다. 따라서 기각역이 114.65이므로 표준평균 115는 기각역에 속하고, 귀무가설을 기각하여야 한다. 이는 모평균이 110보다 크다고 판단한다.
$$\bar{X} \geq 114.65$$ $$\therefore H_0 기각 (\alpha = 0.01)$$
- 귀무가설 기각 (α = 5%)
- 귀무가설 기각 (α = 1%)
유의 수준이 5% 일 때와 1% 일 때 모두 귀무가설 기각이다. 이때 결과는 유의수준이 낮을 수록 결과가 틀릴 확률이 낮다는 것이므로 α = 1%로 표기한다.
만약 표준평균이 114일 경우라면, 유의수준이 5%일 때는 귀무가설 기각이지만 1%일 때는 귀무가설 채택의 결과가 나온다. 이와 같이 같은 결과로도 유의 수준에 따라 기각할 수도 채택할 수도 있기 때문에 기각역에 의한 검정을 주로 사용하지 않는다. 절대적인 유의 수준의 값은 정해지지 않기 때문이다. 따라서 가설 검정 시에는 각 유의 수준에 따른 기각역 또는 p-value만 제시한다. 또한 p-value를 이용하면 기각역을 구하지 않고도 결론을 내릴 수 있다.
2. 3. p-value에 의한 검정
p-value로 가설 검정을 진행할 경우에는 p-value < α일 때 귀무가설을 기각한다. 위 예시에서 p-value는 표본평균이 115 이상 나올 확률을 의미한다. α가 1% 일 때 표본평균의 정규분포에서는 114.65를 의미한다. 표본평균(= 115)이 α가 1%일 때 표본평균의 정규분포에서 의미하는 값(= 114.65) 보다 클 경우에, p-value < α를 성립하므로 귀무가설을 기각한다.
$$p-value < 0.01 = 1%$$ $$\therefore H_0 기각 (\alpha = 0.01)$$
'Lecture or Textbook Review > Statistics' 카테고리의 다른 글
[Harvard: STAT 110] 3강: Birthday Problem, Properties of Probability (0) | 2024.06.24 |
---|---|
[Harvard: STAT 110] 2강: Story Proofs, Axioms of Probability (1) | 2024.06.13 |
[Harvard: STAT 110] 1강: Probability and Counting (1) | 2024.06.11 |
[Statistics] 추정 (0) | 2024.02.20 |