추정개요
표본의 특성을 나타내는 수치인 통계량을 기초로 하여 모집단의 특성인 모수를 추측하는 방법
1)불편성(Unbiasedness) ⇒ 편의가 없는 것을 의미한다.
→ 어떤 모수의 추정량이 기댓값의 원래 모수가 되는 성질
추정량의 기대치가 추정할 모수의 실제값과 같을 때, 이 추정량은 불편성을 가졌다고 한다.
모수 θ의 추정량을 θ^ 으로 나타내면 θ^의 기댓값이 θ가 되는 성질이다.
E(θ^)=θ cf)편의: 추정하고자 하는 모수와 추정량의 기댓값과의 차이
hat표시는 추정량임을 나타내기 위함이다.
2)효율성(Efficiency)
추정량 θ^이 불편추정량이고, 그 분산이 다른 추정량 θ^ i에 비해 최소의 분산을 갖는 성질이다.
Var(θ^1)≥Var(θ^2)일때 θ^2가 더 효율적이다
3)일치성(Consistency)
표본의 크기(n)이 커짐에 따라 추정량 θ^이 확률적으로 모수 θ에 가깝게 수렴하는 성질이다.
4)충분성(Sufficiency)
모수에 대하여 가능한 많은 표본정보를 내포하고 있는 추정량의 성질이다.
점추정
모집단으로부터 추출된 표본을 이용하여 하나의 수치로 모수를 추정하는 것을 말한다.
- 표준오차(Standard error) = 표본평균의 표준편차
통계량의 표준편차를 표준오차라고 하며, 표준오차는 모집단의 표준편차보다 언제나 작다.
Standard Error[SE]=nσ 모집단의 표준편차가 커질수록 표준오차 또한 커진다.
표본의 크기가 클수록 표준오차는 작아진다 → 모집단에 근접해지기 때문에
표준오차가 작은 추정량이 더 좋은 추정량이라고 말할 수 있다.
cf) 표본오차 vs 표준오차
표본오차 - 모집단과 표본의 차이를 말하는 것
표준오차 - 통계량의 분포인 표본분포의 표준오차를 의미한다.
1)모평균의 점추정
모평균의 점추정은 표본평균과 같다. 즉, 모집단 평균 u의 불편추정량은 Xˉ이다.
표본평균Xˉ⇒모평균u
2)모분산/ 모표준편차의 점추정
모분산의 점추정량은 표본분산과 동일하다. 모표준편차의 점추정량은 표본표준편차와 같다.
표본분산S2⇒모분산σ2, 표본표준편차S⇒모표준편차σ 모집단 분산 σ2의 불편추정량은 S2이다.
하지만 모집단 표준편차 σ의 불편추정량이 표본표준편차 s인 것은 아니다.
3)모비율의 점추정
모비율이란 모집단 속에서 어떤 특정한 속성을 갖는 것의 비율을 의미한다.
표본비율p^⇒모비율p
구간추정
신뢰수준 95%라고 함은, 동일한 추정방법을 사용하여 신뢰구간을 100회 반복하여 추정한다면, 95회 정도는 동일한 결과가 나오는 것을 의미한다. 추정량의 분포가 정규분포를 따를 때의 경우가 많음.

신뢰구간
일정한 구간을 제시하여 모수가 포함되었을 것이라고 제시한 구간을 말한다.
95%의 신뢰구간이란 신뢰구간을 100회 반복하여 측정했을 때 95번은 그 구간 내에 모평균이 포함된다는 의미이다.
u의신뢰구간=Xˉ+−신뢰계수∗표준오차
1)모평균 추정시 표본의 크기
추정식의 양쪽에서 D단위만큼만 벌어지는 구간을 가지려 한다고 가정.
cf) D(오차한계) = 신뢰계수 * 표준오차
오차한계 = 모평균 추정구간의 가운데에서 허용할 최대허용오차
n≥D2Z2a/2∗σ2
2)모비율 추정시 표본의 크기
모집단의 추정에서 모비율을 모르고 있는 것이 일반적이다.
만약 모비율에 대해 대체적인 값을 알고 있으면 이를 이용하고, 불가능하다면 소규모의 예비조사로 대체적인 값을 구한다.
이값마저 알 수 없다면 p^=1/2를 사용하여 표본의 크기를 결정한다.
n≥p^(1−p^)(DZa/2)2
표본크기 결정요인
- 신뢰도
일정한 오차의 범위 내로 신뢰구간을 설정하고자 할 때 신뢰도에 의해서 Z나 t가 결정되기 때문에 신뢰도를 높일수록 표본의 크기는 커야한다.
- 표준편차
모집단의 분산 또는 표준편차가 클수록 표본의 크기는 커야한다.
- 오차의 크기
오차를 적게 하기를 원하면 표본의 크기를 크게 해야 한다.
1)모분산을 알고있을 경우
Xˉ−Za/2nσ≤u≤Xˉ+Za/2nσ
2)모분산을 모르는 대표본(n≥30)일 경우
Xˉ−Za/2nS≤u≤Xˉ+Za/2nS
3)모분산을 모르는 소표본(n<30)일 경우
소표본일 경우에는 정규분포가 아닌, 자유도가 N-1인 T분포가 된다.
Xˉ−ta/2nS≤u≤Xˉ+ta/2nS
1)모분산을 알고있을 경우
두 모집단의 분포가 정규분포를 하고, 모분산이 알려진 경우 Z통계량을 이용
(Xˉ1−Xˉ2)−Za/2n1σ12+n2σ22≤u1−u2≤(Xˉ1−Xˉ2)+Za/2n1σ12+n2σ22
2)모분산을 모르는 대표본(n≥30)일 경우
대포본이지만 두 모집단을 모르고 있을 경우, 모분산 대신 표본분산 사용
(Xˉ1−Xˉ2)−Za/2n1S12+n2S22≤u1−u2≤(Xˉ1−Xˉ2)+Za/2n1S12+n2S22
3)모분산을 모르는 소표본(n<30)일 경우
소표본에서 두 모분산을 모르지만 같다는 것을 알고 있을 경우 자유도가 n1+n2-2인 t분포 이용.
(Xˉ1−Xˉ2)−ta/2, n−1Spn1σ12+n1σ12≤u1−u2≤(Xˉ1−Xˉ2)+ta/2, n−1Spn1σ12+n1σ12 - 모비율 / 모비율 차이의 100(1-a)% 신뢰구간
1)모비율의 신뢰구간
모비율 p의 추정량은 표본비율이며 이항분포의 정규근사를 이용한 Z통계량을 이용한다.
p^−Za/2np^(1−p^)≤p≤p^+Za/2np^(1−p^)
2)두 모비율 차이의 신뢰구간
p^1−p^2−Za/2n1p1^(1−p1^)+n2p2^(1−p2^)≤p^1−p^2≤p^1−p^2+Za/2n1p1^(1−p1^)+n2p2^(1−p2^)
Uploaded by Notion2Tistory v1.1.0