型 I 错误、型 II 错误与 p 值

  • 2020-06-27

假设检定是先对母体參數提出假设,然后利用样本的资讯,再决定是否接受或否决该假设;而在进行假说检定的决策时,可能会犯两种错误(表一):

一、型 I 错误 (Type I Error):

若 \(\mathrm{H_0}\)(虚无假说)为真,但结论却否决 \(\mathrm{H_0}\),则犯了第一型错误,而称犯第一型错误的机率为第一型错误率 (Type I Error Rate),其发生的机率以 \(\alpha\) 表示,或称显着水準 (significant level)。

二、型 II 错误 (Type II Error):

若 \(\mathrm{H_1}\)(对立假说)为真,但结论却接受 \(\mathrm{H_0}\),则犯了第二型错误,而称犯第二型错误的机率为第二型错误率 (Type II Error Rate),其发生的机率以 \(\beta\) 表示。另外,统计上常称 \(1-\beta\) 为检定力 (Power)(图一)。

事实 (Truth)决策 (Decision)\(\mathrm{H_0}\) 为真\(\mathrm{H_1}\) 为真无法弃却

\(\mathrm{H_0}\)

(Fail to reject \(\mathrm{H_0}\))决策正确

\(1 -\alpha\)型 II 错误

\(\beta\)

(Type II Error)弃却

\(\mathrm{H_0}\)

(Reject \(\mathrm{H_0}\))型 I 错误

\(\alpha\)

(Type I Error)决策正确

\(1-\beta\)

表一、型 I 错误与型 II 错误概念表。(本文作者陈丘原製)

型 I 与型 II 错误若干性质如下:首先,\(\alpha\) 与 \(\beta\) 互为拮抗,亦即 \(\alpha\) 提高时、\(\beta\) 降低;反之亦然。统计学上认为犯型 I 错误的后果相当严重,因此一般希望能将其发生的机率 \((\alpha)\) 控制在一定的程度 \((0.05~or~0.01)\)。当固定 \(\alpha\) 时,可透过增加样本数达到降低 \(\beta\) 的目的。

型 I 错误、型 II 错误与 p 值

图一、型 I 错误与型 II 错误示意图(图片来源:参考文献 1)

另外,在进行假说检定时,p 值 (p – value) 也是一种帮助我们下决策的指标;p 值的定义为: 在 \(\mathrm{H_0}\)(虚无假说)成立的情况下,检定统计量的取样分布中往 \(\mathrm{H_1}\) 方向超过或等于实际观测到之检定统计量值的尾端机率(图二灰色部分)。p – value 可用来在任何显着水準下作检定,若 p – value \(\le \alpha\) 决策为弃却 \(\mathrm{H_0}\);若 p – value \(>\alpha\) 决策为在 \(\alpha\) 的显着水準下,不弃却 \(\mathrm{H_0}\)。

型 I 错误、型 II 错误与 p 值

图二、p 值示意图。(本文作者陈丘原绘)

p 值应用在假设检定之决策範例

一、某公司想了解在鸡饲料中加入鱼骨粉后,对鸡每月平均产蛋量是否提高。以一般饲料餵食每只鸡之每月平均产蛋量为 \(\mu_0=20\) 个,标準偏差 \(\sigma=9\)。今试验 \(100\) 只鸡,把鱼骨粉加入饲料中餵食后,每只鸡之每月平均产蛋量为 \(\overline{X}=25\),试问添加鱼骨粉是否能提升鸡只产蛋量?

根据题意,其虚无假说 \(\mathrm{(H_0)}\) 及对立假说 \(\mathrm{(H_1)}\) 分别为:

\(\mathrm{H_0}:\mu=20\)

\(\mathrm{H_1}:\mu>20\)

若订定显着水準 \(\alpha = 0.05\),并计算检定统计量(Z 值)为

\(\displaystyle Z_0=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}=\frac{25-20}{9/\sqrt{100}}=5.5556\)

假设以上 \(Z_0\) 统计量服从标準常态分布,则此检定的 p 值为任一标準常态分布的随机变数 \(Z\) 「大于或等于 \(Z_0\)」(往 \(\mathrm{H_1}\) 方向超过或等于实际观测到之检定统计量值)的机率(图三):

p-value \(= P(Z > 5.5556) = 1.38\times 10^{-8}< 0.05\)

型 I 错误、型 II 错误与 p 值

图三、单尾检定及p值示意图。(本文作者陈丘原绘)

因此,本检定应拒绝 \(\mathrm{H_0}\),即添加鱼骨粉的确能提升鸡只产蛋量。

二、某计程车公司有一整队车辆,过去几年的纪录是平均每辆车每个月行驶距离为 \(2500\) 英里。今欲检定目前每辆车每个月行驶的英里数是否不同于过去的 \(2500\) 英里,于是随机取样 \(n = 40\) 辆车,记录其目前每辆车每个月行驶的英里数,加以平均得 \(\overline{y}=2750\) 英里(已知族群标準差维持在 \(\sigma=350\) 英里)。

根据题意,其虚无假说 \(\mathrm{(H_0)}\) 及对立假说 \(\mathrm{(H_1)}\)分别为:

\(\mathrm{H_0}:\mu=2500\)

\(\mathrm{H_1}:\mu\ne 2500\)

若订定显着水準 \(\alpha = 0.05\),并计算检定统计量(Z 值)为

\(\displaystyle Z_0=\frac{\overline{y}-\mu_0}{\sigma/\sqrt{n}}=\frac{2750-2500}{350/\sqrt{40}}=4.5175\)

假设以上 \(Z_0\) 统计量服从标準常态分布,则此检定的 p 值为任一标準常态分布的随机变数 Z「等于 \(Z_0\)」、「大于 \(Z_0\)」或「小于 \(-Z_0\)」(往 \(\mathrm{H_1}\) 方向超过或等于实际观测到之检定统计量值)的机率(图四):

型 I 错误、型 II 错误与 p 值

图四、双尾检定及 p 值示意图(本文作者陈丘原绘)

\( \begin{array}{cl}
\text{p-value} & =P(Z\ge 4.5175)+P(Z\le -4.5175) \\
&= 2\times P(Z\ge 4.5175)\text{(标準常态分布以零为中心、左右对称)}\\
&= 6.26\times 10^{-6}<0.05
\end{array} \)

因此,本检定应拒绝 \(\mathrm{H_0}\),即目前每辆车每个月行驶的英里数不同于过去的 \(2500\) 英里。


参考文献



上一篇: 下一篇:

相关文章

资讯

推荐阅读

本周热文