検査の例
- Aさんは、ウイルスに感染している恐れがあるので、ウイルス検査を受けました。
- 一般にAさんの年代の人がウイルスに感染している確率(割合)は1%です。
- ウイルス検査の精度は95%です。
- つまり、感染している人に正しく「陽性反応」が出る確率は95%で、感染していない人に正しく「陰性反応」が出る確率も95%です。
- Aさんはウイルスに罹患していると結果がでました
- ではAさんがウイルスに罹患している確率は何%でしょうか?
問題の解き方
- 事前確率を定義
- 条件確率を定義
- 条件付き確率の結果を観測
- ありえない条件を消去
- 条件付き確率を正規化
- 事後確率(ベイズ逆確率)を算出
問題の解き方の例
事前確率は陽性は0.01, 陰性は0.09
条件付き確率は次の通り
- | 陽性(1%) | 陰性(99%) |
---|---|---|
陽性反応(95%) | TP=P(T,P) = 0.0095=0.01*0.95 | FP=P(F,P) = 0.9405=0.99*0.95 |
陰性反応(5%) | FN=P(F,N) = 0.0005=0.01*0.05 | TN=P(T,N) = 0.0495=0.99*0.05 |
無論確率全体では1になる
$$ \Omega = TP + FP + FN + TN = 0.0095 + 0.9405 + 0.0005 + 0.0495 = 1 $$
また、列で見ても100%になる
$$ 0.01 = 0.0095 + 0.0005 \\ 0.99 = 0.9405 + 0.0495 $$
陽性だと結果がでたので、FNとFPの確率は消えた。 よって、条件付き確率は次のようになる
- | 陽性(1%) | 陰性(99%) |
---|---|---|
陽性反応(95%) | TP = 0.0095=0.01*0.95) | FP =0 |
陰性反応(5%) | FN = 0 | TN =0.0495=0.99*0.05 |
表のセルの大きさを変えると、
全体で規格化(確率の総和が1になること)することが必要のため、TPの実際の確率を求める
$$ 1:x = TP+TN: TP \\ x*(TP+TN) = TP \\ x = TP / (TP+TN) \\ x = 0.0095 / (0.0095 + 0.0495) \\ x = 0.16101694915 \simeq 16 \% $$
つまり、95%が正しく陽性と出る検査でも、実際は16%の確率で本当の陽性となる ベイズの定理で示すと次になる。
$$ P(感染 \mid 陽性) = \frac{P(陽性, 感染)}{P(陽性, 感染)+P(陽性, 非感染)} = 0.16 $$
REFERENCES:
- https://enakai00.hatenablog.com/entry/2015/04/06/182708