検査の例

  • Aさんは、ウイルスに感染している恐れがあるので、ウイルス検査を受けました。
  • 一般にAさんの年代の人がウイルスに感染している確率(割合)は1%です。
  • ウイルス検査の精度は95%です。
  • つまり、感染している人に正しく「陽性反応」が出る確率は95%で、感染していない人に正しく「陰性反応」が出る確率も95%です。
  • Aさんはウイルスに罹患していると結果がでました
  • ではAさんがウイルスに罹患している確率は何%でしょうか?

問題の解き方

  1. 事前確率を定義
  2. 条件確率を定義
  3. 条件付き確率の結果を観測
  4. ありえない条件を消去
  5. 条件付き確率を正規化
  6. 事後確率(ベイズ逆確率)を算出

問題の解き方の例

事前確率は陽性は0.01, 陰性は0.09

条件付き確率は次の通り

-陽性(1%)陰性(99%)
陽性反応(95%)TP=P(T,P) = 0.0095=0.01*0.95FP=P(F,P) = 0.9405=0.99*0.95
陰性反応(5%)FN=P(F,N) = 0.0005=0.01*0.05TN=P(T,N) = 0.0495=0.99*0.05

無論確率全体では1になる

$$ \Omega = TP + FP + FN + TN = 0.0095 + 0.9405 + 0.0005 + 0.0495 = 1 $$

また、列で見ても100%になる

$$ 0.01 = 0.0095 + 0.0005 \\ 0.99 = 0.9405 + 0.0495 $$

陽性だと結果がでたので、FNとFPの確率は消えた。 よって、条件付き確率は次のようになる

-陽性(1%)陰性(99%)
陽性反応(95%)TP = 0.0095=0.01*0.95)FP =0
陰性反応(5%)FN = 0TN =0.0495=0.99*0.05

表のセルの大きさを変えると、

全体で規格化(確率の総和が1になること)することが必要のため、TPの実際の確率を求める

$$ 1:x = TP+TN: TP \\ x*(TP+TN) = TP \\ x = TP / (TP+TN) \\ x = 0.0095 / (0.0095 + 0.0495) \\ x = 0.16101694915 \simeq 16 \% $$

つまり、95%が正しく陽性と出る検査でも、実際は16%の確率で本当の陽性となる ベイズの定理で示すと次になる。

$$ P(感染 \mid 陽性) = \frac{P(陽性, 感染)}{P(陽性, 感染)+P(陽性, 非感染)} = 0.16 $$

REFERENCES:

  • https://enakai00.hatenablog.com/entry/2015/04/06/182708