事象と確率(確率の計算・統計的独立・条件付き確率・ベイズの定理・包助原理)




1. 確率の計算

確率は、ある事象が発生する可能性の度合いを数値で表したものです。

0から1までの値をとり、事象が絶対に起こらない場合は0、確実に起こる場合は1となります。

確率の計算は基本的に、ある事象が起こる場合の数を、全ての可能性の場合の数で割ることによって行います。


例えば、サイコロを投げたときに偶数が出る確率は、偶数の出る場合の数(2, 4, 6)が3つで、全ての可能性(1, 2, 3, 4, 5, 6)が6つなので、 \frac{3}{6} = \frac{1}{2} となります。




2. 統計的独立

二つの事象が統計的に独立であるとは、一方の事象が起こる確率が他方の事象が起こる確率に影響を与えないことを意味します。


事象 Aと事象 Bが独立である場合、事象Aが起こる確率は事象Bが起こる確率に依存せず、その逆も同様です。

数学的には、事象AとBが独立である場合、 P(A∩B)=P(A)P(B)が成り立ちます。


ここで、 P(A∩B)は事象 A Bが同時に起こる確率です。




3. 条件付き確率

条件付き確率は、ある事象 Bが起こったという条件のもとで、別の事象 Aが起こる確率です。

条件付き確率は次のように計算されます。

\displaystyle{
\begin{align}
P(A|B) = \frac{P(A \cap B)}{P(B)}
\end{align}
}


ここで、それぞれ次のように定義されています。

  •  P(A|B):事象 Bが起こったという条件のもとで事象 Aが起こる確率
  •  P(A∩B):事象 A Bが同時に起こる確率
  •  P(B):事象 Bが起こる確率




4. ベイズの定理

1. 定義

ベイズの定理は、ある条件のもとでの事象の確率を、他の条件のもとでの事象の確率から求めるための定理です。


ベイズの定理は次のように定義されます。

\displaystyle{
\begin{align}
P(A|B) &= \frac{P(B|A)P(A)}{P(B)} \\
&= \frac{P(B|A)P(A)}{P(B|A)P(A) + P(B|A^c)P(A^c)}
\end{align}
}


事象 Bが観測されたときに事象 Aが起こる確率を、事象 Aが起こる確率と事象 Aが起こったときに B​が観測される確率から求めることができます。

 P(A) Aの事前確率と呼び、 P(A|B)を事後確率と呼びます。


ここで、全事象 \Omegaが排反な事象 A_1,A_2,...A_k​の和である場合は、次のように拡張して表現されます。

\displaystyle{
\Omega = A_1 \cup ・・・\cup A_k \\
A_i \cap A_j = \emptyset (i \neq j)
}


\displaystyle{
\begin{align}
P(A_i | B) = \frac{P(B|A_i)P(A_i)}{\sum_{j=1}^{k} P(B|A_j)P(A_j)}
\end{align}
}


2. 練習問題

ベイズの定理は数式だけ見ていても、よくわからないと思うので練習問題を通して理解を深めましょう。


  • 問題

    ある工場で3種類の機械 A,  B,  Cが製品を製造しています。機械 A,  B,  Cがそれぞれ全生産の40%, 35%, 25%を担当しており、それぞれの機械から不良品が出る確率は次のとおりです。

    • 機械 Aからの不良品の確率は5%
    • 機械 Bからの不良品の確率は4%
    • 機械 Cからの不良品の確率は2%


    ランダムに選んだ製品が不良品だった場合、その製品が機械 Aから製造された確率は何%ですか?


  • 解説

    1. 問題の条件の整理

      • 機械 Aが製造する製品の割合: P(A) = 0.4
      • 機械 Bが製造する製品の割合: P(B) = 0.35
      • 機械 Cが製造する製品の割合: P(C) = 0.25


      • 機械 Aからの不良品の確率: P(不良品|A) = 0.05
      • 機械 Bからの不良品の確率: P(不良品|B) = 0.04
      • 機械 Cからの不良品の確率: P(不良品|C) = 0.02


      問題で問われている「ランダムに選んだ製品が不良品だった場合、その製品が機械 Aから製造された確率は何%ですか?」は、 P(A|不良品)を求めることになります。


    2. ベイズの定理に適用

      ベイズの定理を適用させます。

\displaystyle{
\begin{align}
P(A|不良品) &= \frac{P(不良品|A)P(A)}{P(不良品|A)P(A)+P(不良品|B)P(B)+P(不良品|C)P(C)} \\
&= \frac{0.05*0.4}{0.05*0.4 + 0.04*0.35 + 0.02*0.25} \\
&= 0.51
\end{align}
}


以上より、ランダムに選んだ製品が不良品だった場合、その製品が機械 Aから製造された確率は51%となります。




5. 包助原理

包助原理は、複数の事象の和事象の確率を計算する際に用いられる原理で、事象の重複を適切に処理する方法です。


2つの事象 A Bに対して、次のようになります。

\displaystyle{
P(A \cup B)=P(A)+P(B)−P(A \cap B)
}


3つの事象 A,  B,  Cに対して、次のようになります。

\displaystyle{
P(A \cup B \cup C) = P(A) + P(B) + P(C) - P(A \cap B) - P(A \cap C) - P(B \cap C) + P(A \cap B \cap C)
}