確率質量関数と確率密度関数




1. 確率変数

ある確率に基づいた試行の結果により値が定まるような変数を確率変数と言います。


サイコロの投げられる実験を例に考えてみましょう。

サイコロを1回投げると、1から6までの目が出る可能性があります。

この時、サイコロの目を確率変数 Xとします。

したがって、 Xは1, 2, 3, 4, 5, 6のいずれかの値を取ることができる確率変数となります。

また、1, 2, 3, 4, 5, 6は確率変数 Xの実現値と呼び、小文字の xで表します。


確率変数 Xが実現値 xを取る確率は次のように表します。

\displaystyle{
p(x) = P(X=x)
}


これを確率変数 Xの確率関数と呼びます。




2. 離散型確率変数と確率質量関数

離散型確率変数は、カウント可能な値を取る確率変数です。

これは、値が個別で離散的な範囲に限定される場合に適用されます。

例えば、サイコロの目の数、ある期間内に発生する事故の数、クラスにいる生徒の数などが該当します。


確率質量関数は次のように定義されます。

\displaystyle{
f_X(x) = P(X=x)
}


離散型確率変数が取りうる全ての値に対する確率の合計は1になります。

\displaystyle{
\sum_{k=1}^{∞} f_X(x_k) = 1
}




3. 連続型確率変数と確率密度関数

連続型確率変数は、ある区間内の任意の値を取ることができる確率変数です。

これは、測定値が連続的な範囲にわたる場合(例えば、温度、距離、時間など)に適用されます。


連続型確率変数の性質上、特定の単一値を取る確率は0となります。

これは、連続型データが無限に密な値を取り得るため、任意の特定の点の確率を考えるよりも、値の範囲(区間)における確率を考えることが一般的です。

連続型確率変数の確率は、確率密度関数によって表され、特定の区間内の確率は、この関数をその区間積分することによって求められます。


連続型確率変数を X X確率密度関数 f(x)とした場合、 Xがある区間 [a, b] 内の値を取る確率は次の積分によって与えられます。

\displaystyle{
P(a \leq X \leq b) = \int_{a}^{b} f(x) dx
}


確率密度関数の全範囲にわたる積分は1になります。

\displaystyle{
\int_{-∞}^{∞} f(x) dx = 1
}


 Xが連続型のときは、 P(X=a) = P(a \leq X \leq a) = 0となるので、次の式が成り立ちます、

\displaystyle{
\begin{align}
P(a \leq X \leq b) &= P(a < X < b) \\
&= P(a < X \leq b) \\
&= P(a \leq X < b)
\end{align}
}