同時確率分布と周辺分布




1. 離散分布の場合

1. 同時確率分布

離散型確率変数 X Yがあり、それぞれが特定の値 x yを取る確率を考えます。

このとき、 X Yが同時に特定の値を取る確率を同時確率分布と呼び、次のように表されます。

\displaystyle{
f_{XY}(x, y) = P(X=x, Y=y)
}


確率分布なので、全ての可能な値の確率を合計すると、次のように 1になります。

\displaystyle{
\sum_{x=0}^{∞} \sum_{y=0}^{∞} f_{XY}(x, y) = 1
}


2. 周辺分布

周辺分布は、片方の変数に注目したときの確率分布です。

例えば、 Yの周辺分布は、 Xの値に関わらず Yが取りうる値の確率分布で次のように計算されます。

\displaystyle{
f_Y(y) = \sum_{x=0}^{∞} f_{XY}(x, y)
}


同様に、 Xの周辺分布も次のように計算されます。

\displaystyle{
f_X(x) = \sum_{y=0}^{∞}f_{XY}(x, y)
}


3. 期待値

 X Yで構成される関数を g(X, Y)としたとき、同時確率関数 f_{XY}(x, y)に関する期待値は次のように計算されます。

\displaystyle{
E[g(X, Y)] = \sum_{x=0}^{∞} \sum_{y=0}^{∞} g(x, y) f_{XY}(x,y)
}


 Xのみの関数 g(X)だった場合には、次のようになります。

\displaystyle{
\begin{align}
E[g(X)] &= \sum_{x=0}^{∞} \sum_{y=0}^{∞} g(x) f_{XY}(x,y) \\
&= \sum_{x=0}^{∞} g(x) \sum_{y=0}^{∞} f_{XY}(x,y) \\
&= \sum_{x=0}^{∞} g(x) f_X(x) \\
\end{align}
}




2. 連続分布の場合

1. 同時確率分布

連続型確率変数の場合、同時確率分布は、 X Yが特定の区間内に存在する確率密度関数 f_{XY}(x, y)を用いて表されます。

\displaystyle{
P(a \leq X \leq b, c \leq Y \leq d) = \int_{a}^{b} \int_{c}^{d} f_{XY}(x. y) dx dy
}


確率分布なので、全ての可能な値の確率を積分すると、次のように 1になります。

\displaystyle{
\int_{-∞}^{∞} \int_{-∞}^{∞} f_{XY}(x, y) dx dy = 1
}


2次元の累積分布関数は次のように計算されます。

\displaystyle{
\begin{align}
F_{XY}(x, y) &= P(X \leq x, Y \leq y) \\
&= \int_{-∞}^{x} \int_{-∞}^{y} f_{XY}(s, t) dt ds
\end{align}
}


同時確率分布と累積分布関数は次の関係が成り立ちます。

\displaystyle{
f_{XY}(x, y) = \frac{\partial^2}{\partial x \partial y}F_{XY}(x, y)
}


2. 周辺分布

連続型の場合、周辺分布も積分を用いて計算され、一方の変数を全範囲にわたって積分することで、もう一方の変数の確率密度関数を得ます。

 Yの周辺分布は次のように計算されます。

\displaystyle{
f_Y(y) = \int_{-∞}^{∞} f_{XY}(x, y) dx
}


 Xの周辺分布は次のように計算されます。

\displaystyle{
f_X(x) = \int_{-∞}^{∞} f_{XY}(x, y) dy
}


3. 期待値

 X Yで構成される関数を g(X, Y)としたとき、同時確率関数 f_{XY}(x, y)に関する期待値は次のように計算されます。

\displaystyle{
E[g(X, Y)] = \int_{-∞}^{∞} \int_{-∞}^{∞} g(x, y) f_{XY}(x, y) dxdy
}


 Xのみの関数 g(X)だった場合には、次のようになります。

\displaystyle{
\begin{align}
E[g(X)] &= \int_{-∞}^{∞} \int_{-∞}^{∞} g(x) f_{XY}(x, y) dxdy \\
&= \int_{-∞}^{∞} g(x) \int_{-∞}^{∞}  f_{XY}(x, y) dy dx \\
&= \int_{-∞}^{∞} g(x) f_X(x) dx
\end{align}
}




3. 確率変数の独立性

確率変数 X Yが独立である場合、これらの変数間には相互作用がないと考えられます。

このとき、次の条件が成立します。

\displaystyle{
f_{XY}(x, y) = f_X(x)・f_Y(y)
}


これは、 X Yの同時確率分布がそれぞれの周辺分布の積と等しいことを意味し、 X Yが互いに影響を及ぼさないことを示しています。




4. 例題

例題として、次の同時確率分布を使用して、いろいろ計算してみたいと思います。

\displaystyle{
f_{XY}(x, y) = \left\{
\begin{array}{ll}
8xy & (0 \leq x \leq 1 & and & 0 \leq y \leq 1) \\
0 & (otherwise)
\end{array}
\right.
}


1. Xの周辺分布​の計算

\displaystyle{
\begin{align}
f_X(x) &= \int_{0}^{1} f_{XY} (x, y) dy \\
&= \int_{0}^{1} 8xy\ dy \\
&= [4xy^2]^{1}_{0} \\
&= 4x
\end{align}
}


2. Yの周辺分布の計算

\displaystyle{
\begin{align}
f_Y(y) &= \int_{0}^{1} f_{XY} (x, y) dx \\
&= \int_{0}^{1} 8xy\ dx \\
&= [4x^2y]^{1}_{0} \\
&= 4y
\end{align}
}


3. E[XY]の計算

\displaystyle{
\begin{align}
E[XY] &= \int_{0}^{1} \int_{0}^{1} xy \ f_{XY}(x, y)\ dxdy \\
&= \int_{0}^{1} \int_{0}^{1} xy・8xy \ dxdy \\
&= \int_{0}^{1} \int_{0}^{1} 8x^2y^2 \ dxdy \\
&= \int_{0}^{1} [\frac{8}{3} x^2y^3]_{0}^{1} \ dx \\
&= \int_{0}^{1} \frac{8}{3} x^2 \ dx \\
&= [\frac{8}{9} x^3]_{0}^{1} \\
&= \frac{8}{9}
\end{align}
}


4. E[X]の計算

\displaystyle{
\begin{align}
E[X] &= \int_{-∞}^{∞} \int_{-∞}^{∞} x f_{XY}(x, y) dxdy \\
&= \int_{-∞}^{∞} x \int_{-∞}^{∞}  f_{XY}(x, y) dy dx \\
&= \int_{-∞}^{∞} x f_X(x) dx \\
&= \int_{-∞}^{∞} x・4x\ dx \\
&= \int_{-∞}^{∞} 4x^2\ dx \\
&= [\frac{4}{3} x^3]_{0}^{1} \\
&= \frac{4}{3}
\end{align}
}


5. E[Y]の計算

\displaystyle{
\begin{align}
E[Y] &= \int_{-∞}^{∞} \int_{-∞}^{∞} y f_{XY}(x, y) dxdy \\
&= \int_{-∞}^{∞} y \int_{-∞}^{∞}  f_{XY}(x, y) dy dx \\
&= \int_{-∞}^{∞} y f_Y(y) dy \\
&= \int_{-∞}^{∞} y・4y\ dy \\
&= \int_{-∞}^{∞} 4y^2\ dy \\
&= [\frac{4}{3} y^3]_{0}^{1} \\
&= \frac{4}{3}
\end{align}
}


6. 累積分布関数の計算

\displaystyle{
\begin{align}
F_{XY}(x, y) &= P(X \leq x, Y \leq y) \\
&= \int_{0}^{x} \int_{0}^{y} f_{XY}(s, t) dt ds \\
&= \int_{0}^{x} \int_{0}^{y} 8st\ dt ds \\
&= \int_{0}^{x} [4st^2]_{0}^{y} ds \\
&= \int_{0}^{x} 4sy^2 ds \\
&= [2s^2y^2]_{0}^{x} \\
&= 2x^2y^2
\end{align}
}