確率・統計

1．確率の基礎概念

1．1．確率とは？

確率（Probability）とは、ある事象の発生割合を表すものです。ここで出てくる事象とは何らかの行為によって得られた結果を意味し、試行はその行為自体を表します。例えば、サイコロを振る行為は試行であり、その結果偶数の目が出ることは事象に該当します。
さて、不正のないサイコロを振ると、どの目も1/6の確率で出現することを私たちは経験的に知っています。この当たり前の事実の裏には前提条件が存在しており、確率はその前提に基づき成り立っています。この前提条件をきちんと把握していないと確率の誤用を生み、最終的に「確率は役に立たない」といった間違った結論を導きだしてしまいます。そこで本節では、前提条件を含めた確率の成り立ちについて、簡単なコイントスの試行例を挙げながら迫ってみたいと思います。
完全に対称なコインで1回だけ試行する場合、表と裏のどちらが出るか？を予測するのは本来不可能です。それは、コイントスを行うときの力の入れ具合や、その後のコインの挙動、落ちた場所の状態等を完全に把握することは不可能なためです（もしできるなら力学的に予測可能です）。このような不確かな事象を偶然事象（ランダム事象）と呼びます。この試行を繰り返す場合を考えます。この時、それぞれの試行が関連性を持たない、つまり独立であることを前提とします。この場合、前の結果に影響されず、後の結果は各試行独自に決まります。仮に10回程度の試行なら、コインの表が出る割合は予測困難ですが、 100回、1,000回、・・・、極限まで増やすと、その確率は1/2になることを私たちは経験的に知っています。

図1.1－1　コイントスで表が出る確率（例）

このように独立試行の回数を極限まで増やせば、不確かな事象に何らかの規則性が現れてきます。言い方を変えれば、偶然性で支配されていたはずの事象が、気が付いたらいつの間にか必然性（規則性）に支配されていたことになります。これを大数の法則と呼びます。
実はこのとき、確率の捉え方が2通りあることに気づきます。 1つ目は、コインには表と裏の2つしかなく、さらには不正がないため、どちらかが必然的に現れるのはおかしく同じ割合で出現するはずだ、と捉える方法です。これを数学的確率と呼びます。数学的確率は表と裏、合計2つの場合の数に対しどちらか1つの場合が等しい割合でランダムに出現する、という「場合の数の比」で定義されます。 2つ目は、何度も繰り返し試行した結果、表と裏は同じ割合で出現する、という結果論で捉える方法です。これを経験的確率と呼びます。経験的確率は、大数の法則に基づき得られた事象の発生割合で定義されます。
以上の内容を踏まえ、確率を知る上で意識しておかなければならない重要なことは、以下の三点になります。

ランダム事象であること
独立試行であること
大数の法則に基づくこと

1．2．場合の数

前節で見たように、確率は場合の数を求めることから始まります。そこで本節では、さまざまな場合の数の求め方について見ていくことにします。

1．2．1．順列

順列とは、異なるn個のものから任意にr個を選んだときの並べ方の数です。 1個目を選ぶときは、n個の中から1個を選ぶのでn通り、2個目を選ぶときはn－1通り、・・・、 r個目を選ぶときはn－（r－1）通りとなり、次のように計算します。

1．2．2．重複順列

重複順列は、異なるn個のものから同じものを繰り返し選ぶことを許してr個を選んだ時の並べ方の数です。このとき毎回n通りの選び方があるので、次のように計算します。

この例としては、おみくじ選びが挙げられます。

1．2．3．円順列

円順列とは、異なるn個のものを円形に並べたときの並べ方の数で、特徴的なのは円形なので端がなく、全体を回転させると区別がつかないことにあります。そのため、先頭の位置となるn箇所分の区別がつかないため、次のように計算します。

図1.2.3－1　円環順列の例

1．2．4．組み合わせ

組み合わせは、異なるn個のものから順序を考慮せずにr個を選んだ組の数です。これは並べ方の数r!を考慮しないことを意味しており、（1.2.1－1）式をr!で割れば求められます。

なお、このnCrについては次の関係式が成り立ちます。

1．2．5．重複組み合わせ

重複組み合わせは、異なるn個のものから同じものを繰り返し選ぶことを許してr個を選んだ時の組の数です。この場合、n個のものを区別するために、仕切りが（n－1）個存在すると考えます。

ここで、繰り返しを許してr個のものを選び出すとき、下図の例のように、ものの違いがあるところに仕切りを入れてみます。

この図を白黒にしてみても、仕切りがあることから何色が何個あるかを識別できます。

これは結局のところ、下図のようにものと仕切りの合計n＋r－1個の枠に、r個のものの入れ方の数を求めればよく、

次の計算で求められます。

1．2．6．多項定理

場合の数を応用すると、（x＋y）ⁿの展開式を簡単に導き出すことができます。展開における最大の課題は、xⁱy^n－i（i＝0,1,2,…,n）の項の係数を求めることですが、

この係数は、各（x＋y）からxをi個選ぶ組み合わせの数_nC_iに等しくなります。
従って、（x＋y）ⁿの展開式は次のようになります。

この関係を二項定理と呼びます。さらにこの関係を多項式に展開すると次の関係式が得られ、これを多項定理と呼びます。

特に二項定理の各係数をうまく並べると、下図のようなパスカルの三角形と呼ばれる表現が可能になります。これは、上の階層の二つの数を足し合わせたものが下の階層の値になっていることを表しています。

図1.2.6－1　パスカルの三角形

この関係から、（1.4.2－2）式が直ちに導きすことができます。

1．3．確率の性質

1．3．1．集合との関係

確率は、集合の概念と密接につながっています。そこでまずは、集合の概念の中で確率に密接に結び付いたものの語彙について見ることにします。

用語	定義	例
試行	同一条件のもと繰り返すことができる実験や観察のこと	サイコロの目の出方を調べる行為
事象	試行の結果	「1の目が出た」とか「偶数の目が出た」という結果
根源事象	これ以上分割できない事象	「1の目が出た」～「6の目が出た」という事象
結合事象	二つ以上の根源事象を含むもの	「偶数の目が出た」とか「5以上の目が出た」という事象
標本空間	根源事象をすべて集めた集合	サイコロ：｛1,2,3,4,5,6｝コイントス：｛表,裏｝