誕生日のパラドックスとは、確率論の一般的な問題である。この問題は、特定の集団内で同じ誕生日を持つ人がいる確率に関するものである。直感的には、同じ誕生日を持つ人がいる確率は低いと思われがちだが、実際には驚くほど高いことが知られている。

誕生日のパラドックスは、次のように定式化される。n人の集団がいるとき、少なくとも2人が同じ誕生日を持つ確率を求める問題である。ここで、誕生日は無作為に選ばれるものとし、閏年は無視する。つまり、365日のうちから無作為に誕生日を選ぶと考える。

この問題の解決方法は、少なくとも2人が同じ誕生日を持つ確率の補集合、つまり全員が異なる誕生日を持つ確率を求めることである。全員の誕生日が異なる確率を計算した後、その補集合を求めることで、少なくとも2人が同じ誕生日を持つ確率が得られる。

n人の集団の全員が異なる誕生日を持つ確率は次のように計算できる。
P(全員異なる誕生日) = (365/365) * (364/365) * (363/365) * ... * (365-n+1)/365

ここで、最初の人が誕生日を持つ確率は365/365 = 1であり、2番目の人が1番目の人と異なる誕生日を持つ確率は364/365である。同様に、n番目の人が他の全員と異なる誕生日を持つ確率は(365-n+1)/365である。

全員が異なる誕生日を持つ確率が計算できたら、少なくとも2人が同じ誕生日を持つ確率を求めるために、その補集合を計算する。
P(少なくとも2人が同じ誕生日) = 1 - P(全員異なる誕生日)

この式を使って、n人の集団における少なくとも2人が同じ誕生日を持つ確率を計算できる。例えば、n = 23の場合、約50.7%の確率で少なくとも2人が同じ誕生日を持つことがわかる。これは意外にも、nがさらに増えると、その確率は急速に上昇する。たとえば、n = 30の場合、約70.6%の確率で少なくとも2人が同じ誕生日を持つことがわかる。そして、n = 57の場合、その確率は99%を超える。

この結果は直感に反するものであり、誕生日のパラドックスと呼ばれている。このパラドックスは、直感と統計的な事実の間のギャップを示す良い例である。誕生日のパラドックスは、確率論や統計学の教材でよく取り上げられ、直感に頼らずに統計的な分析を行う重要性を教えるものである。

また、誕生日のパラドックスは、暗号解読やハッシュ衝突(異なるデータが同じハッシュ値になる現象)の確率を評価する際にも役立つ。ハッシュ衝突の確率を理解することは、セキュリティ対策やアルゴリズムの設計において重要である。

誕生日のパラドックスは、直感に反する結果を示すことで、確率論や統計学における重要な教訓を提供している。このパラドックスを理解することで、統計的な分析に対する理解が深まり、より正確な評価や予測が可能となる。

リンク

The Birthday Problem[EN]