秘書問題（お見合い問題）

学習のポイント

ｎ人の候補者と順次に面接して、即座に採否を決定する場合、最初の数名は採用を見送り、以降の面接では、以前の候補者と比較して採否を決定するという戦略があります。
　典型的な最適停止問題です。お見合い問題、結婚問題とも呼ばれます。

このような問題は、１９７０年代に注目され、その後、多様な分野に適用され拡大されてきました。２００９年、鳩山由紀夫氏が首相になったとき、氏が教職時代に書いた論文「見合いの数理」が話題になりました。

キーワード

秘書問題、最適停止問題、お見合い問題、結婚問題、１／ｅ、３７％の法則

秘書問題の定義

条件

必ず１人の秘書を採用する。
候補者数（すなわち最大面接回数）ｎは事前に決められている。
面接の直後に採否を決定する。
（ｎ－１回まで採用しなかったときは、ｎ番目の候補者を無条件で採用する）
候補者側は、採用拒否をしない。採用が決まった時点で終了する。
（この条件により、「お見合い問題」や「結婚問題」というのは不適切？）
過去に遡って不採用にした候補者を採用することはできない。
評価基準は決まっており、同順位の候補者は存在しない。
（候補者を同時に評価すれば、第１順位、第２順位～第ｎ順位をつけることができる）
どの順番で、どの順位の候補者が現れるかはわからない。

ゲーム

「条件」のゲームをしましょう。２０名の候補者がいます。各人の評価はあらかじめ乱数により与えられ、それにより絶対順位が付けられていますが、あなたはそれを知りません。あなたがわかるのは、それまでに採用しなかった候補者のうちでの暫定順位だけです。候補者が入室するたびに、選択ダイアログが表示され、採用（ＯＫ）／不採用（キャンセル）をクリックします。採用したときにゲームが終了し、その候補者の絶対順位が表示されます。
　絶対順位が上位の候補者を採用できる戦略を考えてください。

繰り返し実行できます。そのたびに候補者の順番が変わります。

最適化戦略

何をもって「最適」とするかにより、異なる２つの問題になります。

最良選択問題
第１順位の候補者が得られる確率を最大にする戦略
順位最小化問題
第１順位を１、第２順位を２・・・としたとき、採用する候補者の順位の期待値を最小にする戦略

興味のある結果

理論は後回しにして、興味のある結果を掲げます。

候補者が２０人（n=20）の場合
　　　　　　最良選択問題　　　順位最小化問題
　面接回数　順位１の人を　　　採用する過去候
　　　　　　採用できる確率　　補者での暫定順位
　　 1　　　　　0.0500　　　　見送り（不採用）
　　 2　　　　　0.1774　　　　　：
　　 3　　　　　0.2548　　　　　：
　　 4　　　　　0.3072　　　　　：
　　 5　　　　　0.3429　　　　　：
　　 6　　　　　0.3661　　　　１位なら採用
　　 7　　　　　0.3793　　　　　：
　　 8　　　　　0.3842(最大)　　：
　　 9　　　　　0.3820　　　　　：
　　10　　　　　0.3735　　　　　：
　　11　　　　　0.3594　　　　２位以内なら採用
　　12　　　　　0.3403　　　　　：
　　13　　　　　0.3167　　　　　：
　　14　　　　　0.2889　　　　３位以内なら採用
　　15　　　　　0.2573　　　　　：
　　16　　　　　0.2221　　　　４位以内なら採用
　　17　　　　　0.1836　　　　５位以内なら採用
　　18　　　　　0.1420　　　　７位以内なら採用
　　19　　　　　0.0974　　　１０位以内なら採用
　　20　　　　　0.0500　　　　無条件で採用

最良選択問題では、７回までは無条件で不採用にし（見送り）、８回以降は、それまでに不採用にした人との比較で（暫定順位が）１位ならば採用、そうでなければ不採用にして、次回の面接を行うのが最適である。
この「８」回の値は、ｎの大きさに関係なく、ｎ×３７％で与えれれる。
　正確にはｎ／ｅ、ｅ＝２.７１８（自然対数の低）
そのときの確率は、ｎが大きくなると、１／ｅに近づく。
順位最小化問題では、次の３期にわけられる。
　　初期：ほぼn/4回まで。ともかく見送る。最良選択問題より短い
　　中期：ほぼn/2回まで。暫定順位が１位なら採用
　　後期：後半。次第にレベルを下げる。
（後半の順位が緩くなるのは、不採用者が増えるからでもある。）
この方法によれば、ｎが大きいときには、期待値は３.８７に近づく。
すなわち、ｎによらず順位の期待値は４位以内となる。

任意のnでの計算には、末尾に「計算プログラム」があります。

最良選択問題

最良の（順位１）の候補者を採用できる確率の最大化

問題の理解

現在の面接をｒ番目の面接だとします。これまでにｒ－１人の候補者と面接して不採用にしました。ｒ番目の面接者が、不採用にした候補者より評価が高ければ（順位が最小ならば）採用して面接を完了、そうでなければこの候補者も不採用にして、次の候補者と面接するという方法をとります。
　このとき、最も評価の高い（順位１）の候補者をＡとします。「Ａを採用する確率を最大にするには、最初の見送る回数ｒ－１をいくつにすればよいか」という問題です。

話を単純にするため、ｎ＝５とし、順位１の候補者をＡ、順位２をＢ、～、順位５をＥとします。

ｒ＝１：最初の面接にきた候補者を採用する。
Ａが最初にくる確率は、Ｐ(1)＝１／ｎ＝１／５＝０.２です。
ｒ＝５：最後まで待つ。
Ａが最後にくる確率も、Ｐ(5)＝１／ｎ＝１／５＝０.２になります。
（すでに不採用にした４人のなかにＡもいると考えるのが常識的でしょう）
ｒ＝２：１人Ｘが不採用になっています。現在の面接者がＸより良ければ採用します。
- Ｘ＝Ａの場合
  面接者を含む残りの４人にはＡはいません。すべて不成功。確率＝０
- Ｘ＝Ｂの場合
  残りの４人のうち、Ａ以外ならばＢよりも劣るので不採用を続けていけば、いつかはＡがくるので、かならず成功します。確率＝１
- Ｘ＝Ｃの場合
  残りの４人のうち、採用されるのは、ＡかＢのどちらかです。Ａが先にくれば成功、Ｂが先にくれば不成功です。確率＝１／２
- Ｘ＝Ｄの場合
  Ａ～Ｃの３人のうち、Ａが最初にくれば成功。確率＝１／３
- Ｘ＝Ｅの場合
  Ａ～Ｄの４人のうち、Ａが最初にくれば成功。確率＝１／４
Ｘ＝Ａ～Ｘ＝Ｅである確率はすべて１／５ですから、ｒ＝２のときに成功する確率は、
　　Ｐ(2)＝(1/5)×(0 + 1 + 1/2 + 1/3 + 1/4)＝0.4167
となります。これは、Ｐ(1)、Ｐ(5)より大です。

　このようにして、Ｐ(r) (r＝１～n）を求め、それが最大になるｒを求める問題なのです。
　すなわち、面接回数ｒと、面接したｒ人での最良の順位ｓだけから、成功確率Ｐ(r) を計算して、Ｐ(r) が最大となるｒを求める問題だと理解できます。

定式化

ｎ人の候補者からｒ人の候補者と面接したとき、順位１の候補者が得られる確率Ｐ(r) を求める手順を考えます。

先に不採用にしたｒ－１人のうち、最良の順位をｓとします。
そのｒ-１人のなかにＡがいない確率は(r-1)/nです。
現在面接している人を含めて、残っている候補者のうち、ｓよりも順位がよい候補者はｎ－ｓ人ですから、現在面接している人がＡである確率は1/(n-s)です。
　すなわち、ｒ－１人のうち最良の順位がｓで、ｒ番目の面接者がＡである確率p(r,s)は、
　　　p(r,s)＝(r-1)/n×1/(n-s)
となります。
　ｓの範囲はｒ－１≦ｓ≦ｎですから、
　　Ｐ(r)＝p(r,r-1) + p(r,r) + p(r,r+1) + ・・・ + p(r,n)
となります。
　これから、次の公式が得られます。

ｎ人の候補者からｒ人の候補者と面接したとき、順位１の候補者が得られる確率Ｐ(r) は、
　　　Ｐ(r)＝ (r-1)/n ×｛1/(r-1) + 1/(r) + ・・・ + 1/(n-1)}　　　・・・公式１
　　　Ｐ(1)＝ 1/n

ｎ＝５、１０、２０　のときのＰ(r) の表を掲げます。(*)は最大値
　　 r　　　　n=5　　　　n=10　　　　n=20
　　 1　　　0.2000　　　0.1000　　　0.0500
　　 2　　　0.4167　　　0.2829　　　0.1774
　　 3　　　0.4333(*) 　0.3658　　　0.2548
　　 4　　　0.3500　　　0.3987(*) 　0.3072
　　 5　　　0.2000　　　0.3983　　　0.3429
　　 6　　　　　　　　　0.3728　　　0.3661
　　 7　　　　　　　　　0.3274　　　0.3793
　　 8　　　　　　　　　0.2653　　　0.3842(*)
　　 9　　　　　　　　　0.1889　　　0.3820
　　10　　　　　　　　　0.1000　　　0.3735
　　11　　　　　　　　　　　　　　　0.3594
　　12　　　　　　　　　　　　　　　0.3403
　　13　　　　　　　　　　　　　　　0.3167
　　14　　　　　　　　　　　　　　　0.2889
　　15　　　　　　　　　　　　　　　0.2573
　　16　　　　　　　　　　　　　　　0.2221
　　17　　　　　　　　　　　　　　　0.1836
　　18　　　　　　　　　　　　　　　0.1420
　　19　　　　　　　　　　　　　　　0.0974
　　20　　　　　　　　　　　　　　　0.0500

最大化

公式１は、次のように変形できます。
　　Ｐ(r)＝　1/n×｛1 + (r-1)/(r) + ・・・ + (r-1)/(n-1)}
ｒ→r+1 では、　　Ｐ(r+1)＝ 1/n×｛　　　r/(r)　 + ・・・ + r/(n-1)}
従って、
　　Ｐ(r+1)－Ｐ(r)＝1/n×｛-1 + 1/r + 1/(r+1) + ・・・ + 1/(n-1)}
となります。
　最大にするｒとは、Ｐ(r+1)＜Ｐ(r)　となる直前のｒですから、
　　1/r + 1/(r+1) + ・・・ + 1/(n-1)　＜１
となるｒを求めることになります。

ここで、ｎが十分大きいときには、

となります（ｅは自然対数の低で、ｅ＝２.７１８、１／ｅ＝０.３６７９　です）。

ｎ人の候補者から順位１の候補者が得られる確率Ｐ(r) を最大にするｒは、
　　　ｒ＝ｎ／ｅ　（小数点以下切り上げ）　　　・・・公式２
　　　　　　ｅ＝２.７１８（自然対数の低）
である。

すなわち、最初のｒ－１＝ｎ／ｅ≒０.３７（小数点以下切り捨て）回は、見送って不採用にし、ｒ回以降は、不採用にしたｒ－１人よりもよい候補者がきたら採用するという戦略をとるのが最適だということになります（３７％の法則）。
　ｎ＝５、１０、２０　のときを計算すると、それぞれｒ＝２、４、８となります。ｎ＝５のときは「ｎが十分に大き」くないのでずれがありますが、ｎ＝１０、２０のときは、上の数表と一致しています。

なお、Ｐ(r) の最大値は、ｎが大きくなるにつれ減少し、ｎ→∞で１／ｅに収斂します。

順位最小化問題

最良選択問題では、順位１の候補者だけを対象にしましたが、順位最小化問題では、第１順位を１、第２順位を２・・・としたとき、採用する候補者の順位の期待値を最小にすることを目的にします。「最良の人でなくても、なるべく優れた人を採用したい」という目的です。

当初は、最良選択問題と同様に見送るでしょう。中段では、まだ順位１の候補者を求めることができましょう。ｓ＝１なら採用するというのが最適でしょう。ところが、後段になると、優れた人を不採用しているので、不採用の人よりも劣っていても仕方がないことになります。

すでにr-1人の候補者を不採用にしており、ｒ番目の候補者Ａと面接している。不採用者と比較したＡの暫定的な順位をｓとするとき、ｓがどれだけ以下ならば採用（ｓより大ならば不採用として次の面接を行う）のが最適な戦略になるかという問題になります。

問題の定式化

ｎ人の候補者のうち、ｒ（≦n-1）人を不採用にしているとき、最終的に採用する人の順位の期待値をα(r) とします。
　ｒ＝ｎ－１のときは、最後の候補者を無条件で採用します。その期待値は１～ｎの平均値ですから、
　　α(n-1)＝(n+1)/2
になります。

ｒ＜n-1について考えます。ｒ番目の候補者をＡとします。
　Ａおよびこれまで不採用にしてきた候補者のなかでのＡの暫定順位をｓとして、例えばｓ≦５ならば採用、ｓ＞５ならば不採用として、次回の面接に期待するという戦略をたてることにします。
このときの最良の戦略は、
　　Ａを採用したときの順位の期待値＋Ａを採用しないときの順位の期待値
を最小にするｓを決めることです、
　ｓを厳しくしてそれにかなう候補者が現れれば、期待値は小さくなりますが、そのような候補者が出現する確率は低いでしょう。

候補者全員ｎのなかでのＡの真の順位の平均は (n+1)/2 で、Ａを含めたｒのなかでのＡの暫定順位の平均は (r+1)/2 ですから、Ａを採用したときの真の順位の期待値は、 s*(n+1)/(r+1) となります。
　それで、ｓ以内であれば採用するならば、Ａを採用したときの期待値は
　　　(1*(n+1)/(r+1) + 2*(n+1)/(r+1) + ・・・ + s*(n+1)/(r+1))/r
　　　＝(s/r)*(n+1)/(r+1)*(s+1)/2
　ｓ以内でなければ採用しないとすれば、Ａを採用しない確率は (r-s)/r で、そのときは次回の面接での期待値が得られるのですから、この時点での期待値は (r-s)/r*α(r) です。

これから次の公式が得られます。
　ｎ人の候補者があり、ｒ回目の候補者Ａの暫定順位がｓ以内ならば採用するとしたとき、最終的に採用した候補者の順位の期待値Ｅ(r,s)は、次の漸化式で与えられる。
　　Ｅ(r.s)＝(s/r)*(s+1)/(r+1)*(n+1)/2 + (r-s)/r*α(r),　α(n-1)＝(n+1)/2
そして、Ｅ(r.s)を最小とするｓ^*(r) が、Ａの採否の最適基準であり、ｓ=^*(r) での
　　α(r-1)＝(s/r)*(s+1)/(r+1)*(n+1)/2 + (r-s)/r*α(r)
が最適決定を続けたときの候補者の順位の期待値となる。　　　・・・公式３

このように、ｒ＝ｎ→１　の逆順に、最適設定を繰り返すことにより、全体の最適化を図る技法を「動的計画法」といいます。

探索範囲の効率化

α(n-1) = (n+1)/2 なのですから、r=n-1（最終面接）のときのＡの最適暫定順位ｓ^*(r) は
　　ｓ^*(n-1) ≦ (n+1)/2
になるはずです。
例えば、１８回目で順位が５位以内を採用としたとき、１７回目で６位の候補者を選ぶのは不適切です。
　　ｓ^*(r-1) ≦ ｓ^*(r-1)
になります。
また、１８回目でのｓ^*が５だとしたとき、１７回目でのｓ^*が急に２になるというのは不自然です。ｓの大きいほうから計算するのが得策です。
Ｅ(r,s) は、ｓに関して単調増加、あるいは一つの谷がある曲線になります。ｓを大きいほうから計算していき、増加に転じる直前のｓがｓ^*(r) になります。
ｒが小さくなるにつれて、ｓ^*(r) が小さくなり、α(r-1) の値も小さくなります。r=n/2付近になると１になります。さらに小さくなる（r=n/4付近）と、α(r-1) ＞ α(r) になります。
　これは、ｓ＝１ですら採用しないほうがよいことを示しています。すなわち「初期の面接では無条件で不採用にする（見送りをする）のがよい」ことを示しています。
α(r-1) ＞ α(r)になったら、それ以降のｒについて計算する必要はありません。

数値例

ｎ＝２０とします。
α(n-1)＝α(19)＝(n+1)/2＝10.5

ｒ＝１９のとき
　　ｓ　s/r*(s+1)/(r+1)*(n+1)/2　(r-s)/r*α(r)　　Ｅ(r,s)
　　11　　　　　　　3.647　　　　　4.421　　　　　8.068
　　10　最適　　　　3.039　　　　　4.974　　　　　8.013　最小→α(18)
　　 9　　　　　　　2.489　　　　　5.526　　　　　8.013
　　 8　　　　　　　1.989　　　　　6.079　　　　　8.068
　　 7　　　　　　　1.547　　　　　6.632　　　　　8.179
　すなわち、１９回目の面接では、Ａの暫定順位が１０位以内ならば採用するのが最適であり（s 　ｓ＝９でも最小値になっており、どちらでもよいのですが、緩やかにしたほうが、面接回数を減らせるので、ｓ＝１０にしました。
　ｓ＝１１は不要なのですが、参考として計算しました。Ｅは大きくなっており、そこまで緩やかにするのは不利なことを示しています。

ｒ＝１８のとき
α(18)＝8.013 なので、ｓ≦８を探せばよいことになります。
　　ｓ　　Ｅ(r,s)
　　８　　6.662
　　７　　6.616　最小　α(17)
　　６　　6.632
１８回の面接では、Ａの暫定順位が７位以内なら採用し（s^*(19)＝10）、そのときの順位期待値は 6.616（α(17)＝ 6.616）になります。

以下同様にして
　　ｒ　ｓ^*(r) α(r-1)
　　17　　5　　5.700
　　16　　4　　5.047
　　15　　3　　4.562
　　14　　3　　4.185
　　13　　2　　3.887
　　12　　2　　3.643
　　11　　2　　3.458
　　10　　1　　3.303
　　 9　　1　　3.169
　　 8　　1　　3.065
　　 7　　1　　3.002
　　 6　　1　　3.0017

ｒ＝５のとき
　　α(5)＝Ｅ(5,1)＝3.101 ＞ 3.0017＝α(6)
になってしまいました。最も厳しい条件、ｓ＝１としても、採用せずに次回面接を待ったほうがよいという結果です。
　ｒ＝４以降が、すべてこの結果になるのは明白で、ここで計算が終了します。

この数値例は、前述のの「興味のある結果」と一致しています。

αの最小値は、α(6)＝3.0017 でした。見送り期間が終わったら、ｓ＝１の候補者が出現したら、直ちに採用に踏み切るのが最適であり、平均すれば２０人中３位の人が得られることを示しています。
　それよりも１０回目でのｓ＝１の候補者は、さらに優れているのだから、そこまで採用を伸ばすべきだと思うかもしれません。しかし、その頃になると、ｓ＝１になる確率が小さくなってしまい、全体の期待値が悪くなってしまうのです。
　なお、この 3.0017 の数値は、ｎが大きくなるのにつれて大きくなりますが、ｎ→∞でも 3.870 になることが証明されています（数学的に高度になるので割愛。私も理解不能）。すなわち、候補者数に無関係に、上位４位の候補者を選ぶことができるというのです。