研究室で輪読中の「ファスト & スロー」の14章で、直感(代表性ヒューリスティクス)を制御する方法としてベイズ推定を用いる話題が紹介されていた。同じ章で用いられている例題「トム・W問題」にベイズ推定を適用してみたときに基準率がどうなるかが解説されているのだが、学生から本の説明を読んでもよく分からなかったという報告を受けた。
淡々とベイズの定理を適用するだけだろうと思っていたのだが、たしかに問題文や解説文を読んで自分でベイズ推定をしてみようとしたが、何だかおかしい。小一時間考えてみたが、問題文の日本語訳が紛らわしい(誤訳?)ことがモヤモヤの原因だと分かった。来年以降も同じ事を学生に聞かれそうなので、僕なりの解釈を以下にまとめておこう。
トム・W問題について
トム・W問題とはある大学院生トム・Wに関する記述が与えられたときに、トムの専攻分野をコンピュータ科学を含むいくつかの分野から選択するという問題である。「ファスト&スロー日本語訳」で書かれているトム・Wに関する記述は以下の通り:
トム・Wはとても頭がよいが、創造性には欠ける。秩序や明晰さを好み、あらゆる細かい要素までしかるべき場所におさまっていて、万事がきれいに説明できるシステムを愛する。彼の書く文章はかなり単調で機械的であり、たまに陳腐な駄洒落じゃSFもどきの想像力が発揮されるにとどまる。彼は能力向上にはきわめて熱心である。他人のことにあまり関心がなく、同情心は薄いように見える。人付き合いを楽しむタイプではない。自己中心的ではあるが、倫理観はしっかりしている。(原文ママ)
この記述が与えられたときに、問題を与えられた人はたいていの場合、代表性ヒューリスティックを用いて意思決定を行ってしまい、その結果トムの専攻を「コンピュータ科学」と答えてしまう。合理的(統計的)判断を下すためにはベイズ推定を用いるのが一つのアプローチであるというのが本書の主張。以下は「ファスト&スロー日本語訳」でのベイズ推定アプローチに関する記述である:
ベイズ・ルールは、事前確率(本章の例では基準率がこれに該当する)に証拠の診断結果(相反する仮説が実現する見込み)を加味する手順を定めている。たとえばあなたは、大学院生の3%(基準率)がコンピュータ・サイエンス専攻だと考えているとしよう。そしてトム・Wの人物描写(=証拠)を読んだ後に、コンピュータ・サイエンス専攻の可能性は他分野よりも4倍高いと考えたとする。するとベイズ・ルールにより、トム・Wがコンピュータ・サイエンス専攻の確率(事後確率)は11%になる(原文ママ)。
問題の問題
脚注ではオッズや尤度比を用いた解説が書かれているのだが、愚直にベイズの定理を使って解くのがよいと思ったので、その方法で考えてみる。今、
* θ: 大学院生がコンピュータ科学を専攻しているという事象
* ¬θ: 大学院生がコンピュータ科学を専攻していないという事象
* D: トム・Wの人物記述(人となり)情報が得られたという事象
とする。ベイズの定理によって、トム・Wに関する人物記述が得られたときにトム・Wがコンピュータ科学を専攻していると思われる確率P(θ | D)は以下となる:
$$ P(\theta | D) = \frac{P(D | \theta)P(\theta)}{\sum_{\theta} P(D | \theta)P(\theta)} = \frac{P(D | \theta)P(\theta)}{P(D | \theta)P(\theta) + P(D | \overline{\theta})P(\overline{\theta}) } $$
以上と問題文を対応させていけば解けると思っていたが、問題は尤度(P(θ | D))である。脚注の解説を読むと、「トム・Wの人物描写(=証拠)を読んだ後に、コンピュータ・サイエンス専攻の可能性は他分野よりも4倍高いと考えたとする」という箇所が尤度に関する情報を扱っているようなのだが、これって何を言っているのか?これは尤度だろうか?僕にはこの説明は尤度でなく事後確率の説明をしているようにしか見えない… 翻訳前の文章を見て悩みが解決した。この箇所に関する元の文章は以下の通り:
… and you also believe that the description of Tom W is 4 times more likely for a graduate student in that field than in other fields, then …
これを読むと、「トム・Wの人物描写(=証拠)を読んだ後に、コンピュータ・サイエンス専攻の可能性は他分野よりも4倍高いと考えたとする」ではなく、「あるコンピュータ科学専攻の学生にトム・Wの人物描写が当てはまる確率は、コンピュータ科学以外を専攻しているある学生に対してトム・Wの人物描写が当てはまる確率の4倍である」と書いてある。これならば尤度を計算できそう。僕が当初考えていた変数設定を使うと、上記英文は
$$P(D | \theta) : P(D | \overline{\theta}) = 4:1$$
となるので、ベイズ推定ができそう。
ベイズ推定によるトム・W問題の事後確率推定
これで準備が整った。問題設定を数式で表現すると、以下のようになる。
- 大学院生の3%(基準率)がコンピュータ・サイエンス専攻だと考えている:P(θ | D)=0.03
- あるコンピュータ科学専攻の学生に対してトム・Wの人物描写が当てはまる確率は、コンピュータ科学以外を専攻しているある学生に対してトム・Wの人物描写が当てはまる確率の4倍である: P(D | θ) : P(D | ¬θ) = 4:1
あとは、ベイズの定理に上の式を使う。
$$ P(\theta | D) = \frac{P(D | \theta)P(\theta)}{\sum_{\theta} P(D | \theta)P(\theta)} = \frac{P(D | \theta)P(\theta)}{P(D | \theta)P(\theta) + P(D | \overline{\theta})P(\overline{\theta}) } $$
$$ = \frac{0.03 \cdot P(D | \theta)}{0.03 \cdot P(D | \theta) + 0.97 \cdot P(D | \overline{\theta})} $$
$$ = \frac{0.03 \cdot P(D | \theta)}{0.03 \cdot P(D | \theta) + 0.97 \cdot 0.25 \cdot P(D | \theta)} = 0.11$$
これで基準率(事前確率)3%でトム・Wの人物描写を見たら、事後確率が11%になり、基準率が3%から11%に修正されたと言える。めでたしめでたし。