Watson君、よくやった!

IBMが開発した人工知能クイズロボットのWatsonが、人間のクイズチャンピオン2人を破りました。アメリカの人気クイズ番組でのこと。

(http://www.itmedia.co.jp/news/articles/1102/17/news030.html)

 米クイズ番組「Jeopardy!」で行われた対決の最終的な成績は、Wastonが7万7147ドル、クイズ王のケン・ジェニングス氏は2万4000ドルでブラッド・ラッター氏は2万1600ドルだった。

さて、この世紀の大ニュースをどう理解すべきか? 

(1)「ついに人工知能が人間を超えた」→間違い。「クイズという特定の分野で、答えを人間より早く探せる技術が実現された」、と理解すべき。もともと、大量のデータから特定の条件に合う項目を探し出す能力は人間よりコンピュータの方が高い。これをうまくクイズ向けに拡張しただけであり、人間が日常生活で発揮しているようなあらゆるタイプの知能が実現できたわけではない(もちろん、この拡張の部分には様々な自然言語処理技術が使われていており、すばらしい研究開発の成果であることは疑いの余地はない)。

(2)「情報検索の一種である、暗記物のクイズでコンピュータが強いのはあたりまえ」→間違い。確かに、データベースの検索などは、人間よりもコンピュータが得意。たとえば、ランダムに並んだ100万件の商品データから、売れ筋トップ10を選ぶなんて処理を人間が紙と鉛筆でやろうとすると何日もかかるが、コンピュータなら一瞬で計算できる。しかし、クイズの問題は一般の言語(自然言語)であたえられ、何を聞かれるかは予想できない。言語で表現された情報を深く、正確に理解する問題は、いまだに未解決の問題であり、たぶん解決までに少なくとも今後数十年間かかるだろう。この困難な言語の理解をクイズという場面に絞って、実用的なレベルまで高めている。簡単に言えば、浅い言語の理解がかなりのレベルで実現されたと言える。これにあわせて、正解を特定する技術もかなりクイズに合わせて上手く調整されている。時々、人間では絶対にしないような、とんでもない答えをしてIBMの開発者が頭を抱えているが、それでも全体としての解答のスポッティング技術は相当に高い。

まとめると、Watsonはクイズという状況で人間のチャンピオンを破ったという点で画期的であるが、人間を超える人工知能ができたというわけではない。ちょうど、チェスのチャンピオンをコンピュータチェスが破ったからといって、人間に代わる人工知能が完成したわけではないのと同様である。

さて、ここからはある程度専門的な内容に興味がある諸氏向けの内容。

Watsonの概要がAI Magazineに掲載されている。この著者の中で2004年にIBMのT.J.ワトソン研を訪問したときQA技術に関してミーティングをしたことがあるのはJennifer Chu-Carrollだけなのだが、たぶんこのプロジェクト向けに集められた人たちなのだろう。

基本的な処理の流れは、(1)Content Acquisition:質問文を元に、答えを含んでいそうな文書を検索する、(2)Question Analysis:質問文を解析し、どのようなタイプの質問か(選択問題か、質問で答える問題かなど)、何を聞かれているか(都市名か人名かなど)を特定する、(3)Hypothesis Generation:正解と思われる候補を文書から抜き出す(あらかじめ、人名、地名などの判定はしてある)、(4)Soft Filtering:軽い処理により、可能性のある解答候補100件を抜き出す(質問によっては、解答候補が大量に見つかってしまうが、すべてを対象にすると時間がかかってしまうため、ラフな選別をするのだと思われる←推測)、(5)Hypothesis and Evidence Scoring:ここで、解答候補にスコアを付けをする、(6)Final Merging and Ranking:解答候補をまとめランキングする、(7)Answer Merging:解答候補のうち、同じ内容の解答候補をまとめる、(8)Ranking and Confidence Estimation:最終的な解答候補のランキングをし、もっとも当たってそうな答えを回答する(または、回答しないでパスする)。

この様な構成は、QAシステムの典型的な処理の流れであり、特別変わっているわけではない。私が10年前にNTTの基礎研で開発に関係していたQAシステムもこのような処理をしている。違いは、クイズにあわせて、質問のタイプと傾向、頻度を綿密に調べ上げ、かつ掛け金をうまく掛けていく戦略を入れて、スーパーコンピュータにより高速な処理を実現した点が特筆すべき点のように見える。

とここまで書いて、私は少し勘違いしていたことに気がついた。それはWatsonはクイズの問題を音声認識して答えていると思っていたが、このレポートを読む限り、どうも問題文は文書で与えられていて、他の回答者の答えも聞いていないようだ。たぶん、音声認識を通すと音声認識誤りにより正解率が落ちるし、回答も遅れてしまうのでうまくいかなかったのだろう。アメリカの音声認識の研究者からはWatsonに音声認識の専門家も借り出されているというようなうわさを聞いたいたので勘違いしていた。