言語を計算する脳モデル;ウェブのためのインテリジェンス

言語を計算する脳モデル;ウェブのためのインテリジェンス

私たちは物事を体験すると,それを特徴づける事が同時に起こるので,それらのでき事同士の関係付けを強化します.これが記憶です.記憶を想起するときは,与えられた刺激入力からそれぞれの関係付けを経由して最も活性化されるシンボルを選びます.これが想起です.

例えば,リンゴを見たときは,赤くて丸いという特徴をリンゴの概念として記憶し,赤くて丸いものを見たときは,それがリンゴであるということを想起します.

これをProf. Hecht Nielsenは脳の生理的研究からもう少し詳細化しconfabulation modelと呼ばれる脳での記憶と想起のモデルを提唱しました.本プロジェクトでは,このconfabulation modelを基盤として,知能実現の様々な研究を行っています.

1つ目は,文の生成です.属性の代わりに,直前の文脈の特徴を用いて次に現れる言葉への関係づけを記憶することによって,驚くほど自然な文の生成ができます.まずコーパス中の語順を学習します.つぎに任意の語列からその先に現れる語を予測し,文を延長して生成します.例えば,「But the other」と与えると,システムは「But the other parts of the world…」のようにその先を伸ばします.

表に他の生成例も示します.ここでは文法情報を一切使っていないにもかかわらず,英語として意味的にも文法的にも驚くほど妥当な文が生成されている事が分かると思います.

2つ目は文脈で変化する語義を計算し出力することです.そもそも言葉の意味はとてもあいまいです.例えばJAVAの意味は,文脈によってコンピュータ言語になったり,インドネシアの島になったりします.現在のサーチエンジンはこの意味を解釈せず,言語の字面のマッチングだけを行っているので,しばしば予定外の意味のマッチングを引き起こします.これはセマンティックギャップと呼ばれます.私たちは,このセマンティックギャップを防ぐため,あいまいな言葉の意味を表現する仕組みを作っています.具体的には,直前の文脈の特徴を考慮して対象語の意味を可能性のスコアとともに列挙します.表は,コンピュータの話しをしている時のJAVAの意味,旅行の話をしている時のJAVAの意味を,関連する文を求めることで表しています.一方はサンマイクロが多出していることからコンピュータ言語,もう一つはインドネシアの島であると解釈を仕分けていることが分かると思います.これらの文はすべて,システムが計算をして求めた結果です.

我々のシステムは,言葉の意味がもっと極端に変化するときでも,正しく解釈をすることができます.例えば,「Love is journey.」を,人は「愛は単純なものではなく,紆余曲折も起こる大変なものなのだ.」の様に解釈します.この「journey」の意味の計算結果を表に示します.システムは,「困難」,「苦心する」,「不完全」という様な解釈を計算結果として示しています.まるで人間の様に柔軟で詩的な解釈まで可能にしていることが分かると思います.

3つ目に,4項類推の様な高度な推論を行うことも可能です.図は「魚ならヒレ.では鳥なら何でしょう?」という問題に対するアプローチを示しています.

我々のシステムは,この解をWekipediaから探し出します.この種の問題は米国の大学入学の評点にも利用されており,かなり高度な知的能力が必要です.人はこの類推問題を解くときに,構造写像を使っています.構造のみ写像され属性は写像されないというものです.これは実現が困難で,このために事例ベース推論はなかなかうまく機能しません.図に2つの類推結果を示します.

一つは,「魚:ひれ = 鳥: X? 」です.表の上部にfeatherやwingという正解が来ています.また,「日本:東京=フランス:X?」では,上部にdeやparisが来ています.どちらも首都がおかれている場所を示しており,類推が正しく機能していることが分かります.ここまで高度な推論ができると,高度な推薦や予測などを実現することができます.

本プロジェクトでは,これらの他にも認知脳科学や認知言語学を基盤として高度でかつ実践的な知能実現の研究をしています.例えば意味の解釈,深い推論,概念形成などです.さらに本プロジェクトで得られた知能実現の基礎理論は,他の実践的なプロジェクトでの基盤技術として使われます.

詳細は下記の論文をご覧ください.
1. Akimitsu Mori, Mayu Sato and Tomohiro Takagi,”Interpretation of Metaphor and the Principle of Conceptual Fuzzy Sets”, North American Fuzzy Information Processing Society’s 2010 Conference