NTT の R&D フォーラムで、「『なぜ』に答える質問応答システム」というブースが面白かった。
R&D フォーラムでは、NTT の最新の研究を紹介している。この「なぜに答える〜」システムも、その研究開発の一つ。システム名は「nazeqa (なぜか)」。名称がこじゃれてて、いい。こういうの大好き。
NTT は最新の研究成果を、gooラボで公開している。でも、この「nazeqa」はまだサービス・インしていない。簡単にだけれども、この幻の検索システムを紹介しませう。
nazeqa
「nazeqa」は、自然言語検索の一つ。ユーザーが入力した「なぜ (Why)」の質問文に答えを返してくれる。
仕組みは簡単。
- 「理由」を現す文章パターンを予め用意しておく。
これだけ。例えば「〜から○○」という風に書かれていたら、「○○の理由は〜」なのだろう、といったパターンを用意しておく。そして、パターンにそって文章をインデックス化しておく。難しいのは、このパターン集を人力で作るところと、ランキング付けを行なうアルゴリズムをブラッシュアップさせることでせう。後者に関しても、色んな質問をしては、検索結果を確認し、アルゴリズムの修正をかけているとのこと。
デモでは、ニュースのテキストを大量に読み込ませて、インデックスを作成していた。「質問」は、NTT 側が予め用意したものが用意されていた。例えば、「蛍はなぜ光るの?」とか、そんなの。回答は、ちゃんと答えているものもあれば (大体、上位 3 つに正解が出ていた)、「なぜ (How)」の答えを返しているものもあった。これは、日本語が「なぜ」を「Why」の質問と「How」の質問の両方で使っちゃう、って問題もあるんだと思う。逆を返せば、「Why」だけじゃなくて「How」も検索するシステムが、ちょっとした応用で出来てしまいそう。
さて、nazeqa のデモでは、自然言語での検索ボックスも用意されていた。NTT の用意している質問は信用ができないので (失礼!)、自分で質問を考えてみた。それも、一寸いじわるなやつを。
Q: なぜ地球は平らなのか?
嘘を聞いてみた。「何故」の検索で困るのは、答えにならない答えを返されることだからね。
答えが出ないとか、間違った答えが出てくることを期待してた。
A: 生活実感としては、地球は平らであるから、古代の人々が「大地は平らだ」と信じたのは別に迷信でも何でもなく、ごく自然なことだった。
意外! まともな答えが返って来た。正直、同じ質問をされて、この答えを返せる自信がぼくにはない。
少しでも早く、nazeqa がサービス・インすることを願っちゃう :)
No comments:
Post a Comment