QAのメモ
2006年 08月 08日
【戯言】
質問応答システムにおけるメモ。
それぞれ、自分なりに考えた結果を出しただけで、
証明したわけではないので注意。
・質問応答システムは自然文でなければならないか?
これは否だと思う。質問応答システム自体は数種の単語によって
検索抽出できるのならば最もそれが早い。(言葉の短縮)
・では自然文で検索する理由は?
現段階で単語の場合、どれが疑問の単語なのか。
どの言葉に関連するものを調べればよいのかとかは分からないと思われる。
例「ドラえもん 誕生日」
ならば人間でこれが『疑問文である』と必ず分かるならば、
「ドラえもんの誕生日は?」
という文章に変換できる。
コンピュータも「誕生日=月日を聞く単語」という定義があれば、
検索できなくはないかもしれない。
単語だけでは抽出できない文とは構文の係り受けが重要な意味を持つ場合である。
その場合は何だろう?
今は思いつかない。
一応最も大きい問題は対話型や音声入力で自然文となってしまう場合くらいだろうか。
・WWW用の質問応答システムにおいて、要約は使用可能か?
検索するためにはGoogleなどでの検索ではキャッシュ、
Namazuはインデックスを作成する。
そのために膨大な量になるかもしれないが、要約の使用は可能である。
・では要約と本文をどのような割合で使用するか。
検索や計算の速度によるけれども、全て使った方が最もよいと思う。
ただし、余計な回答まで含まれてしまう可能性がある。
ここら辺は抽出と合わせて考えなければならない。
質問応答システムにおけるメモ。
それぞれ、自分なりに考えた結果を出しただけで、
証明したわけではないので注意。
・質問応答システムは自然文でなければならないか?
これは否だと思う。質問応答システム自体は数種の単語によって
検索抽出できるのならば最もそれが早い。(言葉の短縮)
・では自然文で検索する理由は?
現段階で単語の場合、どれが疑問の単語なのか。
どの言葉に関連するものを調べればよいのかとかは分からないと思われる。
例「ドラえもん 誕生日」
ならば人間でこれが『疑問文である』と必ず分かるならば、
「ドラえもんの誕生日は?」
という文章に変換できる。
コンピュータも「誕生日=月日を聞く単語」という定義があれば、
検索できなくはないかもしれない。
単語だけでは抽出できない文とは構文の係り受けが重要な意味を持つ場合である。
その場合は何だろう?
今は思いつかない。
一応最も大きい問題は対話型や音声入力で自然文となってしまう場合くらいだろうか。
・WWW用の質問応答システムにおいて、要約は使用可能か?
検索するためにはGoogleなどでの検索ではキャッシュ、
Namazuはインデックスを作成する。
そのために膨大な量になるかもしれないが、要約の使用は可能である。
・では要約と本文をどのような割合で使用するか。
検索や計算の速度によるけれども、全て使った方が最もよいと思う。
ただし、余計な回答まで含まれてしまう可能性がある。
ここら辺は抽出と合わせて考えなければならない。
by kagurayouyou
| 2006-08-08 16:10
| 日記