Article

文書群の局所性と大域性の差を利用したキーワード粒度評価

Source: OAI

ABSTRACT 平成17年7月22・23日情報処理学会第168回自然言語処理研究会 検索エンジンによるキーワード検索をするとき、検索結果が数千件もあり多過ぎたり、数件しかなく少な 過ぎて求める文書が得られないことがある。前者では検索を狭めるため粒度がより細かいキーワードが必要であり、 後者では検索を広めるためより粒度が荒いキーワードが必要である。また、検索対象とする文書群に応じて単語の粒 度も違ったものとなる。本稿では、二つの文書群における単語の文書頻度を比較することにより、それぞれの文書群 におけるキーワードの専門性とその文書群におけるキーワードの粒度の評価法を提案する。 Appropriate choice of query word are crucial to obtain a good search result. If it is too vague or too general, several thousand of results would be obtained. On the other hand, if it is too specific, the number of documents retrieved would be too few. More fine keywords are necessary in the former and query expansion is necessary in the latter. Speciality and granuality are two key aspects to evaluate appropriateness of of keywords in searching documents. This report proposes a method to analyse speciality and granularity of keywords using global and local document frequencies of the keywords.

0 Bookmarks
 · 
38 Views