[ トップページ ]

« パラメタによる検索の制御 | メイン | 詳細メニューにおける条件の指定 »

6. 制限事項等

使用上の注意と制限事項

このサービスを使用するうえでの注意事項と制限事項について説明します.

低精度の検索結果がひきおこす問題
検索システムの精度すなわち適合率 (precision) や再現率 (recall) は通常,100% にすることはできません. とくに,このシステムは開発期間がかぎられているために精度がひくいばあいがあります. 検索精度に関して保証することはできませんが,できるかぎり精度向上につとめますので,低精度の検索結果がえられたときは指摘してもらえるとたすかります.
年代を軸とする検索の限界
現在のタグづけアルゴリズムにおいては,事典テキストにあらわれる年代表記とかんがえられる表現はできるだけタグづけしていますが,文脈に依存する表現のなかにはただしくタグづけされていないものもあります. そのため,不正な項目が出力されたり,出力されるべき項目が脱落したりすることが生じることがあります. これらの検索結果に関しては指摘をうければ修正を検討しますが,ただしく修正されることは保証できません.
地域を軸とする検索の限界
現在のタグづけアルゴリズムにおいては,地名に関しては限定的な範囲でタグづけおよび検索をおこなっています. そのため,検索結果において,もれがおおくなっています. 使用した地名データベースと事典テキストの表記のずれのために,ただしくタグづけされていないために地域として検索できなくなっている地名もあります (たとえば 「ギリシャ」 と 「ギリシア」 とのちがいなど). また,地名以外の名詞や地名の文字列をふくむ他の名詞が地名としてタグづけされているために不正な検索結果がえられる場合があります. 地名としては基本的には行政地域名や都市名だけにタグづけし,山・川などの地形につけられた地名はタグづけしていないので,それらの地名は地域として検索することができません. また,日本の地名としては県・郡・市・町などの接尾辞がついたものだけを抽出しているため,県名や都市名であっても接尾辞のないものはタグづけされず,検索結果にふくまれません.
検索時間や検索結果数に関する制限
検索の途中で検索時間が既定の時間をこえたときは検索を中止します. これは,サーバの負荷がたかまって応答が悪化するのをふせぐためです. また,検索の途中で検索結果数が既定数をこえたときも検索を中止します. これはサーバの負荷とサーバ-クライアント間の通信負荷をおさえるためです. サーバのハードウェア仕様によっては,これらの既定の時間や検索結果数に関するプログラム中のパラメタを変更してさらに制限をきつくする必要があります.
キーワード:

トラックバック

このエントリーのトラックバックURL:
https://www.kanadas.com/mt/mt-tb.cgi/4313

コメントを投稿


メインページアーカイブページも見てください.

Creative Commons License
このブログはつぎのライセンスで保護されています. クリエイティブ・コモンズ・ライセンス.
Powered by Movable Type