morit****@razil*****
morit****@razil*****
2008年 5月 28日 (水) 08:24:48 JST
森です。 次バージョンのSennaに載せる新しいAPIの案を以下に載せました。 http://qwik.jp/senna/DBAPI.html 昨年から取り組んできたSennaStore(http://qwik.jp/senna/store.html)の機能を、 専用のクエリ言語(SennaQL)からだけでなく、API経由で広く使えるようにすることが 新APIの主な目的です。 従来のAPIでは実現できなかった多様なデータ構造が表現できるようになるため、 例えば、文書毎の属性(文書長etc..)や単語毎の属性(固有表現へのリンクetc..)を追加して、 マッチングやスコアリングのアルゴリズムに反映する等の拡張が自由に行えます。 新APIはsen_sym, sen_inv, sen_set等の従前の部品をそのまま流用していますから、 インデックスの形式、検索結果、性能への影響はありません。 また、新APIを適宜組み合わせて使うことによって従来のAPIで表現していたことが ほとんど全て記述できるようになります。従って長期的には従来のAPIの一部 (sen_index_*, sen_records_*, sen_set_*, sen_sym_* )は非推奨扱いにする予定です。 今後、皆様からのコメントを吸収しつつ実装とテスト(&文書化)を進めていければと 考えています。 よろしくお願いします。 -- morita