[groonga-dev,02817] Re: IN NATURAL LANGUAGE MODEにおける検索スコア

Back to archive index

Kouhei Sutou kou****@clear*****
2014年 9月 26日 (金) 20:57:17 JST


須藤です。

In <54252****@fdiar*****>
  "[groonga-dev,02816] Re: IN NATURAL LANGUAGE MODEにおける検索スコア" on Fri, 26 Sep 2014 10:50:23 +0200,
  Kazuhiko <kazuh****@fdiar*****> wrote:

>> 「boolean」ってスコアは小さめっていう意味合いもあったんでし
>> たっけ。私は、ANDとかORを使って検索できる、っていう意味なの
>> かなぁと思っていました。
> 
> boolean、つまり「あったらTrue、なかったらFalse」で、Trueの数を返すものだ
> と思っていました。少なくともMyISAMだとそうです。

それでORは説明できると思いますが、ANDが説明できないような。。。

>> もしかしたら、なんですけど、かずひこさんが求めている挙動って
>> 
>>   "word1 word2 word3" IN BOOLEAN MODE
>> 
>> (word1 OR word2 OR word3)だったりしないかなぁと思いました。
> 
> 求めている挙動は、「適当にキーワードを多めにつっこんだら、いい感じのスコ
> アでソートされて返ってくる」です。
> 
> 上述の仕様の違いで、Mroonga in boolean modeは、MyISAM in boolean modeよ
> りはましな結果になりそうですが、やっぱりキーワードごとの重みが考慮される
> ほうが「いい感じのスコアでソート」になりそうなので、(word1 OR word2 OR
> word3)だとあまり嬉しくありません。以下、比較実験しました。

例を示してくれてありがとうございます!
ただ、この例だとどのcontentが上位にくるのが妥当なのかわから
ないので、「望ましい挙動」がわからないなぁと思いました。
「fine tomorrow bell」で検索したら「Ring the bell.」が一番上
位になってうれしい。。。の?みたいな感じです。


-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/>

Groongaベースの全文検索システムを総合サポート:
  http://groonga.org/ja/support/
パッチ採用 - プログラミングが楽しい人向けの採用プロセス:
  http://www.clear-code.com/recruitment/
コードリーダー育成支援 - 自然とリーダブルコードを書くチームへ:
  http://www.clear-code.com/services/code-reader/




groonga-dev メーリングリストの案内
Back to archive index