Yusuke TABATA
yusuk****@w5*****
2006年 7月 15日 (土) 13:25:18 JST
田畑です。 M.Suzuki wrote: > いつも愛用させていただいています。M.Suzukiです。 ご利用ありがとうございます。 > 手元の環境でやってみましたところ、anthy 7307/7500 でも、再現するようで > す。一応、test/anthyでの実行結果を載せておきます。(7500も同じ結果です) この形式で調査していただいたついでに、原因の説明をしておきます。 > ANTHY_ENABLE_DEBUG_PRINT=() > ANTHY_SPLITTER_PRINT=() を実行する前に上記の環境変数を ANTHY_ENABLE_DEBUG_PRINT=y (任意の文字列) ANTHY_SPLITTER_PRINT=m (m,w,h,iを含む文字列) のように設定すると、通常の出力の他に > anthy-7307 Tue Jul 11 11:56:23 2006 > 1:(だいたいしゅだんとしてづ) この文字列の部分で意味があると認識された 「だ」「だい」「だいた」「だいたい」「だいたいしゅだん」などの 文字列が出力されます。 anthyはこれらの文字列をつないでいって左から右までの一番良さそうな 経路を選ぶのですが、今回の問題は「づ」が文節になりえると認識せず、 その左で解析を止めてしまったのが原因です。 記号とかの場合は左の文節に付けたり、単独の文節を作ったりするのですが ひらがなで辞書にのってないものが来たときの対処が甘かったです。 -- -- CHAOS AND CHANCE! Yusuke TABATA