yusuk****@cheru*****
yusuk****@cheru*****
2004年 5月 29日 (土) 20:27:32 JST
田畑です。 > Anthy wikiのTODOにも「付属語の整理」とありますが、作業方針の心づ > もりやマンパワーが許せばやりたい事などあったら聞かせてもらえない > でしょうか。 付属語の部分の方針は1%の努力で90%の成果を得るみたいな感じで、 深く考えてないです。 なんらかの性能測定の結果、付属語グラフが原因であると判断した場合には 本格的に付属語の整理をすることになると思いますが、現時点では変換 できなかった時にちょこちょこと追加して、気まぐれに文法知識にあった 整理をしています。 なので、次のリリースでは「買っといたら」は変換できるようにしておきます。 > 付属語辞書で使われているパターン言語は単純なので、十分な解説があ > れば非プログラマにも扱えると思います。日本語の専門家に補完しても > らえるような体制を作れればベストですね。 そのうち、付属語のパターンによって文節の属性を計算して用例と組み合わせる ようなことを妄想しているので、その時には検討が必要ですね。 とりあえず、「〜が変換できないから、書き足しました」みたいな感じで 送ってもらうという形式が一番ローリスクかなと思ってます。 > が、Anthyの開発予定や日本語文法に対する十分な知識がないまま進め > る事はできないと思っています。例えばfix.depwordには以下のような > エントリがありますが、 > > @て "てるんだけど" @ 変換できなかった時にメモがわりに書いといたんだと思います。 で、時々気が向いて「今日は「@て」のノードがカオスだから整理しよう」と 思ったりした日に整理されるという開発サイクルの一端ですね。 > 付属語の仕様についてドキュメントが追いついてない部分があるような > ので追記してみました。できれば更新お願いします。 ありがとうございます。更新しました。 いつもいい加減なことやってて恐縮ですが、マジメ路線に切替えるのも リスクが高いので、御理解ください。 -- CHAOS AND CHANCE! Yusuke TABATA (yusuk****@cheru*****)