Shirou Wakayama
shiro****@proso*****
2005年 6月 9日 (木) 19:49:30 JST
若山と申します。 古いメールに返信します。 候補の順番を修正する adjust.t というファイルがあるそうなので、 "あるWebページで使われていたらその語の優先順位は高いだろう" という考えに基づき、いくつかのWebページを見て、 adjust.tを自動生成するスクリプトを作りました。 スクリプトを添付します。 - main.sh 実行スクリプト - makeadjust.rb が本体 となっています。現在はwikipediaのページをいくつかとってきています。 (main.shにリストされてます) 実行には ruby-1.8, chasen, ruby-chasenが必要です。 実行すると、adjust.t.makeadjust というのができます。 (現状約6000行できます。添付しようとしたら大きすぎました…) chasenを信じて品詞の分類をしていますが、 文法の知識が無いのでこれで合っているかどうかはよく分かりません。 もう少しやりようがあるとは思っていますが。 というわけで、このスクリプトが有効かどうかは甚だ疑問ですが、 なにかの御役に立てれば幸いです。 それでは。 From: yusuk****@cheru***** Subject: [Anthy-dev 2012] adjust.t Date: Wed, 20 Apr 2005 01:51:19 +0900 (JST) > 田畑です。 > > anthyで、候補の順序が明らかににおかしい場合がありますが、 > これを安易に修正する方法を用意していますので、紹介します。 > > anthyのソースパッケージ中に mkanthydic/adjust.t という > ファイルがあります。このファイルはコンパイル時に辞書の生成を > するために使われますが、次のような形式になっています。 > (例) > \modify_freq たき #T35 瀧 down > \modify_freq ついたち #T35 一日 up > > 各行で単語、読み、品詞を指定して、頻度変更のコマンドを > 書くことができます。コマンドにはup,down,killがあります。 > 優先順位の気に入らない単語を見付けた場合、このファイルに > 追加して、辞書をコンパイル(rm mkanthydic/anthy.dic;make; > make install)し直すことで、ある程度優先順位を制御できます。 > > もし、このファイルの修正が溜りましたら、このML等、 > 私に見えるところに出しておいてくだされば、取り込んで > いきたいと思います。 > > 将来的にはテスト結果からこのファイルを自動生成するような > 方向も検討しています。 ---- WAKAYAMA [F.a.w.] Shirou -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: makeadjust.tar.gz 型: application/octet-stream サイズ: 2026 バイト 説明: 無し 下載