OHTAKE Kiyonori
otake****@fw*****
2006年 8月 11日 (金) 10:07:12 JST
大竹です。 From: yamada hiroyuki <yamahiroyu_y****@yahoo*****> Subject: [mecab-users 156] ユーザ辞書利用におけるエラーについて Date: Thu, 10 Aug 2006 23:24:21 +0900 (JST) > いつもmecabを使わせてもらっております。 > 現在、0.93を使っているのですが、ユーザー辞書を使って、形 > 態素解析をすると > プログラムエラーになります。 > (example 以下のテストプログラムを使いました。) mecab-dict-info して気がついた点だけなんですが... charsetは euc-jp でしょうか。 mecab-dict-index に渡すパラメータのうち、 システムの辞書の charset とユーザ辞書の charset が合っていないと ご報告されたエラーが表示されました。 たとえば、私が自分で構築したシステム辞書は charset が EUC-JP だったのですが、 マニュアルにある通り、 /usr/local/libexec/mecab/mecab-dict-index \ -d/usr/local/lib/mecab/dic/ipadic \ -u foo.dic -f euc-jp -t euc-jp foo.csv のようなユーザ辞書をつくると問題が再現されました。 これを /usr/local/libexec/mecab/mecab-dict-index \ -d/usr/local/lib/mecab/dic/ipadic \ -u foo.dic -f EUC-JP -t EUC-JP foo.csv にすると、ユーザ辞書を利用して解析することができました。 参考になれば。 ---- 大竹清敬(おおたけ きよのり) otake [at] fw.ipsj.or.jp