佐々木裕
sasak****@googl*****
2009年 12月 19日 (土) 10:30:03 JST
工藤さん、 ご無沙汰しています。 MeCabの英語辞書とモデルを整備中でして、そのうち公開しようと しているのですが、英文を処理するためには、MeCabを微修正して、 空白や記号の位置で単語を切るようにする必要があります。 (時として空白や記号を含む単語もあります。) 今はかなり荒っぽく、viterbi.cppを下記のように修正しています。 for (size_t pos = 0; pos < len; ++pos) { if (end_node_list_[pos]) { - if ( (pos == 0) || - (!isalnum(sentence[pos-1])) || (!isalnum(sentence[pos])) - ) - { そこで相談ですが、MeCabを英語モードでも使えるようなオプションを追加して もらえたりしないでしょうか。 -- 佐々木裕@豊田工大 -------------- next part -------------- HTMLの添付ファイルを保管しました...下載