待辦事項 #10857

POPFile 0.22.5 日本語パッチ(テスト版その 2)
啟用日期: 2007-08-16 23:34 最後更新: 2008-01-30 01:00

回報者:
負責人:
(無)
類型:
狀態:
關閉
元件:
(無)
里程碑:
(無)
優先權:
5 - 中
嚴重程度:
5 - 中
處理結果:
檔案:
3

細節

■POPFile 0.22.5 日本語パッチ(テスト版その 2) について

POPFile 0.22.5 に日本語関係の機能強化などを行うパッチです。
POPFile 0.22.5 をあらかじめインストールしてある必要があ
ります。

このパッチはテスト中のものですので、正常に動作しない場
合もあります。
導入前には必ずデータベースなどのバックアップをとるよう
にしてください。

動作チェックにご協力いただけるかたを募集しています。
動作確認された方は、うまく動いた/動かないにかかわらず
ご報告をお願い
いたします。

■リリースノート

■ はじめに

この日本語化パッチは POPFile v0.22.5 に対応したもので
す。その他の
バージョンの POPFile にあてても正常に機能しません。

このパッチは、分かち書きに使用するプログラムとして
MeCab を使うための
機能や、メール処理の速度向上などを行ったものです。
詳しい修正内容は以下のとおりです。

1. 分かち書きに使用するプログラムとして、Kakasi だけで
なく MeCab や
 内蔵パーサ(文字種による分割)をサポート

 特に内蔵パーサ(文字種による分割)については外部モ
ジュールを必要と
せず、精度面でもほとんど変わりがないことから非常に有用
だと思われます。
ぜひ POPFile の次のバージョンに含めたいと考えています。
 詳細については、下記を参照してください。

2. メール処理の速度を向上

 適当な 500 通のメールを bayes.pl スクリプトを使って処
理させたところ、
POPFile 0.22.5 に比べて約 1.8 倍程度の向上が見られました。

3. メール本文において単語の途中で改行が入ってしまってい
る場合に正しく
  つながって処理されるように修正(Kakasi 使用時のみ)

4. UI の履歴タブで件名などが長い場合に後ろが省略されて
表示されるが、
 その際に一部文字化けが生じることがある問題を修正

5. メールヘッダの各行の終わり、あるいはメール本文の最後
に書かれている
 メールアドレスがメールアドレスとして処理されないバグ
を修正

これらの機能ついては、POPFile の次のバージョン(0.22.5
/ 0.23.0)に反映
したいと考えています。

■導入方法
POPFile を停止させます。(ここで POPFile のデータベース
などのバックアップ
をとるとよいでしょう)

POPFile/Classifier フォルダにある Bayes.pm と
MailParse.pm と WordMangle.pm
を POPFile フォルダ内のファイルと入れ替えてください。
POPFile/UI フォルダにある HTML.pm を POPFile フォルダ内
のファイルと入れ
替えてください。
(もとのファイルのバックアップをとる場合は、*必ず*
POPFile フォルダ外に
 移動するか、拡張子を追加/変更してください。~.pm と
いうファイル名の
 まま残しておくと、元のファイルも読み込まれてしまい、
誤作動を起こします)

POPFile を起動させます。

■分かち書きプログラムの変更方法
UI の詳細設定タブで bayes_japanese_parser パラメータの
値を変更すること
により、分かち書きに使用するプログラムを選択することが
可能です。

・kakasi (デフォルト)
 分かち書きに Kakasi を使用します。
・mecab
 分かち書きに MeCab を使用します。
・internal
 分かち書きに内蔵パーサ(文字種による分割)を使用します。
 (外部モジュールを必要としませんので、クロスプラット
フォーム版の
  導入時などにおすすめです)

※分かち書きプログラムに MeCab を使用する場合、MeCab、
MeCab Perl バイン
 ディング、辞書ファイルをあらかじめインストールしてお
く必要があります。

詳細については、
 http://popfile.sourceforge.net/wiki/jp:faq:mecab
を参照してください。

■分かち書きプログラムによる精度比較
それぞれを使用した場合の精度比較については、
 http://amatubu.skr.jp/?POPFile/Accuracy
を参照してください。
テストでは、どれを選択しても精度はほとんど変わらないと
いう結果が出て
います。

■分かち書きプログラムによる速度比較
処理速度については、internal → mecab → kakasi の順です。
他の部分の処理の方が時間がかかるため、劇的に処理速度が
変わるというこ
とはありません。

■注意事項
導入に際しては、POPFile のバックアップを取っておくこと
を推奨します。

また、POPFile 日本語化プロジェクトからアンオフィシャル
な形でリリース
するものなので、バグ報告などは、

POPFile 本家プロジェクト(http:
//sourceforge.net/projects/popfile)

ではなく、

日本語化プロジェクト(http:
//sourceforge.jp/projects/popfile)

の方に報告をお願いします。


2007/08/16 naoki iimura (amatubu@users.sourceforge.jp)

Ticket History (3/5 Histories)

2007-08-16 23:34 Updated by: amatubu
  • File 2012: popfile-0.22.5jpn-test2.zip is attached
2007-08-16 23:34 Updated by: amatubu
  • File 2013: POPFile-0.22.5jpn-test2.dmg.gz is attached
2007-08-21 21:20 Updated by: amatubu
評語
Logged In: YES
user_id=6939

Windows 版のインストーラを公開。
2007-08-21 21:20 Updated by: amatubu
  • File 2021: popfile_0225jpn_test2.zip is attached
2008-01-30 01:00 Updated by: amatubu
  • Ticket Close date is changed to 2008-01-30 01:00
  • 狀態 Update from 開啟 to 關閉
評語
Logged In: YES
user_id=6939

パッチの内容のほとんどは v1.0.0 に反映されましたのでいったん
閉じます。

Attachment File List

編輯

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » 登入