dune
FZH01****@nifty*****
2004年 5月 5日 (水) 22:42:32 JST
極悪です。 morogram の Win32 実行形式バグフィックス&拡張版 morogram-0.7.1x.exe です: http://hpcgi1.nifty.com/dune/gwiki.pl?f tools/morogram-0.7.1x.zip - 889KB 上の zip にはいろいろ入れてますが、sourceforge にはバイナリ とソースを分けてそのうちアップします。 旧版 morogram-0.7.1w は 1. 空白や改行が削除されない(バグ。僕のせいじゃない) 2. --BOM 指定時 EF BB BF ではなく FE FF が出力される(勘違 い) というバグがありました。申し訳ない。 その後、山田さんに 1. のバグを教えていただいて修正した morogram-0.7.1w 第二版は、1.のバグはなおっていますが、 --e オプション(文字参照 &nnnnnn;)が正常に働きません。 morogram-0.7.1x.exe はこれらのバグを修正しています。 注意としては 1. --p(Delete Punct)オプションで削除される文字がオリジナル の morogram と 異なっています。 2. ABCとabcを同一視します(ワイドキャラクタのアルファ ベットの大文字と小文字を区別しない)。 1.は削除する文字を Named Unicode properties で指定している ためです(Mark, Punctuation, Symbol, Separator を削除; cf. http://www.unicode.org/reports/tr18/index.html)。 2.は僕の勝手な都合です。これをやめさせるには --c(Case sensitive)オプションを指定します(ABC と abc,ABC と abcを区別するようになります)。 また、会社の上司が製品にワン・フューチャ入れろ、とウルサイの で(morogram と関係ないけど)、--w(単語モード)と簡単な GUI も組み込んでいます。--I,--O による入出力エンコードの指定 もできますが、先ずはユニコードのみの版 morogram-0.7.1x.exe を出します。要望があれば morogram-0.7.1xJ.exe や morogram-0.7.1xCJKT.exe なども出せます。 D:% morogram-0.7.1x.exe --f=4 --g=4 --p D:\DATA\電脳国文学\AOZORA\takuboku\TAKUBOK3.utf8 2>nul |sortl -WU +0nr |tosjis |head 28 ふるさと 4 19 ふるさとの 5 19 るさとの 4 18 かなしみ 4 14 かなしき 4 13 のかなし 4 12 なつかし 4 12 のごとく 4 12 りしかな 4 11 ごとくに 4 D:% morogram-0.7.1x.exe --w D:\DATA\電脳国文学\AOZORA\takuboku\TAKUBOK3.utf8 2>nul |sortl -WU +0nr |tosjis |head 4 かなしきは 1 4 秋の風吹く 1 3 こころよく 1 3 何がなしに 1 3 わが友の 1 3 ふるさとの 1 2 一握の砂 1 2 しっとりと 1 2 かなしくもあるか 1 2 気がつけば 1 D:% -- 極悪, FZH01****@nifty***** http://hpcgi1.nifty.com/dune/gwiki.pl?