Yusuke TABATA
yusuk****@w5*****
2007年 4月 21日 (土) 01:01:27 JST
Hideyuki SHIRAI (白井秀行) wrote: > egg-anthy の UTF-8 対応をしました。 > http://ko.meadowy.net/~shirai/diary/20070419.html > を読んでくださいませ。 ども、ありがとうございます。 色々な文字が出てるのを見ると楽しいです。 > P.S. > 逆変換の実験をしていて気づいたのですが、EUC-JP で表現できない文 > 字を Anthy に突っ込んでも逆変換してくれないのですね。 平仮名や記号で構成されている文は逆変換しないというルールでやっていて、 EUC-JPで表現できない時は〓(ゲタ)になるので記号扱いというオチでした。 EUC-JPに変換して文字コードが0xa1??, 0xa2??の時に記号という 扱いにしてたのですが、UCSでどの文字が記号かマジメに考えるのは 手間なので、とりあえず下記のパッチで逃げておこうと検討しています。 --- /tmp/anthy-8819/src-diclib/xchar.c 2007-03-01 22:19:18.000000000 +0900 +++ xchar.c 2007-04-20 11:26:59.000000000 +0900 @@ -286,7 +286,13 @@ static int is_symbol(xchar xc) { + if (xc == UCS_GETA) { + return 1; + } xc = anthy_ucs_to_euc(xc); + if (xc == EUC_GETA) { + return 0; + } if ((xc & 0xff00) == 0xa100) { return 1; } -- -- CHAOS AND CHANCE! Yusuke TABATA