[Anthy-dev 3453] Re: gtankan.ctd の活用形を持つ単語

Back to archive index

Jun Oizumi vagus****@gmail*****
2007年 3月 29日 (木) 21:54:02 JST


大泉です。

白井さん

> 単漢字が後ろに回っても、ひらがな、カタカナより前なのですよねぇ。
> という問題はあります。

一応、そういうことにならないよう、ひらがなの候補については登録してあるのですが
(名詞副詞はまだ不十分ですが、動詞形容詞は確かほぼすべて入れてあるはずです)、
anthy のバージョンによっては後ろに回されてしまうのかもしれません。
今朝試したところ 8723 では、

1.動く 2.うごく 3.動 4.盪 5.蘯 6.蹌 7.ウゴク

でした。
カタカナの候補については、直接カタカナ変換を使っていただくか、候補リストを
逆に辿っていただくしかありませんが (^^;)

> とても大変な作業であるということは容易に想像できるのですが、よろ
> しくお願いします。気長にお待ちしています。

今行っているランク付け作業の果てしのなさに比べれば、実はそれほど大変でもなかったり
します。できるだけ早く出せるよう頑張ります。

> > 「通常の変換時には単漢字は含めない」「単漢字は別の変換モードで出す」
> > というのができれば一番だとは思います。
>
> この方法は、やっぱり「UI(という言い方で良いのかな)が対応しないと
> いけない」という点がネックだと思います。UIM, scim, anthy.el, egg
> みんな対応!という話になったら相当大変そうです ^^;;;

田畑さん

> > 以前の話を蒸し返すようで恐縮ですが、いかがでしょうか? > 田畑さん
> すいません、良い方法が思いつかないです。

了解しました。わがままを言ってすみませんでした。
この件については辞書側で対応するということで、一応、

 ・送り仮名のある読みのものとない読みのものとでファイルを分ける
  (gtankan.ctd と gtankan-okuri.ctd とか)
 ・送り仮名のある読みのものについては、cannadic のように送り仮名部分を削除した読みにする
  うご #KJ 動
  あたら #KJ 新
  ...etc
  ※手元のファイルでは「うご-く #KJ 動」という形で登録しておいて、辞書生成時に送り仮名部分を
   削除します。

という風にしようと思います。

# 送り仮名部分を削除した読みにするならファイルを分ける必要はないかなぁ、という気もしますが…




Anthy-dev メーリングリストの案内
Back to archive index