[Shinji-devel 52] Re: 個人辞書

Back to archive index

Etsushi Kato ek.ka****@gmail*****
2006年 6月 22日 (木) 01:59:30 JST


On 6/22/06, Yoriyuki Yamagata <yoriy****@gmail*****> wrote:
> 06/06/21 に Etsushi Kato<ek.ka****@gmail*****> さんは書きました:
> > そうですね、anthy, canna だと、削除の場合、よみ、品詞、書き、の3つを
> > 指定するようです。
>
> 品詞情報そのものは持っていないので、品詞を指定するのはちょっと難しいです。よみと書きを指定するのは簡単です。

もちろん品詞は必須ではないです。それぞれの漢字変換システムに応じて
個人辞書の一覧 (読み、書き、あれば品詞、頻度など) を作るような感じ
に uim の辞書ツールは今のところなっているようです。

ということで (mana-delete-private-dic-word "kaki" "yomi") といった
感じで mana として問題ないのであれば、それでいいと思います。

> > 個人辞書の一覧については、scheme の list の形で一括で出していただけれ
> > ば特に問題ない気がします。ただ、学習した内容は除いたほうがいいのかも
> > しれませんが、内部的にどのような区別がなされているのが理解していない
> > ので、ちょっとよくわかりません。
>
> 学習した内容との区別はないので、除くことはできないです。一覧は全単語を一度に出力する、ということでよいでしょうか?

(mane-list-private-dic-words)
などとしたら、
(("yomi0" "kaki0" "etc0") ("yomi1" "kaki1" "etc1") ("yomi2" "kaki2" "etc2"))
となど返ってくるのを意図していますが、どうでしょうか?
同じ読みに対して複数の書きがある場合も多いと思いますが、
(("yomi0" "kaki0-0" "etc0-0") ("yomi0" "kaki0-1" "etc0-1") ("yomi1"
"kaki1" "etc1"))
といった感じであれば、辞書ツールとしては扱いは楽な気がします。

ところで、mana の場合、茶筅のコスト (素人でよくわかっていませんが…)
も重要な値に見えるのですがこれらもユーザが変更できる (してもいい)と
考えていいのでしょうか? それとも、システム的に自動的に調整されるので、
いじるべきではない値でしょうか? もしユーザがいじってもいい値なのでし
たらこういった情報も辞書ツールで扱えるようみなっているといいかもし
れません。
-- 
Etsushi Kato
ek.ka****@gmail*****



Shinji-devel メーリングリストの案内
Back to archive index