Hiroyuki Komatsu
komat****@taiya*****
2004年 1月 28日 (水) 15:35:41 JST
At Wed, 28 Jan 2004 14:41:08 +0900, akira yamada wrote: > たとえば、「陰陽師」のようなのだと > 正確には「陰」=「おん」、「陽」=「みょう」ではないでしょうが、 > 「おん陽師」や「おんみょう師」などから「陰陽師」を求められるといいな > と思うのはなんとなく分かってもらえると思います。 はい。僕もそこまでやれたらいいなと思っています。 > 一文字ごとに辞書引きしてみたところですと、 > せっけい→設計のように「っ」が入る語、 > めんどう→面倒、ぜんぱん→全般のようににごる語、 > 時計、暢気など、陰陽師と同じようなケースが > うまくないようです。 > > # めちゃくちゃおおざっぱなスクリプトを書いて調べたもので、 > # ノイズがかなり入ってしまっていますが、 > # スクリプトと結果を以下に置いておきます。 > # http://arika.org/tmp/t1.rb prime-dictをgdbmにする > # http://arika.org/tmp/t3.rb 辞書引きする > # http://arika.org/tmp/t3.txt 結果 拝見しました。27,000語に失敗していますね。結構多い数ですね。 うーん、個別に辞書に登録していくだけでなく、新しいアルゴリズムも 考えた方がよさそうかなあ…。 -- 小松弘幸 ----------------------- http://taiyaki.org/ > 愛憎後知恵 これ、どういう意味ですか? (^^;