JTalk が漢字「規」を「ブンマワシ」と読み上げる
JTalk で「規則」のような熟語ではなく単独で「規」という文字が使われていたり、未知語に「規」という文字が含まれているときに「ブンマワシ」と読み付与されています。
これは不具合ではなく、コンパスのことを表すときに「規」と書いて「ブンマワシ」と読むのだそうです。
Open JTalk の naist-jdic.csv に下記のエントリがあります。
規,1345,1345,6390,名詞,一般,*,*,*,*,規,ブンマワシ,ブンマワシ,0/5,C1 規,1351,1351,8405,名詞,固有名詞,人名,名,*,*,規,タダシ,タダシ,1/3,C1
普通名詞なので読み付与が優先的に選ばれているのだと思います。
ただ、「規」が含まれる未知語で高頻度で「ブンマワシ」の読みが使われるのは、不自然と言えます。
アドオン版音声エンジン nvdajp-jtalk-121129 までのバージョンもテキスト解析辞書は同じです。
この問題に対する暫定的な対応を miscdep 120 で行いましたが、リリース版への反映は 2013.1jp 以降になります。ご了承ください。
JTalk で「規則」のような熟語ではなく単独で「規」という文字が使われていたり、未知語に「規」という文字が含まれているときに「ブンマワシ」と読み付与されています。
これは不具合ではなく、コンパスのことを表すときに「規」と書いて「ブンマワシ」と読むのだそうです。
Open JTalk の naist-jdic.csv に下記のエントリがあります。
普通名詞なので読み付与が優先的に選ばれているのだと思います。
ただ、「規」が含まれる未知語で高頻度で「ブンマワシ」の読みが使われるのは、不自然と言えます。
アドオン版音声エンジン nvdajp-jtalk-121129 までのバージョンもテキスト解析辞書は同じです。
この問題に対する暫定的な対応を miscdep 120 で行いましたが、リリース版への反映は 2013.1jp 以降になります。ご了承ください。