待辦事項 #27694

隣接コストの不具合

啟用日期: 2012-02-26 00:49 最後更新: 2012-02-27 12:20

回報者:
負責人:
(無)
類型:
狀態:
關閉
元件:
(無)
里程碑:
(無)
優先權:
5 - 中
嚴重程度:
5 - 中
處理結果:
檔案:

細節

Java版Igo0.4.3に自作辞書を読み込ませたところ、思うような結果が得られません。

読みにくく加工(あ行をガ行に置換するなど)した日本語の文章を、元の文章に戻すということをやっていました。 MeCabで動作確認したものをIgoを使ったものに移植したのですが、動作が大きく異なります。

  • 「ギボヂヂソギギダバ」→「命拾いしたか(MeCab)」「命拾い下か(Igo)」
  • 「ボセパクウガンデスド」→「これはクウガのベルト(MeCab)」「これ羽クウガのてると(Igo)」

文法を考慮して変換を行うために形態素解析を行なっているのですが、Igo版では文法を無視した変換をしてしまいます。 詳細は http://shogo82148.hatenablog.com/entry/2012/02/25/233542 に書きました。使用した辞書は https://github.com/shogo82148/Grongish から入手可能です。

trunkのコードを確認したところ、隣接コストの計算に間違いがあるように思います。 確認をお願いします。

Ticket History (3/3 Histories)

2012-02-26 00:49 Updated by: shogo82148
  • New Ticket "隣接コストの不具合" created
2012-02-27 12:20 Updated by: phjgt
評語

r108で対応。

原因: ・以下の二つのクラスでの隣接コストマトリックスの添字計算方法が間違っていた
 ・net.reduls.igo.dictionary.build.Matrix
 ・net.reduls.igo.dictionary.Matrix

誤: Matrix[左品詞ID*左品詞数 + 右品詞ID]  
正: Matrix[左品詞ID*右品詞数 + 右品詞ID]  ※ => Matrix[左品詞ID][右品詞ID]
2012-02-27 12:20 Updated by: phjgt
  • 狀態 Update from 開啟 to 關閉
  • Ticket Close date is changed to 2012-02-27 12:20

Attachment File List

No attachments

編輯

You are not logged in. I you are not logged in, your comment will be treated as an anonymous post. » 登入