dune
FZH01****@nifty*****
2009年 5月 11日 (月) 19:36:50 JST
Abudo Hariri <abudu****@gmail*****>さんのメッセージを転送します。 安田敏博さま 大変お世話になりました。ありがとうございました。 > 共起頻度の数え方はどうすれば良いでしょうか? 私の希望が(2)の通りです。私は本プログラムを利用して、日本語と中国語の文 字を解析して見ましたが、ウイグル文字の体験はなかったのです。これから自分で も勉強しながら他の皆さんにも紹介することを目的しています。今日本当に良い勉 強になりました。 > > (1)は、内容が[men][uyghur][bolimen]という三つのファイルを分析した結 > 果です。一つの文章の中にmenという単語が出てくる度にN-gram分析するの > か。それよりは文章ではなく、単語集や辞書の見出しを分析したほうが効率 > 的? ご指摘ありがとうございました。 > (2)は、ファイルsample.txt の中身を[men-uyghur-bolimen]としてmorogram > で分析し、結果から-を含む部分を削除したものです。コマンドラインでは > 以下のようにします。 > > morogram-0.7.1yCJKT.exe --f=1 --g=1 sample.txt | find /V "-" このような使い方を考えていませんでした。試して見ましたが、期待通りでした。 この形で作って頂ければ幸いです。 失礼ですが、安田敏博さまも言語解析やっていらっしゃる方でしょうか。 このプログラムの配布に関して何か気を使うことがありますでしょうか。 制限がなければウイグル語の説明書作って、配布したいと思っています。 これからもよろしくお願い致します。 アブドハリリ > -- > 安田敏博 FZH01****@nifty***** > http://www.jognote.com/?id=n%B3%C8%8F%FD_%E1%88 > http://mixi.jp/show_friend.pl?id=19931031 > http://hpcgi1.nifty.com/dune/gwiki.pl > > -- ---------------------------------------------------------------------------------------------------------- アブドレイム・アブドハリリ ABUDUREYIMU/ABUDUHALILI 千葉大学大学院自然科学研究科 博士後期課程 住所: 〒263-8522 千葉市稲毛区弥生町1-33 千葉大学文学部 土屋研究室 電話: 043-290-2277(研究室) FAX: 043-290-2278 (研究室) E-mail: abudu****@gmail***** harir****@cogsc***** HP : http://cogsci.l.chiba-u.ac.jp/~hariri -- 安田敏博 FZH01****@nifty***** http://www.jognote.com/?id=n%B3%C8%8F%FD_%E1%88 http://mixi.jp/show_friend.pl?id=19931031 http://hpcgi1.nifty.com/dune/gwiki.pl