討論區: 公開討議 (Thread #37861)

驚きました (2016-07-06 18:25 by dizzbuzz #78305)

EPWINGについて調べる中に、ここにたどり着いたのですが、まさか『言海』の電子化を試みている人がいるとは。正直感動しました。
一語一語の語釈を解読することは、私にも何とかできますが、それら全てを読み解いて、しかも電子テキスト化するというのがどれほどの手間がかかるか、想像に難くありません。
『広辞苑』、『漢語林』からの注釈を加えるというのも、私には思いもよらない工夫でした。確かに『言海』を引くときは、一緒に広辞苑を引いて、意味の確認をすることが多いです。

感想を書いていると際限なく長くなるので、とりあえず打ち切って、気になった点を幾つか。勘違いであれば申し訳ありません。

語釈中、他の仮名はひらがなカタカナを逆転させているのに、「ゐ、ヰ」「ゑ、ヱ」についてはそのままにしているように見えます。これは何か意図あってのことですか?

「#!」「#?」はどういった意味の註記でしょうか。

「『言海』読解試験」では「跡が立つ」という言葉が問題になっていましたが、『言海』には「跡を立つ」という用例しか見当たりませんでした。「を」と「が」では目的語と主語で大きく意味が変わってしまうのではないでしょうか。

回覆 #78305×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-07-06 21:53 by ohkubo-k #78307)

dizzbuzzさん、こんにちは。
こんなサイトを見つけてくださり、ありがとうございます。

[メッセージ #78305 への返信]
> 語釈中、他の仮名はひらがなカタカナを逆転させているのに、「ゐ、ヰ」「ゑ、ヱ」についてはそのままにしているように見えます。これは何か意図あってのことですか?

いいえ、単に、そうだと言うことを知らなかったからです!!!!
お恥ずかしい限りですが・・・
「ゐ、ヰ」については6月中に気づきました。「ゑ、ヱ」は今知りました。なので、今日までに入力したテキストに「ヱ」はありません。
もうすぐ、「い」の入力が終わりますので、その1回目校正とあわせて、「あ」について見直す必要がありますね。いわゆる旧漢字については、対応表などを先に準備したのですが、「ゐ、ヰ」「ゑ、ヱ」の対応関係は全く気にしていませんでした・・・。


その関連で言えば、漢字のふりがなで「ネ(ね)」が「子?」(子供の子?)になっているように見えるものは、何か意味があるのでしょうか?
たとえば、「あぐ」の(五)に「音(★)を上げる」とあり、★はネの音で間違いないと思いますが、この★に入るべき文字がよく分かりません。

★「あぐ」の(五)「音(★)を上げる」
http://www.babelbible.net/genkai/genkai.cgi?mode=right&imode=0&noexpand=0&page=8

★「あしびきの」の「―岩根(いわ子?)」
http://www.babelbible.net/genkai/genkai.cgi?mode=right&imode=0&noexpand=0&page=15

★「あだ」の(一)「―寝(子?)」
http://www.babelbible.net/genkai/genkai.cgi?mode=right&imode=0&noexpand=0&page=17


このくらい「恐ろしい」レベルの人間が作業していて、さらに、印刷品質が悪くまともに読めない字も多いので、辞書によるこまめな確認は必須だと思っています。問題は旧字体より、普段使わない複雑な漢字、特に| | に挟まれた漢語です。もちろん中国語も「ニーハオ」しか知りません。講談社の日中辞典も買ったのですが、対象・時代が異なりすぎて、5分で役に立たないと分かりました(私の使い道が特殊すぎるだけで、この辞書が悪いわけではありません)。

「なんていい加減な当て字だ!」と思ったら、広辞苑にちゃんと載っていたりして、毎日愕然としています。
たとえば「不便(ふびん)」って「不憫」だろ!と思ったら、広辞苑に「ふ‐びん【不便】(「不憫」「不愍」は後の当て字)・・・」と出ていたりとか。


> 「#!」「#?」はどういった意味の註記でしょうか。

#!は「へえ!そうだったのか!」、#?は「そうなの?よくわからないけど?」、#*は「誤記と思われる」(括弧の対応がおかしいとか、広辞苑の記述に疑問あり、とか、ごくわずか)です。
このあたりは、まだまだ下書きテキストなので、私の校正のためにもそのままになっています。そんなところを気にするほどご覧になる方が現れるとは思ってもいませんでした。


> 「『言海』読解試験」では「跡が立つ」という言葉が問題になっていましたが、『言海』には「跡を立つ」という用例しか見当たりませんでした。「を」と「が」では目的語と主語で大きく意味が変わってしまうのではないでしょうか。

ご指摘ありがとうございます。修正版をアップしました。

またなにかお気づきの点がありましたら、どうぞご遠慮なく、どしどしお知らせください。
この手の作業は、直すのは簡単でも、誤りを見つけるのは本当に大変ですので。
回覆: #78305

回覆 #78307×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-07-11 19:57 by dizzbuzz #78322)

返信ありがとうございます。ここ数日ネットから離れていたので返信されていることに気づくのが遅れました。

「問題は旧字体より、普段使わない複雑な漢字、特に| | に挟まれた漢語です。」
分かる気がします。絶対解けないレベルの漢字クイズを用意しようとして、そこら辺を材料にしようと思ったことがあるのですが、広辞苑クラスの辞書にも、日国にも、青空文庫その他インターネット上にも見当たらなくて、出題を諦めたことがありました。日本語として使われたことがない言葉ならば、それを使うのはフェアじゃないと思ったので。

「子」に見えるふりがなに関してですが、「ね」と読むのは間違いないでしょうね。十二支でも子《ね》、丑《うし》、寅《とら》卯《う》……、と読みますし、Wikipediaの変体仮名の項(https://ja.m.wikipedia.org/wiki/%E5%A4%89%E4%BD%93%E4%BB%AE%E5%90%8D)にも「片仮名もはじめは異体字をいくつかもって生れたが、平安中期には1種類へと統合する傾向が強まり、早い段階で今とほとんど同じような一母一字に整った(ンとㄥは鎌倉時代まで[4]、ヰと井、ネと子は明治33年まで両立していた)。」とあります。
また、「ね」の項を調べてみたところ、ね(名)[直]の項の解説に「音《ネ》の義にて、……」と、「音をあげる」と同じ「音」という言葉であるでしょうに、現在使われているカタカナと変わりない「ネ」がふりがなとなっています。
つまり、文字の使い分けはとくにしておらず、活字を組んだ人が違うとかそのぐらいの理由ではないでしょうか。「子」に似た字の方が字として単純なので、小さな活字を使うふりがなとしては字が潰れにくく、優れているのかもしれません。

ちなみに関連することとして、えこ[依怙]までは語釈中で「コト」と表記されていたのが、えだち[役]からは「ヿ」と略記されています。(すべてを見たわけではないので途中でもとに戻っているところがあるかもしれません。)近代デジタルライブラリーを見る限り、2冊目に入ったのはカ行からのようですし、なんだか不思議ですね。

自分は漢検2級どころか3級だって怪しいくらいの素人なので(辞書は好きですが)、あんまり助けにはなれませんが、気づいたことを書いてみました。何か分かったことがあれば、またここで。
回覆: #78307

回覆 #78322×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-07-12 21:08 by ohkubo-k #78331)

こんにちは。

さきほど、「い」のページをアップロードしました。
  http://genkai.osdn.jp/genkai-i.html
ただし、まだなんの校正読みもしていないのでミスタイプだらけです。これから「あ」と併せて再確認します。

[メッセージ #78322 への返信]
> 分かる気がします。絶対解けないレベルの漢字クイズを用意しようとして、そこら辺を材料にしようと思ったことがあるのですが、広辞苑クラスの辞書にも、日国にも、青空文庫その他インターネット上にも見当たらなくて、出題を諦めたことがありました。日本語として使われたことがない言葉ならば、それを使うのはフェアじゃないと思ったので。

先日書き忘れましたが、#@でマークしたのは、「何じゃこりゃ?!」な漢字の使い方・読みです。当て字もあれば、ああ、そうか、という使い方もあります。

> ヰと井、ネと子は明治33年まで両立していた)。」とあります。

なるほど。ありがとうございます。
実は、「ヰと井」もなんだかよく分からない使い分けでした。
このあたりの仮名遣いについてちょっと調べてから校正読みした方が良さそうですね。全くノーマーク(知らないことを知らなかった)でした。

> ちなみに関連することとして、えこ[依怙]までは語釈中で「コト」と表記されていたのが、えだち[役]からは「ヿ」と略記されています。(すべてを見たわけではないので途中でもとに戻っているところがあるかもしれません。)近代デジタルライブラリーを見る限り、2冊目に入ったのはカ行からのようですし、なんだか不思議ですね。

そうですよね。いつのまにか、「こと」が「ヿ」になっていて、どこからだろう、と思っていました。ちなみに「子(ネ)」については、「いらか(甍)」の項で初めて「ネ」になっているのを見つけました。
http://www.babelbible.net/genkai/genkai.cgi?mode=right&imode=0&noexpand=0&page=89
回覆: #78322

回覆 #78331×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-07-13 20:04 by dizzbuzz #78337)

返信ありがとうございます。
そういえば、『言海』の奥付の前にある正誤表は本文に反映させないのでしょうか。
http://dl.ndl.go.jp/info:ndljp/pid/992954/638
国立国会図書館デジタルコレクションのものより後に印刷された『言海』には、この正誤表の内容を本文に反映し、見つかるのが遅かった誤りは新たな正誤表で知らせるという形をとっているものもあるようです。(ちくま文庫の『言海』解説より)
すでに検討済みのことであれば、申し訳ありません。
回覆: #78331

回覆 #78337×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-07-14 20:01 by ohkubo-k #78346)

ご指摘、ありがとうございます。
私もちくま文庫の(第九刷。言海の628版)を持っていますが、それの正誤表は10件程度でそれほど深刻な誤りでは無いし、まあ、いいか、と忘れていました。
が、私が作業の元にしているのは国会図書館の画像で、それだと誤植がまだまだ大量に残っていたのですね。私が気がついたものもポツポツ載っていました。

時々、誤植も当時そのままに再現することに意味があるのだ、という方も見かけますが、私がやりたいのはそこまで厳密なものでは無くて(無理です)、実用十分なものを作ることですので、ご指摘のページの誤植も反映するようにします。

今週は、冒頭の凡例と索引指南をテキスト化しました。
作業開始前にざっと目を通しましたが、改めて気づくこともありました。
語法指南はともかく、編纂の大意もテキスト化(写経)してからのほうが無難かな、と思っています。ほんとに、「知らないことを知らない」まま作業を進めるとあとで大変ですので。
回覆: #78337

回覆 #78346×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-07-15 22:11 by dizzbuzz #78353)

[メッセージ #78346 への返信]
大久保様
もう打ち込まれた後かも知れませんが、「編纂の大意」ならば、大阪大学の岡島昭浩先生のページにある語彙研究・辞書研究というところにテキストデータが置いてありました。
http://www.let.osaka-u.ac.jp/~okajima/genhen.htm
少なくとも校正くらいには活用できるかなと思いますので、一応お伝えしておきます。
最初の方に「熱語」という、手入力ならば考えられない誤字がありますので、OCRを使ったのかな?

凡例も読まないまま、辞書を引くことにやや罪悪感があったので、読みやすい形になることはとても嬉しいです。

回覆: #78346

回覆 #78353×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-07-16 17:58 by ohkubo-k #78356)

[メッセージ #78353 への返信]
> もう打ち込まれた後かも知れませんが、「編纂の大意」ならば、大阪大学の岡島昭浩先生のページにある語彙研究・辞書研究というところにテキストデータが置いてありました。
> http://www.let.osaka-u.ac.jp/~okajima/genhen.htm

ありがとうございます。
「編集の大意」は、昨日、(七)まで入力したところです。
やはり書き起こしテキストがあると、参考になりますし、悩んで選んだ文字が同じだったら、安心できます。

さっきまで神保町をうろついていたのですが、この(三)にも出てくる「伊呂波字類抄」の復刻版をみつけました。全部手書きで、辞書と言うより単語帳のように見えました。
言海は、今ごく当たり前にある辞書の形そのものなので、今の私たちからは普通に見えるのですが、五十音順だったことも含め、衝撃だったんだろうなと思いました。

また、一度だけ校正読みをした
凡例 http://genkai.osdn.jp/hanrei.html
索引指南 http://genkai.osdn.jp/sakuin_shinan.html
も仮にアップしました。まあ、こんなものもあります、ということで。

この電子化で分かったのですが、現在公開済みテキストでは
・見出し語の書体(太字、時に細字)で和語・漢語を区別している(→索引指南の12)
・促音(っゃゅょ)は、右上に細い線が付いた「つやゆよ」になっている
ことを完全に無視していました。といいますか、気づいていませんでした(大槻先生、すみません)。
これも「あ」の校正しなおしで対応します。やはり、この辺りを疎かにしてはいけないのでした・・・。
  「いイ」「ゐヰ」の見分けは簡単ですが、「エ」「ヱ」は、特に小さいフリガナの場合
  厳しそうです。EPWING版広辞苑のテキストデータを元に、チェックプログラムを
  開発したら何とかなるのか・・・


五十音順にしたことについては、索引指南の(二)に
  此事(=いろは順での辞書ひき)、馴れたらば、とも思へど、何時までも馴れぬは、
  編者が、此字引を作る十年の間、始終、験めして知れる所なり、五十音順の方、
  甚だ早し。
とありました。大槻先生は、今の我々よりずっといろは順に親しんでおられたと思いますが、それでも五十音の方が「甚だ早し」だったとは。
回覆: #78353

回覆 #78356×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-07-16 18:06 by ohkubo-k #78357)

> ・促音(っゃゅょ)は、右上に細い線が付いた「つやゆよ」になっている

・促音(っ)、拗音(ゃゅょゎ)でした。
この掲示板は投稿の削除はできますが、修正はできないようです。

回覆: #78356

回覆 #78357×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-08-07 02:30 by dizzbuzz #78472)

「どうしても分からなかった字」についてですが、パッと見て思ったのは、「葵祭」の項の文字は「簪」ではないか、ということです。
実際の活字と比べて見ても、断定はできないけれども、十分ありえるレベルで一致しているように思えますし、「葵祭 簪」で検索すると、ある程度ヒットするくらいには縁のある言葉のようです。
ただ、競馬の騎手が着けているようには、写真からは思えないのが難点ですが……
まあ、大槻文彦も葵祭を見たことがあるかはあやしいですし。
なお、簪といえば、女性が着ける装身具のイメージがありますが、言海を引いてみると別の意味があるようですね。

あまりはっきりした答えを出せなくてすみません。他のもこれじゃないかな、というものが見つかれば、またここに書きます。


回覆: #78357

回覆 #78472×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-08-07 13:51 by dizzbuzz #78474)

WEB言海で「雨落」の項を引いてみると、もう少し活字がはっきりしていました。「霤」のように見えます。意味的にも当てはまっていると思います。
「靑鷺」の項も、活字がややはっきりしていて、「莊(荘の旧字)+鳥」のように見えるのですが、手持ちの辞書にも、ネットにもそれらしき漢字は見当たりませんね……。大きな漢和辞典ならば載っているのかもしれません。
回覆: #78472

回覆 #78474×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-08-08 21:06 by ohkubo-k #78482)

ありがとうございます!!!!
ご指摘の通りだと思いました。
「あ」のHTML/PDFを更新しました。
勝手ながら「dizzbuzzさまからのご指摘」とコメント追記しておきました。

[メッセージ #78472 への返信]
> 「どうしても分からなかった字」についてですが、パッと見て思ったのは、「葵祭」の項の文字は「簪」ではないか、ということです。

私は「響」のような、左上/右上の異なる字だろうと思っていましたが、なるほど、納得です。
http://netlog.jpn.org/r271-635/2015/05/aoimaturi-01.html
の3枚目の写真
http://netlog.jpn.org/r271-635/upload2/20150515-norijiri01.jpg
みたいなものを指していたのでしょうね。
女性は、胸元に挿すようです。
http://netlog.jpn.org/r271-635/2015/05/aoimaturi-02.html
の「騎女(むなのりおんな)」の写真など。せっかくの髪が崩れますからね。

「1.冠が落ちないように、巾子(こじ)の根に挿し入れて髻(もとどり)を貫くもの。」『広辞苑』とは、やはりちょっと違いそうですので、大言海では「飾り」という表記になったのだと思います。
なお、漢語林では、
http://genkai.osdn.jp/tmp/kanzashi.png
となっていて、かんざしの漢字は2つ候補があり、どちらなのか確定しがたいので、更新した「あ」のHtMLでは「簪?」としておきました。

> WEB言海で「雨落」の項を引いてみると、もう少し活字がはっきりしていました。「霤」のように見えます。意味的にも当てはまっていると思います。
> 「靑鷺」の項も、活字がややはっきりしていて、「莊(荘の旧字)+鳥」

こちらもおっしゃるとおりです。
先ほど、諸橋先生の大漢和辞典で「莊(荘の旧字)+鳥」を探してみましたが、それらしい文字は見当たりませんでした。


実は、7月末から、漢和辞典の電子辞書(EPWING/LogoVista)を、もう少し使いやすくすべく、いろいろ試行錯誤しています。
先ほど、
大漢和辞典データベース
http://kanji-database.sourceforge.net/dict/daikanwa/index.html
なんてものもみつけました(ありがたや!!!)。これもEPWINGにして、検索の便を図りたいところです。

またお気づきの点が有りましたら、どうぞご遠慮なくお知らせください。
どうぞよろしくお願いいたします。
回覆: #78472

回覆 #78482×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-08-08 22:44 by dizzbuzz #78483)

返信ありがとうございます。

「葵祭」の項
競馬とあるので、「賀茂競馬」の写真ばかり見ていたのですが、行列の方では確かに、頭につけていますね。気づきませんでした。

「雨落」の項
「屋霤」で新漢語林にも「屋」の熟語として載っていますね。分からない漢語で、最初の一文字目がわかる場合は、その熟語を調べても良いかもしれません。

『稿本日本辞書言海』という宮城県図書館が所蔵する自筆稿本の複製が、1979年に大修館書店から出ているようです。
http://www.city.sendai.jp/kyouiku/bunkazai/database/c02719.html
活字では分からないものでも、手書きならわかるということもあるかもしれないと思いますので、紹介しました。入手するのは、値段等の理由でなかなか難しいと思いますが、国会図書館や東京都立図書館には所蔵されているようです。
回覆: #78482

回覆 #78483×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-08-09 07:01 by ohkubo-k #78489)

> 「葵祭」の項
> 競馬とあるので、「賀茂競馬」の写真ばかり見ていたのですが、行列の方では確かに、頭につけていますね。気づきませんでした。

ああ、すみません。恥ずかしながら、「競馬」を(JRAの)「けいば」だと思っていました。「くらべうま」でしたか・・・。京都へは、2回しか行ったことがありません・・・・。
http://blog.goo.ne.jp/tomisan443/e/8e25d15dfd6e302c0fd8a63185583b18
http://kyotofreebirds.blog109.fc2.com/blog-entry-649.html
たしかに、葵の葉っぱらしき物は付けていなさそうですが、細長いリボンのような葉が、馬の耳の後ろや、騎手の腰の辺りに付いているようです。
どうも「菖蒲の根合わせ」に関係がありそうです。
http://www.kamoagatanushi.or.jp/
http://kyoto-tabiya.com/blog_rakuhoku/%E4%B8%8A%E8%B3%80%E8%8C%82%E7%A5%9E%E7%A4%BE%E3%81%AE%E8%8F%96%E8%92%B2%E3%81%AE%E6%A0%B9%E5%90%88%E3%81%9B%E3%80%80%E8%97%A4%E6%A3%AE%E7%A5%AD%E3%81%A8%E4%BC%8F%E8%A6%8B%E7%A8%B2%E8%8D%B7/

今なら私のような者でもググれば写真をわんさか見られるのですが、大槻先生は大変だったろうな、と思います。

> 『稿本日本辞書言海』という宮城県図書館が所蔵する自筆稿本の複製が、1979年に大修館書店から出ているようです。
> http://www.city.sendai.jp/kyouiku/bunkazai/database/c02719.html

ありがとうございます。週末にでも国会図書館で調べてみます。これが最終必殺技(?)ですね。漢語林の熟語を眺める方法にしても、普段とは全く違う使い方なので、全然思いつきませんでした。

・Web言海
・漢和辞典の熟語欄
・『稿本日本辞書言海』
でも確認するようにします。特に Web言海はかなり効きそうです。

テキスト化を始めた当初は分からない字だらけで、1ページに1字くらいは分からないだろうと思っていたのですが、漢語部分も含めて、割合何とかなりそう(なった)のは驚きです。
回覆: #78483

回覆 #78489×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-08-10 15:36 by dizzbuzz #78496)

語法指南についてかなり信頼できそうな電子テキストがあるのを見つけました。電子テキスト化のやり方の参考にもなるかもしれません。
http://home.soka.ac.jp/~hkaneko/etxt/goho.htm

早稲田大学の古典籍総合データベースに言海原稿というものがあるのを見つけましたが、これはテキスト化の参考にはしづらそうです。最終稿ではないように見えました。

知っておられることでしたら、すみません。
回覆: #78489

回覆 #78496×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-08-13 09:01 by ohkubo-k #78507)

> 語法指南についてかなり信頼できそうな電子テキストがあるのを見つけました。

ありがとうございます。辞書本体以外は、個別に電子化されているのですね。
辞書本体の電子テキストは、あればがっかりな反面、この時代の文書をちゃんと読む練習という意味では、非常に勉強になっているので個人的には続けてみたいです。

さて、国会図書館で『稿本日本辞書言海』を手に取りました。
いや実にすばらしい物で、いままで不鮮明でさんざん悩んでいたのが馬鹿らしくなりました。
もう笑いたくなるほど、すらすら読めました。
これなしで言海テキスト化などあり得ず(あってはならず)、近日中に某所でゲット予定です。
古本でかなり安く出ていて助かりました。

まず、Web言海でも不鮮明だった魚の「あら」ですが、
http://genkai.osdn.jp/kanji/ara2.png
手書き原稿を見れば
http://genkai.osdn.jp/tmp/ara3.png
「魚+敏」で間違いありません。大漢和辞典ですぐ見つかりました。
http://genkai.osdn.jp/tmp/ara4.png
「鱈」の意味のあるようで、これでよいのでしょう。

「あをさぎ」の漢語は、やはり「荘+鳥」です。
http://genkai.osdn.jp/tmp/awosagi3.png
改めて大漢和の「鳥」部を8画~12画あたりを数回確認しましたが、見当たりません。


また、漢字データベースで公開されている大漢和辞典の親字と熟語、さらに、フリーの花園フォントをもとに、「大漢和辞典 親字と熟語だけ」EPWINGも開発中です。
http://genkai.osdn.jp/tmp/dkw1.png
http://genkai.osdn.jp/tmp/dkw2.png
字の解説は一切ありませんが、そういう字があるのか、確認するにはこれで十分そうです。
これも言海テキスト化の副産物として、いずれ公開する予定です。
回覆: #78496

回覆 #78507×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-08-16 20:30 by ohkubo-k #78524)

> これなしで言海テキスト化などあり得ず(あってはならず)、近日中に某所でゲット予定です。

いま、自宅に届きました。ヤフオクで1.5万円也。助かりました。

2回目の「あ」校正で、見出し語の和語・漢語の識別を試したものの、はっきりしないことも多いため、あきらめたのですが、手稿では、左横線のあり・なしではっきり区別できるので、やはりこれも反映させるつもりです。

変体仮名だけは、まあ、そこまでこだわりのある方は原本をご覧ください、ということで見送ります。
回覆: #78507

回覆 #78524×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-08-27 21:21 by dizzbuzz #78592)

こんなことを突っ込むのもアレですが、
『Web言海』 (画像原本は不明。この画質の良さは『稿本日本辞書言海』の複製本か?)
と書かれていますが、WEB言海は正誤表がちくま文庫のものと同じですし、本文を確認してもいろいろ訂正してあるので、違うはずですよ。ちなみにちくま文庫のも活字は小さいとはいえ、かなりはっきりした文字です。
むしろ、国会図書館デジタルコレクションの方が、私版日本辞書言海とおなじものだと思っていました。国会図書館のは奥付を見る限り初版のようですし。
国会図書館のが若干読みづらいのは、スキャンの質がやや低いだけじゃないでしょうか。

関連することですので、ついでに言ってしまうと「語法指南」の電子テキストの紹介で遠回しに伝えたかったことは、校正をちくまの言海(WEB言海を使っても同じだとは思いますが、原本がはっきりしないのは気がかりです)で行えば、初版の誤植を訂正できて良いのではないかということです。(作業量に関わることですので、完全に無視していただいて構いません。)
回覆: #78507

回覆 #78592×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-08-28 18:17 by ohkubo-k #78603)

> と書かれていますが、WEB言海は正誤表がちくま文庫のものと同じですし、本文を確認してもいろいろ訂正してあるので、違うはずですよ。ちなみにちくま文庫のも活字は小さいとはいえ、かなりはっきりした文字です。
> むしろ、国会図書館デジタルコレクションの方が、私版日本辞書言海とおなじものだと思っていました。国会図書館のは奥付を見る限り初版のようですし。
> 国会図書館のが若干読みづらいのは、スキャンの質がやや低いだけじゃないでしょうか。

全くご指摘の通りだと思います。Webページの記述をちょっと修正しました。

>校正をちくまの言海(WEB言海を使っても同じだとは思いますが、原本がはっきりしないのは気がかりです)で行えば、初版の誤植を訂正できて良いのではないかということです。

私も最初はそうできたら、と思っておりました。新しい方が誤植が直っていていいわけですし。以前、プチロワイヤルの出版年の違いと修正内容を調べたときも、やっぱり辞書は絶対に新しいほうを使うべきだと痛感しました。
 http://projectzephyr.osdn.jp/petit-royal-errata.html

ただ、ひと月ほど前にジャパンナレッジに加入し、ネット上で日国で語彙をチェックしながら校正するようになり、やはり、初版に誤植があることは承知の上で、(まず第一歩としては)初版を電子化すべきと思うようになりました。
私が思っている以上に、言海には日本語の研究分野で重要な意味を持つようです(私は全くの門外漢なので、そのあたりの感覚が全く分かりませんが)。
ちくま学芸文庫の言海は、解説の最終ページにあるように、刷りの悪いページは別の版を使用しているそうです。一般にはそのほうがありがたいのですが、ある文学部教授が言海について書いた本で、「まったく同じ版面をもった『言海』はこの世にないことになる」と書かれています。これがどうにも気になります。

実は校正読みで日国で語彙をこまめにチェックしていると、言海にある用語(もちろん和語)が日国に載っていなかったり、言海語釈中での語句の意味が日国に載っていないと思われたり、言海の語釈にあること自体がより古い用例と思われたり、日国に用例が載っていない意味でまさに言海の語釈に使われていたりと、最初はまあそんなこともたまにはあるかと思っていましたが、想像以上に見つかるので、これはしかるべき所にきちんと報告した方が良いと思うようになりました。言海の誤植よりも、そういう箇所の方がちょっと多いくらいです。
で、ジャパンナレッジの方に「日国 友の会 http://www.nikkoku.net/tomonokai/」なるものがあり、そういう新規語彙・用例と思われる箇所を編集部に投稿できるようになっています。現在システムメンテナンス中ですが、9月から再開するようです。

日国の世界での「言海」とは、凡例によれば明治24年刊初版だそうです。さすがに明治時代の現物は手に入りませんが、大修館書店の初版4分冊復刻版と稿本であれば、(あるレベル以上の)議論の対象に出来ると思います。文庫版では先の教授の指摘が引っかかりそうです。
当初は適当にノリで始めた作業でしたが、今は日国を一つの基準というか目標にするつもりでおりますので(7月に人生で始めて日国をひきました)、出典が明確なものだけを根拠にしていきたいと考えております。
もちろん、Web言海も便利などでちょこちょこは使いますが、注釈にたまたま気づいた違いなどを書く事はあったとしても、本文のテキストはあくまで初版にものとする方針です。

・・・などと最近考えるようになってきましたが、9月以降、日国友の会にいろいろ投稿してみて、何か回答が得られたら、また方針が変わるかもしれません。試行錯誤の日々です。
稿本と言海初版との違いもポツポツ見つかるのですが、それもどうしたものか・・・(差異などを注記の上、言海初版のテキストにしています)。
版を重ねる過程での誤植修正を拾うという意味では、文庫版(628版)だけでなく、文庫本解説の最後にあった第千版を入手できれば良いのですが、現実的には文庫版での比較になりますよね。

諸橋大漢和辞典も、週末に図書館に通うのが面倒でしょうがないので、安く出ていた修訂版(修訂第2版はさすがに高い)を先ほどポチってしまいました。なんか、いろいろ泥沼です。
回覆: #78592

回覆 #78603×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-08-30 00:16 by dizzbuzz #78612)

> ただ、ひと月ほど前にジャパンナレッジに加入し、ネット上で日国で語彙をチェックしながら校正するようになり、やはり、初版に誤植があることは承知の上で、(まず第一歩としては)初版を電子化すべきと思うようになりました。
> 私が思っている以上に、言海には日本語の研究分野で重要な意味を持つようです(私は全くの門外漢なので、そのあたりの感覚が全く分かりませんが)。

どこで読んだかは忘れてしまったのですが、日国の編集者が初版を使うことの重要性について書いたものを読んだことがあります。新しい刷だと、後世の編集者が勝手にフリガナをふることがあり、結果として古い時代の熟語の読みに関する資料として使えなくなる、という内容だったかな。
しかしながらこの電子テキストが、初版を基にした信頼できるテキストとして使われる可能性はなく、また近代デジタルコレクションで気軽に初版を確認できることからも、そこまでの正確性はなくて良いものと思います。
そう考えると正確性よりも、情報量と全文検索のしやすさを重視すべきでしょう。誤植の類は、全文検索の妨げになりますから、積極的に正していくべきではないかと私は思っています。
校正読みを3回行うのであれば、その1回か2回かをちくま版での校正にして、誤植の修正があれば、初版の形を注記に残した上で訂正し、その他の異同は注記に入れるというのが一番良いのではないかと。
ちくま版と、入力したテキストの差異を見つけた時に、近代デジタルコレクションのものとも比較すれば、「偶然、ミスタイプがのちの刷で訂正されたものと一致する」という例外を除いて、近代デジタルコレクションのもので校正するのと同じです。また、この例外が起こるとすれば、誤植が訂正された箇所でしょうから、正確性にそこまでこだわらないのであれば、気にしなくても良いでしょう。


> ちくま学芸文庫の言海は、解説の最終ページにあるように、刷りの悪いページは別の版を使用しているそうです。一般にはそのほうがありがたいのですが、ある文学部教授が言海について書いた本で、「まったく同じ版面をもった『言海』はこの世にないことになる」と書かれています。これがどうにも気になります。

角川選書の本でしょうか。私も読みました。しかし、WEB言海よりはマシであるはずです。WEB言海は誰が提供していたデータなのかすら不明ですし、同じようにいろんな版を混ぜていても不思議ではありません。また、WEB言海はサイト管理者の都合で消える可能性があります。消えてしまった場合、WEB言海を基にした記述の一切が検証不能になります。
それに対して、ちくま版は、企画したのは武藤康史という書誌学者の方のようですし、版元の筑摩書房も厳密な校訂作業が必要な全集(日国も出典にあげています)を多く手がけております。元のページと混ぜたページとで活字の質以外は差異がないことくらい確認しているんじゃないか、とある程度信用しても良いのではないかと思います。これはただの希望的な推測ですし、古書の方が信頼できるのは確かかもしれませんが。
しかし、古書よりもちくま版が優っているところもあります。同じものが大量に出回っているゆえに、検証が容易に可能であることです。古書の場合、流通量も少ないですし、仮に検証しても、見つけた誤りが底本にした刷の違いによるものなのか、入力ミスなのか判別できません。まあ検証する人は基本いないでしょうが。

> 実は校正読みで日国で語彙をこまめにチェックしていると、言海にある用語(もちろん和語)が日国に載っていなかったり、言海語釈中での語句の意味が日国に載っていないと思われたり、言海の語釈にあること自体がより古い用例と思われたり、日国に用例が載っていない意味でまさに言海の語釈に使われていたりと、最初はまあそんなこともたまにはあるかと思っていましたが、想像以上に見つかるので、これはしかるべき所にきちんと報告した方が良いと思うようになりました。

関連することとして確か、先の角川選書の本に『稿本日本辞書言海』で削られた記述も、大槻文彦がその時代の「普通語」と認識していた語であるはずだが、日国には反映されていないなどと書かれていたと思います。

> 版を重ねる過程での誤植修正を拾うという意味では、文庫版(628版)だけでなく、文庫本解説の最後にあった第千版を入手できれば良いのですが、現実的には文庫版での比較になりますよね。

文庫版の解説に新しい刷に古い正誤表がついてある例もあると書いてあった気がします。自分の確認した限り、ちくま版についているものが最も新しい正誤表だとも。(今手元にないので確認できません)
そうなると、より新しい刷があるということはそこまで気にしなくて良いと思います。

長文失礼しました。当然、これは大久保様のプロジェクトですから、私の提案は全て無視していただいて構いません。そもそも私も門外漢ですから見当はずれのことを言っている可能性も多々あります。
回覆: #78603

回覆 #78612×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入

Re: 驚きました (2016-07-14 20:05 by ohkubo-k #78347)

何かを検索して、このページにたどり着いた奇特な方のために(&私の備忘録):

明治三十三年「小学校令」による仮名の統一と混乱
https://jissen.repo.nii.ac.jp/index.php?active_action=repository_view_main_item_detail&page_id=13&block_id=30&item_id=240&item_no=1

当時の現物写真などもあり、大変参考になりました。
言海の語法指南冒頭の片仮名表でも、「子」(ネ)、「井」(ゐ・ヰ)になっています。
「ヲ」の真ん中の横棒も、右に少し突き出しています。
回覆: #78331

回覆 #78347×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) 登入