パソコンと古文書解読

第6話 読めない文字の入力

 

以前、新聞紙上で「」をどう読むのか話題になったことがあります。

通常の入力方法は、「読み」をタイピングして、「単語」に変換します。したがって、読めなければキーを叩くことも出来ません。また、読めたとしても、簡単には表示できない文字もあります。

今回は「読めない文字をどうして入力するか」を考えてみます。

まず手はじめに、「」を問題にします。どう読むのでしょうか。
ノマ」と読む人もいます。片仮名のノとマを合成すると」になるので、そういうのでしょう。
諸橋『大漢和』を調べてみると、「同一文字畳用の
記号」とだけ記してあり、読みは書いてありません。

これは記号ですから、通常の方法での変換は困難です。
そこで、「Atokツールバー」→「
文字パレット」を出します。「記号・よく使う文字」→「その他」を探すと「々」があり、指定して「確定」すると、表示されます。
どのような記号がどこにあるか、一応眺めておく必要があります。
「〆・々・仝」など。
○付き数字は、@〜Sまではありますが、㉑から㊿まではUnicode から取出します。

「々」には「読み」がないので「変換」することができず、仕方なしに「文字パレット」を使いました。
しかし、自分で勝手に好きな「読み」を付けて変換辞書に登録すると、簡単に表示できて便利です。
Atok16は、「々」に「どう」(同の意味か)の読みを付けて登録しています。私は「のま」で単語登録しています。自分が使う可能性の高い記号は単語登録していたほうがよさそうです。

古文書特有の「文字」(記号)があります。「ゟ」は平仮名「よ」と平仮名「り」を組合わせた合字で「より」と読みます。Unicode は「309F」ですから、「ATOK文字パレット」で「Unicode表」の「コード」の窓に「309F」を入力するとゟが表示され、「確定」すると取込めます。Unicode の「3030」から「303F」には「〳」(くの字点上半分)・「〵」(くの字点下半分)・「〴」(同濁点下半分)・「〻」(二の字点)・「〼」(枡記号)・「〽」(庵点)などが並んでいます。「〳」と「〵」を縦書で並べると「く」の字を縦に伸した「くの字点」(くり返し記号)に、「〴」と「〵」なら縦長の「ぐ」になります。いずれも単語登録すると、簡単に表記することができます。Unicode の「3192」から「319F」には、「㆒」「㆓」「㆖」など漢文の返り点があります。Unicode の「3251」から「32BF」には、㉑〜㊿までが準備されています。

パソコンの持っていない文字は、後述の「今昔文字鏡」に頼るか、自分で外字を作る外はなさそうです。

」の字も、簡単には読めません、漢和辞典を開いて、その読みを調べれば、勿論入力できますが……。
文字パレット」→「漢字検索」画面で、「部首」を「魚偏」に指定すると、305の漢字が示されます。その中から探すと、「ありましたの字! 「かん」と読むのか」と感激したくなるような面倒さです。
では、「
」はどうでしょうか。部首を「口」すると、2670字が出ます。そこで「部首」に「愛」を追加すると、見事!「噯」が表示されます。

苦労してようやく見つけた文字は必ず単語登録しておきます。
「かんか」→「鰥寡」(この字は、この熟語でつかうだけ)
「あつかう」→「噯」(動詞「扱」と同じ使い方をします。)

読めなくても入力できる、もうひとつの方法に「手書き文字入力」があります。文字パレット」から「手書き文字入力」を選び、マウスを使って「鰥」に似た字を書くと、それらしい字の候補が並びます。その中に「鰥」があればシメタものです。雑な字を書いても結構認識してくれるのには感心します。

文字が見つからないと、古文書はまともに表記できません。仕方がないので、以前は自分で文字(外字)を作りました。
大変な時間をかけて作った外字も、自分だけの文字なので、自分のパソコンでは使えるが、人の機械では使えない状態でした。

ところが「今昔文字鏡」(http://www.mojikyo.gr.jp/)という素晴しいソフト(明朝体漢字フォントとその検索ソフト)が作られ、市販されました。いまでは、16万字の単漢字を表示できるといいます。甲骨文字・梵字までもあり、大感激でした。 もう外字を作る必要がほとんどなくなりました。

  

inserted by FC2 system