パソコンと古文書解読

第5話 とことん単語登録

 

文字を打込んで、一発の「変換」で目的の文字が表示されると、気持のいいものです。
ところが、古文書では、現在では死語になっている語句が多く使われているので、たとえば「村帖」も一発で変換は出来ません。現代語を想定して作られた「日本語入力システム」では仕方のないことかもしれません。
まず、「村」と「帖面」を出し、「村帖面」から「Back space」キーで「面」を削ることになります。「村帖」が出てくる度に、この操作をしていたのでは非能率ですから、すぐ「むらちょう」の読みで「単語登録」をします。次回からは「むらちょう」 → 「村帖」と一度に変換できます。

日本語入力システムは自前の「辞書」(システム辞書)を使って仮名(読み)を漢字(単語)に変換します。
普通の国語辞典は「読み」に対応して「漢字」・「意味」などが示されますが、この辞書は読みと漢字の対応だけしか持たない「辞書」です。この膨大な収録単語の対応表のおかげで漢字に変換できます。(「ぱそこん」と「パソコン」の対応もあるので、片仮名にも変換できます)。
逆にいうと、辞書に登録してないと、パソコンの持っている漢字でも一発変換はできないのです。「単語登録」は自分用の辞書(ユーザー辞書)を作り上げる作業です。

古文書用の「ユーザー辞書」の作成ともなると、多くの単語登録が要求されますが、まとめて登録するのは大変ですから、文書作成中に変換できない用語に出くわすと、そのつど登録します。全て、すぐに単語登録するようにします。

単語登録するには、登録する単語を反転させ(範囲指定)、「Ctrl」キーを押しながら「F7」キーを押と、「単語登録」画面が出ます。登録する「単語」は範囲指定したので「窓」に表示してあります。「読み」だけを記入して、「Enter」キーを押せば完了です。品詞指定は、面倒なので大抵は「名詞」のままで登録します。
すると、いつの間にか自分用「古文書用辞書」ができあがり、入力が楽になり、貴重な財産となります。

以前は、歴史的仮名遣いの表示に困っていました。「おもふ」を変換しても、「思ふ」ようにはなりません。日本語ワープロで歴史的仮名遣いの変換が出来ないのでは、「日本語」の文字が泣きます。ところが、Atok16から「表現モード」を「文語」に設定すると「思ふ」ように変換できるようになりました。
それまでは、これも単語登録をしていました。「単語」欄に「思」を、「読み」欄に語幹「おも」を入れ、「ハ行四段」の活用で登録すると、「おもふ」 → 「思ふ」に変換できるようになります。

Atok16の「ヘルプ」によると、単語登録するときの「単語」と「読み」には、次のような決りがあります。

「単語」は、全角・半角を問わず64文字以内、漢字・ひらがな・カタカナ・アルファベット・数字・記号を登録できますが、特殊記号は登録できません。
「読み」は、全角のひらがな、全角・半角のカタカナ・アルファベット・数字・記号(゛゜−+*/_#$%&=@:;・ ’ ^ ~ `<>¥〜)を使用できます。スペース・漢字・独仏文字・発音記号・特殊記号は使用できません。
読みの先頭に、 ー゛゜ を使用できません。

このルールを頭に入れて、「読み」を短縮して単語登録(短縮登録)すれば、役に立ちます。たとえば、「まいl」の読みで、自分のメールアドレスを登録します。「まいl」とは何か?……本人は「mail」と打ったつもり、IMEが働いているので「mai」が「まいl」になりました。
インターネットを使っているとき、IDの入力を要求されることがあります。これも単語登録しておき、Atokが動いているなら、「id」とタイピングするだけで用がたせます。(各種のIDはできるだけ統一しています)

子音だけを使う「読み」は日本語にはないので、Atokの辞書とぶつかることもなく、好都合です。
古文書でよく使われる「」の文字は入力の難しい文字です。「町」と書きたいとき「matino」を変換すると「町」になってしまいます。そこで、必ず一発で「」に変換するため、単語登録をします。
「播磨」は「播磨」になるので、「」も登録します。

x」 → 「之」
y」 → 「屋」
z」 → 「ニ」(カタカナ)

cyou」と打って「町」と変換するとき、私の指はうまく動きません。そこで、

c」 → 「町」

2文字以上の子音を組合わせて「読み」に使うと、キーをたたく回数が減ります。
私のよく使う、「hirosima」→「広島」の変換には、

hs」 → 「広島」

ただし、短縮登録は記号と同じで、作った本人が忘れてしまうようだと役に立ちません。

(読み)  →  (単語)
―――――――
「ざ」 → 「左衛門」
「え」 → 「右衛門 」
「w」(wo) → 「を」
「q」(左上隅) → 「()」 
「・」(右下隅) → 「【】 」
「・」(右下隅) → 「"" 」
「p」(page) → 「 頁 」
「l」(エル) → 「ヽ 」
「l」(エル) → 「ゝ 」
「l」(エル) → 「ゞ 」
「l」(エル) → 「ヾ 」
「k」(kou) → 「候 」
「g」(goza) → 「御座」 
「m」(mousu) → 「申 」
「j」(juu) → 「拾 」
「y」(ya) → 「 屋 」
「d」(dou) → 「 同 」
「kg」(kaigyou) → 「\n」 
「tb」(tabu) → 「\t」
「ぃね」(line)  → 「――――――――――――――――――――――――」
「てん」 → 「……」


同じ「読み」に、同類の「単語」を複数あてます。
「【」と「】」はペアで使うので、「【】」のようにセットで登録します。
「\n」は「改行記号」、「\t」は「タブ記号」です。エディタでの「検索」「置換」に役立ちます。(後述)
ぃね」は「line」とタイピングした積り。「せん」の読みで登録すると「千」などと一緒になって困るので。

「1+」 → 「一日」
「1+」 → 「朔日」
「2+」 → 「二日」
…………
「20+」 → 「二十日」
「20+」 → 「廿日」
…………
「1−」 → 「一月」
「12−」 → 「十二月」
「12−」 → 「極月」 

「+」は「日」、「−」は「月」の略号とした登録です。「+」「−」もテンキーにあるので月日の入力は楽になります。 

古文書では漢数字がよく出てきます。
「千弐百三拾四」を表示したいのに、「1234」を漢数字に変換すると、「壱千弐百参拾四」になるか、
「千二百三十四」になってしまいます。困ったことです。「壱千弐百参拾四」の表記は、証書などの改竄を防ぐための表記でしょうが、検地帳など正式な書類では「壱」「弐」「拾」だけを大字とします。
そこで数字変換システムに頼らないで、これも単語登録して個別に対処します。 

「1g」 → 「壱合」
「2g」 → 「弐合」
「3g」 → 「三合」
…………
「1s」 → 「壱升」
「2s」 → 「弐升」
「3s」 → 「三升」
…………
「1t」 → 「壱斗」
「2t」 → 「弐斗」
「3t」 → 「三斗」
…………
「1k」 → 「壱石」
「2k」 → 「弐石」
「3k」 → 「三石」
…………

「ぶんかがんねん」 → 「文化元年(1804)」 (横書き用)
「ぶんか2ねん」 → 「文化二年(1805)」
………… 
「ぶんかがん」 → 「文化元年(1804)」 (横書き用)
「ぶんか2」 → 「文化2年(1805)」
………… 
「ぶんかがんねん」 → 「文化元年(一八〇四)」 (縦書き用)
「ぶんか2ねん」 → 「文化二年(一八〇五)」
………… 

と、単語登録すれば、年表を見なくても西暦換算を付け加えることが出来ます。当然、西暦付記の年号として入力できますが、参照するだけにも使えます。「読み」とその「漢字」の対応ではなく、「読み」と「内容」を対応させて単語登録すると、一種の辞書機能を持たせることも出来ます。
登録単語に「コメント」をつけて辞書機能をもたせることもできます。(Atokヘルプ参照)

「じとくいん」→「自得院  《@浅野長晟》」  《 》内がコメント。
「ぶんか2」→「文化二年(1805) 《乙丑、閏8》」 乙丑の年で閏八月がある。

これらの登録は数が多いので、まとめて処理(「単語ファイルを利用して、単語を一括登録する」)するのが能率的です。(Atok16ヘルプ参照)。

  

inserted by FC2 system