豪鬼メモ

一瞬千撃

Kindle用英和フォールバック辞書

Kindle用英和辞書の45万語収録のバージョンを作った。メインの英和辞書は容量制限の都合で収録語数を13万語程度に絞っているが、その収録内容を簡易化することで語数を増やしたものだ。


統合英和辞書WiktionaryWordNetやその他のコーパスを統合したおかげで45万語の収録語数を誇るが、その全部をKindle用英和辞書に収録することはできない。辞書のデータが100MBちょいを超えると、mobiファイルを作成するKindle Previewer 3が落ちてしまうからだ。

ところで、Kindleには複数の辞書をインストールしておくことができる。ポップアップで語句の意味を調べようとした際には、各言語の主たる辞書として指定された辞書が調べられる。該当がなかった場合には、Wikipediaを調べるフォールバック措置が発動する。これは、基本的に嬉しくない。Wikipediaに載っているのは固有名詞か、とても簡単な普通名詞だけなので、マイナーな語に対するフォールバック措置としては不適切なことが多い。Wikipediaにフォールバックした場合でも、横にスワイプして辞書を選択すれば、他の辞書を探すことは可能である。つまり、主たる辞書としては普通の英和辞書を指定しておきつつも、今回作った英和フォールバック辞書も入れておくことで、詳細さとカバレッジの両方を満たすことができるというわけだ。


普通に英文を読んでいる際に、普通の英和辞書の13万語の語彙で不満が出ることはまずないだろう。言い換えると、フォールバック辞書の45万語との差分である32万語があって嬉しいケースは、ほとんどない。ただし、たまに、ある。"babelize"(混乱させる)とか、"babeship"(赤ちゃん時代)とか、造語やスラングっぽい語は普通の英和辞書からは漏れてしまうが、小説や雑誌の記事には出てくる。そんな語は初見だったとしても字面だけ見れば意味の予想はつくことが多いが、いちおう調べた時に該当の項目がないとがっかりしてしまうのが人情だ。フォールバック辞書があればその確率が低まる。普通の英和辞書は発音と訳語リストと語義説明を載せているが、フォールバック辞書では訳語リストしか載せていない。とはいえ、マイナーな語が多義語であることはまずないので、訳語だけあれば十分だろう。過去形などの屈折形でも検索できるなど、検索などの機能は基本的に元の英和辞書を踏襲しているので、利便性は高いはずだ。

マイナーな語の他に収録されていると嬉しいのは、複数語からなる慣用句や句動詞である。例えば、「set」で始まるフレーズ131個も収録されている。これらをわざわざ調べる可能性は低いだろうが、念の為でも収録されていると、心強い。これで出てこなければ、わからなくても仕方ないと割り切れる。

これで、統合英和辞書のKindle用辞書は、英和辞書英和例文辞書英和フォールバック辞書の三つになった。Kindleにバンドルされているオックスフォード英英辞書とプログレッシブ英和辞書の両方の長所を備え、かつカバレッジも高いので、読解に困ることはまずないだろう。以下にそれぞれの内容を並べてみる。




まとめ。訳語のみを収録することで、容量制限内で45万語の収録語数を達成した英和辞書を作った。これだけを使うのは不便だが、詳細な英和辞書で語義が見つからなかった場合の代替措置として便利なことが、ごくたまにあるだろう。使う頻度は多くなくても、念の為インストールしておくと、精神衛生上は良いかもしれない。