豪鬼メモ

一瞬千撃

英文コーパスの簡易インデックス作成

英文の単元語コーパスや英文を含む多言語コーパスを高速に検索するための簡易的な索引を作るプログラムを書いてみた。辞書に収録した語句の例文を表示するための利用を念頭に置いている。貧弱なノートPCでも大きなコーパスを扱うための工夫をいくつかしたので、メモしておく。

Read more

中心語判定による英熟語の単語への付与

英和辞書の各単語の説明において、その単語を含む熟語を載せるにあたり、今までは前方一致と後方一致のみをサポートしていた。例えば、「dry」に関しては前方一致の「dry ice」などや後方一致の「make dry」などを収録していた。それだと「part」に関して「take part in」を収録できないという問題があった。今回はこれを解決した。

Read more

Kindle用英和辞書の未収録派生語転送

Kindle用英和辞書で、ファイル容量の制限のために収録できなかった派生語を、派生元の語の別名として登録した。これにより、辞書に収録されなかった派生語を調べた場合にも、次善策として派生元の語が表示されるようになった。さらに、派生関係を使った訳語の伝搬アルゴリズムも少し改良して、より多くの語に訳語を付与した。結果として、和英辞書のカバレッジも少し上がっている。

Read more

Kindle用英和辞書の分詞派生語対策

Kindle用英和辞書で、現在分詞や過去分詞が独立した見出し語として登録されている場合に語幹の動詞が検索できないという問題に対処した。昨日の今日だが、従来のバージョンを使っている人はぜひ更新してほしい。和英の方は変わっていない。なお、デバイス上の辞書ファイルを上書きした際には、再起動するか、メニューで辞書を選択しなおすことが必要である。

Read more

重要句動詞とKindle用英和辞書

「check out」などの句動詞の出現頻度別ランキングを改めて算出してみた。「check it out」などのように間に代名詞を含むパターンも集計対象に加えたので、より妥当な結果になったと思う。さらに、Kindle用英和辞書で、重要句動詞が調べやすいように改良した。

Read more