豪鬼メモ

一瞬千撃

2023-01-01から1年間の記事一覧

Chrome extension for pop-up English-Japanese/Japanese-English dictionary

This story is about the recent update of the Chrome extension to use the union English-Japanese (and Japanese-English) dictionary as a pop-up dictionary. It features switching among data sources, showing example sentences, showing collocat…

日本語文字列照合順番によるソート

日本語の辞書の順番で文字列のリストをソートするための手順をメモ。Pythonで実装した。それに基づいて、和英辞書の見出し語の順序も標準的な日本語文字列照合順番に合わせるように変更した。 和英辞書MOBI

JESCの例文を英和辞書に付与

映画等の字幕の対訳を集めてコーパスにしたJESC(Japanese-English Subtitle Corpus)から抽出した対訳文を、英和辞書の例文として付与した。クリーンアップやフィルタの面倒だった話をメモ。

英和辞書に田中コーパスの対訳例文を付与

統合英和辞書に対訳例文を付与した話。対訳コーパスを元にしたので、英語の例文だけではなく、その訳も読める。実際の用例とそこでの意味が把握できるようになったので、英作文やスピーキングの際により便利な辞書になった。

英和辞書の類語検索とコロケーションの拡充

統合英和辞書のWeb検索機能でより簡単に類語検索ができるようにしてみた。また、句動詞の拡充を頑張ってきたが、それ以外のコロケーション(連語)の拡充にも取り組んでいる。その経過報告。例によってKindle用英和辞書の最新版も更新して結果を反映させてい…

英単語の屈折を扱うPythonライブラリ

英文コーパスを対象とする検索や統計処理を行う際には、英単語の屈折を正規化したり展開したりしたくなるだろう。それを簡単に行うためのPythonライブラリを作ったという話。

英文コーパスの簡易インデックス作成

英文の単元語コーパスや英文を含む多言語コーパスを高速に検索するための簡易的な索引を作るプログラムを書いてみた。辞書に収録した語句の例文を表示するための利用を念頭に置いている。貧弱なノートPCでも大きなコーパスを扱うための工夫をいくつかしたの…

中心語判定による英熟語の単語への付与

英和辞書の各単語の説明において、その単語を含む熟語を載せるにあたり、今までは前方一致と後方一致のみをサポートしていた。例えば、「dry」に関しては前方一致の「dry ice」などや後方一致の「make dry」などを収録していた。それだと「part」に関して「t…

Kindle用英和辞書の未収録派生語転送

Kindle用英和辞書で、ファイル容量の制限のために収録できなかった派生語を、派生元の語の別名として登録した。これにより、辞書に収録されなかった派生語を調べた場合にも、次善策として派生元の語が表示されるようになった。さらに、派生関係を使った訳語…

Kindle用英和辞書の分詞派生語対策

Kindle用英和辞書で、現在分詞や過去分詞が独立した見出し語として登録されている場合に語幹の動詞が検索できないという問題に対処した。昨日の今日だが、従来のバージョンを使っている人はぜひ更新してほしい。和英の方は変わっていない。なお、デバイス上…

重要句動詞とKindle用英和辞書

「check out」などの句動詞の出現頻度別ランキングを改めて算出してみた。「check it out」などのように間に代名詞を含むパターンも集計対象に加えたので、より妥当な結果になったと思う。さらに、Kindle用英和辞書で、重要句動詞が調べやすいように改良した…

スラローム健康法

最近は、折を見て自転車でスラローム走行をしている。足腰と体幹と心肺能力を同時に鍛えられ、反射神経や平衡感覚も鋭敏になり、体脂肪を燃やし、ついでに移動もできるという一石四鳥の健康法だ。