前回の記事にて、ChatGPTを使って英語の任意のフレーズを含む例文を集めた。今回はその結果にDeepL翻訳を適用して、英語の重要フレーズ13.5万語に対して各2つずつ対訳例文を付与した27万文の対訳例文コーパスを作った。結果のTSVデータはこちらでダウンロー…
話題沸騰の自動チャットシステムChatGPTだが、そのAPIを使うと英語の例文の収集が非常に簡単にできる。その方法を紹介する。
データベースライブラリTkrzwに暗号化データベースの機能をつけた。AESとRC4をサポートしている。圧縮データベースの機能を流用し、データを暗号化しつつも、全体を復号することなく、特定のレコードの検索や更新ができるようになる。もちろん一定の性能低下…
"collected"という単語は、"collect"の過去分詞であり、「集められた」という意味で使われると同時に、「冷静な」という意味の派生語としても機能する。ならば、"collected"の例文には、なるべく「冷静な」という意味での用例を含んでいて欲しい。そのように…
コールバック関数を読んでデータベースの内容をアトミックに調べて更新する機能をGo言語版にもつけた。これでJava/Python/Rubyも含めた全言語でコールバックが使えるようになった。
統合英和辞書システムにいくつか改善を加えた。オンライン検索で検索結果の二度引きができるようにして、特にChrome拡張ポップアップ辞書での利便性が向上した。また、オンライン検索とKindle用英和例文辞書の双方で例文の表示を改善した。さらに、オンライ…
辞書検索システムで例文の全文検索を実装するために、下層のC++/Pythonライブラリに手を加えた。ついでにRubyでも同等の機能を実装した。すなわち、DBMライブラリTkrzwのPythonバインディングやRubyバインディングやJavaバインディングにて、コールバック関…
Kindle用の英和辞書の亜種として、英和例文辞書を作った。読書中に出会った言葉の他の用法がどうしても気になってしまった場合に便利だ。以下のMOBIファイルをダウンロードしてKindle実機にインストールしてほしい。通常の英和辞書と併用するとお得だ。 英和…
This story is about the recent update of the Chrome extension to use the union English-Japanese (and Japanese-English) dictionary as a pop-up dictionary. It features switching among data sources, showing example sentences, showing collocat…
日本語の辞書の順番で文字列のリストをソートするための手順をメモ。Pythonで実装した。それに基づいて、和英辞書の見出し語の順序も標準的な日本語文字列照合順番に合わせるように変更した。 和英辞書MOBI
映画等の字幕の対訳を集めてコーパスにしたJESC(Japanese-English Subtitle Corpus)から抽出した対訳文を、英和辞書の例文として付与した。クリーンアップやフィルタの面倒だった話をメモ。
統合英和辞書に対訳例文を付与した話。対訳コーパスを元にしたので、英語の例文だけではなく、その訳も読める。実際の用例とそこでの意味が把握できるようになったので、英作文やスピーキングの際により便利な辞書になった。
統合英和辞書のWeb検索機能でより簡単に類語検索ができるようにしてみた。また、句動詞の拡充を頑張ってきたが、それ以外のコロケーション(連語)の拡充にも取り組んでいる。その経過報告。例によってKindle用英和辞書の最新版も更新して結果を反映させてい…
英文コーパスを対象とする検索や統計処理を行う際には、英単語の屈折を正規化したり展開したりしたくなるだろう。それを簡単に行うためのPythonライブラリを作ったという話。
英文の単元語コーパスや英文を含む多言語コーパスを高速に検索するための簡易的な索引を作るプログラムを書いてみた。辞書に収録した語句の例文を表示するための利用を念頭に置いている。貧弱なノートPCでも大きなコーパスを扱うための工夫をいくつかしたの…
英和辞書の各単語の説明において、その単語を含む熟語を載せるにあたり、今までは前方一致と後方一致のみをサポートしていた。例えば、「dry」に関しては前方一致の「dry ice」などや後方一致の「make dry」などを収録していた。それだと「part」に関して「t…
Kindle用英和辞書で、ファイル容量の制限のために収録できなかった派生語を、派生元の語の別名として登録した。これにより、辞書に収録されなかった派生語を調べた場合にも、次善策として派生元の語が表示されるようになった。さらに、派生関係を使った訳語…
Kindle用英和辞書で、現在分詞や過去分詞が独立した見出し語として登録されている場合に語幹の動詞が検索できないという問題に対処した。昨日の今日だが、従来のバージョンを使っている人はぜひ更新してほしい。和英の方は変わっていない。なお、デバイス上…
「check out」などの句動詞の出現頻度別ランキングを改めて算出してみた。「check it out」などのように間に代名詞を含むパターンも集計対象に加えたので、より妥当な結果になったと思う。さらに、Kindle用英和辞書で、重要句動詞が調べやすいように改良した…
最近は、折を見て自転車でスラローム走行をしている。足腰と体幹と心肺能力を同時に鍛えられ、反射神経や平衡感覚も鋭敏になり、体脂肪を燃やし、ついでに移動もできるという一石四鳥の健康法だ。
小型バイクGrom125を借りて、奥秩父までツーリングしてきた。三峰神社、滝川ダム、小鹿バイク神社など。下の写真は三峰神社で久しぶりに手持ちSTFモードを使ってみた作例。
原付二種を買って乗り回したいが諸事情でそれができない私のために、レンタルバイクを駆使してバイクを楽しむという方法について、コスパを主眼に検討してみた。
リターンライダーのレンタルバイク行脚の最終章として、CB400スーパーフォアで富士五湖ツーリングに行ってきた。エンジンから出ている4本のパイプがめっちゃ格好いいバイクだ。
バイクで走ると手が凍える季節が始まりつつあるが、快適期間の最後を味わうべく、今週はVTR250を借りて箱根方面をツーリングしてきた。トラス風フレームがVツインエンジンを包んでいるのがめっちゃ格好いいバイクだ。
残り少ない晩秋の快適さを満喫すべく、今週はRebel250を借りて三浦半島と湘南をツーリングしてきた。とても低いシートからタンクに向かって反り上がるシルエットがめっちゃ格好いいバイクだ。
バイクに乗って気持ち良い季節を満喫すべく、今週はGrom125を借りて道志みちと相模湖をツーリングしてきた。実用ミニストリートファイターって感じの無駄を削いだ意匠がめっちゃ格好いいバイクだ。
唐突にバイクに乗りたくなったので、バイクレンタルでMonkey125を借りて、奥多摩湖に行ってきた。実用的な性能を備えつつ趣味性全開の意匠を凝らしためっちゃ格好いいバイクだ。
1ヶ月ほど前にレーシックの手術を受けて、視力が両眼1.5に回復した。視力0.2なのに裸眼で過ごしていた身からすると、視力1.5の世界は全く異なって見える。手術のおかげで日常空間の鮮やかさと臨場感に開眼したとも言えよう。
M.Zuiko 17mm F1.2 Proがあれば、大口径なので、主要被写体から離れて撮ってもそこそこボケ感のある絵が撮れるはずだ。25mmに比べるとボケ半径が0.68倍になるが、F1.8からF1.2に1段上げることでボケ半径が1.41倍になるので、双方を掛けて0.95倍だ。航空公園…
天気が良かったのでサイクリングして海でも見ようと思い立ち、湘南方面まで足を伸ばしたという日記。全例M.Zuiko 17mm F1.2 Proで撮影。