豪鬼メモ

一瞬千撃

2023-03-01から1ヶ月間の記事一覧

ChatGPT+DeepLで無料で対訳例文コーパスが作れる

前回の記事にて、ChatGPTを使って英語の任意のフレーズを含む例文を集めた。今回はその結果にDeepL翻訳を適用して、英語の重要フレーズ13.5万語に対して各2つずつ対訳例文を付与した27万文の対訳例文コーパスを作った。結果のTSVデータはこちらでダウンロー…

ChatGPTのAPIで英語の例文を集める

話題沸騰の自動チャットシステムChatGPTだが、そのAPIを使うと英語の例文の収集が非常に簡単にできる。その方法を紹介する。

AESとRC4を実装した暗号化データベースと性能比較

データベースライブラリTkrzwに暗号化データベースの機能をつけた。AESとRC4をサポートしている。圧縮データベースの機能を流用し、データを暗号化しつつも、全体を復号することなく、特定のレコードの検索や更新ができるようになる。もちろん一定の性能低下…

派生語の例文選択の調整

"collected"という単語は、"collect"の過去分詞であり、「集められた」という意味で使われると同時に、「冷静な」という意味の派生語としても機能する。ならば、"collected"の例文には、なるべく「冷静な」という意味での用例を含んでいて欲しい。そのように…

データベースからGo言語の関数を呼ぶ

コールバック関数を読んでデータベースの内容をアトミックに調べて更新する機能をGo言語版にもつけた。これでJava/Python/Rubyも含めた全言語でコールバックが使えるようになった。