任意の英語の文章から対訳の電子書籍を生成するシステムを作ってみることにした。その最初の段階として、任意の英語の文章から文のリストを作る必要がある。LLMには初歩的なタスクなので、ChatGPTを回して遂行した。
ChatGPTに英語の共起語のリストを生成させる
統合英和辞書には各見出し語の典型的な共起語のリストを収録しているが、その生成をChatGPTにやらせてみた。結構まともな結果が得られ、類語検索や連想単語帳の精度が上がった。さらに、例文を選択する際にその共起語を含むものを優先することで、より典型的な例文を提示できるようにした。
ChatGPTに英語の語義を推測させる
和英辞書の見出し語と語義から英英辞書の語義を生成できるかどうか、ChatGPTに頑張らせてみた。結論としては、普通に実用できるレベルの語義が生成できることがわかった。
ChatGPTに英単語の主要語義を選ばせる
多くの英単語は複数の意味を持つが、辞書では重要なものから順に表示することが望ましい。その選択をChatGPTにやらせてみた。