豪鬼メモ

一瞬千撃

ChatGPTでイギリス発音を生成し発音記号検定でイギリス英語対応

ChatGPTにイギリス英語発音を生成させて、発音記号検定でイギリス発音の問題を出せるようにした。また、発音記号のヒントを表示して、検定だけでなくドリルとしても利用できるようにした。


ChatGPTに以下のようなプロンプトを投げると、英単語のアメリカ式発音とイギリス式発音を生成させられる。完璧な精度とはいかないが、だいたいうまく処理してくれるっぽい。

LLMによると、"tomato" の発音は、米国だと /təˈmetoʊ/(≒トメトウ)だが、英国だと /təˈmɑːtəʊ/(≒トマータウ)である。"schedule" の発音は、米国だと /ˈskɛdʒul/(≒スケヂュル)だが、英国だと /ˈʃedjuːl/(=シェデュール)だそうな。他にも英米で大きく異なる発音ものは多い。/æ/ と /a/ や /ə/ などの微妙な違いを含めるなら約70%が違うという結果になった。確かにイギリス人の英語はアメリカ人とかなり違う。まあそれ言ったらカリフォルニア人とニューヨーク人の発音もかなり違うし、RPと英国内の各種方言もかなり違う。LLMが何を以てアメリカ標準やイギリス標準を定めているのかはLLMのみぞ知るということになるのだが、トレーニングデータの多数決的な回答になっていることは推察される。英単語、アメリカ式発音、イギリス式発音をTSV区切りで記録したファイルを置いておくので、興味がある人は見てほしい。

さて、先日作ってみた発音記号検定だが、各単語の発音記号のデータははWiktionaryから取得したものとChatGPTに生成させたデータを混ぜたものである。Wiktionaryにおいてアメリカ式とイギリス式が併記されている場合にはアメリカ式を採用している。ChatGPTは特にその指定をしていないが、どうやらアメリカ式の結果を出力することがほとんどのようだ。となると、イギリス式の発音を学びたい人々はモヤるだろう。それを言ったらオーストラリアもニュージーランドもカナダもシンガポールもそうなのだが、とりあえずここではイギリス式に焦点を当てよう。

検定にはレベルが1から5まであったのだが、それとは違うパラメータとして「アメリカ式」「イギリス式」の選択肢を設けた。イギリス式を選択した場合、上述のTSVファイルを読み込んで、アメリカ式発音をイギリス式発音に上書きする処理を入れた。アメリカ式とイギリス式で同じ発音である単語には何の影響もないが、両者が異なる単語では、出題がイギリス式に変わる。正答した際の読み上げ指示もen-USからen-GBに変えてある。Chromeの最新版で確認する限り、us-GBにするとちゃんと "schedule" を /ˈʃedjuːl/ っぽく読み上げてくれる。

面白いことに、日本人の私には、イギリス式の方が簡単に感じる。ローマ字的な感覚に近いからだろうか。アメリカ式で頻出する /æ/ よりもイギリス式で頻出する /a/ の方が日本語の「あ」に近い気もするし。ともかく、ぜひイギリス式も挑戦してみて欲しい。私の言わんとすることがわかるだろう。


検定を何度かやっていると、どうしても解けない語が出てくる。そこで、「手掛」というボタンをつけた。これを押すと回答の手掛りとなるヒント情報が表示される。あくまでヒントであり、答えを教えるわけではない。具体的に言うと、それぞれの発音記号の名前と、それを使った単語の例を表示する。正直言って名前はあんまり役に立たないのだが、例はかなり役にたつ。/ʃ/ の例で "should" が出てくれば、「sh系の音」だなと思い出せるだろう。/æ/ の例で "back" が出てくれば、「強いa系の音」だなと思い出せるだろう。

全ての問題でヒントを見ていたら制限時間には間に合わないだろうが、2・3問だけヒントを見るならば間に合うこともある。ヒントを最初から見せてしまうと検定としての体を成さなくなるが、ボタンを押した時にだけ表示されるというのが絶妙な落とし所だと思う。

また、「降参」ボタンを押すと、答えが見られるようになった。この場合には検定はその問題で中止される。しかし、答えが見られないとモヤるので、この機能は必要だろう。懲りずにまた挑戦してもらうのが大事なのだ。


まとめ。発音記号検定でイギリス英語モードとヒント表示機能を実装した。先日この検定プログラムを作ったばかりだが、デバッグしながら自分で何度もやっているうちに、かなり発音記号読解の能力が上がってきた。今なら高校生レベルを普通にクリアできる。やはりヒント機能で出てくる例を見ながら発音記号とスペルの関係を少しずつ脳に内在化させていくのが大事っぽい。また、イギリス英語モードも結構面白くて、しばらくやっていると、アメリカ英語との違いが段々とわかってくる。