豪鬼メモ

一瞬千撃

連想英単語帳 on Web

意味が似た単語を一気に覚えるための単語集のWebサイトを作った。オープンソースの単語集としては最大級のものだと思っている。Web媒体であることを利用して、記憶のチェック作業が容易にできるようになっているのも特長だ。

f:id:fridaynight:20220130155311p:plain


辞書と単語集は似ているようで違う。単語集は、収録語の全てを覚えることを前提としていて、また先頭から末尾まで読み進めることを前提としている。そのため、単語集においては、収録語をどう選定して、どのような順番で並べるかが重要となる。今回作った「連想英単語帳」は以下の特長を持つ。

  • 1 : Webコーパスでの出現頻度が高いものを選定している。
  • 2 : 語幹を共有する語をまとめて、その基本語となるものを見出し語に選出している。
  • 3 : 見出し語同士の意味を比較して、意味が似た単語でクラスタを形成し、章立てを編集している。
  • 4 : 句動詞や熟語も収録している。
  • 5 : 訳語(日本語)のリストと英語の語義説明の両方を掲載している。

似た言葉を並べて掲載しているので、それらを効率的に覚えることができる。例えば、「part」「parted」「parting」「partial」などの派生語群は、同一見出しの「part」の下に整理されている。さらに、意味的に似ている「part」「portion」「slice」などが同じ章にまとめられているので、それらを一気に覚えることができる。意味の似た単語をまとめるクラスタリング手法については前回の記事で説明した。各英単語の同義語や共起語のスコアを特徴量としてk-means法でクラスタを割り当てるものだ。

Basicは3200語を収録している。この3200語は、日本の大学生であれば知っていて当然というレベルのものばかりだ。大学受験のための語彙としても有用だろう。おそらくこの語彙だけでは上位校は狙えないが、最初に学習すべき語彙としては適しているだろう。腕試しに確認ページを見てほしい。ここに知らない単語がちらほらあるなら、あなたの英語力は日本の中堅大学に合格するレベルにはない。逆に、ここにある単語のほとんどを知っているようならば、海外旅行には困らないだろう。

Advancedは9600語を収録している。この9600語は、ネイティブ英語話者の大人であればほとんどの人が知っているであろう言葉だ。英語圏に留学や転勤したり、外資系企業で働いたり、英語の新聞や小説を読みこなそうとする人は、覚えておくべき言葉だ。腕試しに確認ページを見てほしい。ここの単語のほとんどを知っているなら、あなたは問題なく海外留学や海外勤務ができるだろうし、英語の新聞や小説を辞書なしで読みこなせるだろう。私はそのレベルに達していないので、この単語集を作った次第だ。


典型的な使い方を説明する。学習すべき単語は、Basicなら50章、Advancedなら150章に分けてまとめられている。最初は1日に1章を学習するのがいいだろう。該当の章の「STUDY」リンクをクリックすると、「学習ページ」に遷移する。そこでは単語のリストと、覚悟について学習すべき内容が表示される。見出し語に付随して発音や訳語や語義説明が掲載されている。初学者は、代表的な訳語だけ知っていればよい。詳細な意味や用法が気になった場合だけ、英語の語義説明を読むとよい。
f:id:fridaynight:20220130155345p:plain

語によっては、派生語や熟語とそれらの訳語も掲載されている。それらにも目を通しておくと、基本語自体の理解が深まる。とはいえ、初学者は、いきなり派生語や熟語を覚えようとする必要はない。基本語だけを知っていれば、派生語や熟語の意味は類推できることが多いからだ。いちおう目を通しておくというくらいの心づもりで十分だろう。

一通りの語の意味を覚えたら、その章の「CHECK」リンクをクリックして、「確認ページ」に遷移する。そこでは、単語と訳語のリストが表形式で表示される。初期状態では訳語は隠されているが、各語の欄にマウスオーバーすると表示されるようになる。これを利用して、各語の意味をちゃんと覚えているかどうかをひとつひとつ確認していく。覚えていると判断した場合はどんどん次に進んで良い。覚えていないと判断した場合、その欄をクリックすると、マークが付いて、訳語が表示されたままになる。
f:id:fridaynight:20220130162254p:plain

全ての語の確認を終えた段階で、覚えていない語とその意味だけが表示された画面になっているはずである。それを眺めつつ、記憶する作業を行う。必要であれば、学習ページに戻ってもよい。再学習が済んだら、また確認ページに来て、覚えているか確認する作業を行う。

「CHANGE VIEW」ボタンを押すと、今度は英単語が隠れて訳語が表示されている状態になる。この状態で、訳語を見て英単語が思い出せるかどうかを確認していく。全て覚えていたなら、その日の学習は完了だ。さらに「CHANGE VIEW」ボタンを押すと、隠れていた訳語が全て現れるので、ダメ押しで流し読みして記憶の定着を図るのもよいだろう。
f:id:fridaynight:20220130162010p:plain

次の日の学習では、新たな章に取り組みたくなるだろうが、その前にぜひとも前日の復習をすべきだ。前日の章の確認ページを開いて、ちゃんと覚えているか確認する。おそらく何割かは既に忘れているだろうが、それは短期記憶の特性なので仕方がないことだ。そこで再度学習することで、短期記憶が長期記憶に移行する確率が高まる。それでもさらに忘れるものは忘れるのだが、それもまた仕方がない。次の章に向かうべきだ。1周目で全部覚えるというのは無理な話なので、抜けを許容しつつ、まずは1周終わらせることが大事だ。1周終えた時点で、おそらく語彙力は飛躍的に上昇しているだろう。記憶の定着をより確実にしたいなら、2周目3周目をやってもよい。その際の作業時間は1周目よりもかなり短くて済むはずだ。


単語集だけで語彙の定着を図るのは難しい。実際の英文読解やリスニングの中での語の使われ方を見ることで初めて理解できることが多いし、英作文や英会話で自分で使ってみて初めて使える語彙として身につく。とはいえ、英文読解するにも、英作文をするにも、英会話をするにも、まずは基本的な語彙を知らねばならないという問題がある。鶏と卵の問題だ。これを解決するには、語彙学習とその他の学習を並行して進めるしかない。もっと言えば、語彙学習にかける時間はできるだけ少なくして、読解やリスニングや作文や会話にかける時間を多くとった方がよい。

生活の中で自然に英語の語彙が増える状況にない日本人の実際問題として、語彙に着目した学習は必要不可欠だ。しかし、その作業はできるだけ短い時間で効率的に行うべきだ。そのためには、似たような単語は一気に覚えてしまった方がよい。確認ページでは、似た単語が並んでいるから容易に意味を想起できてしまい、ずるをしている気分になるだろう。しかし、むしろ、覚えた気になるくらいで丁度よい。ヒントを多く与えて、できるだけ少ないストレスで、記憶回路を活性化させられることがこの連想単語集の特長とも言える。

掲載語の選定にあたり、派生語群を語幹の見出しにまとめたのも重要だ。連想記憶の観点では、暗記の対象としては語幹となる語だけで十分であり、派生語の意味は語幹の記憶から類推すべきものだ。よって、語幹となる語のみを1語として数えて学習を進めるのが合理的だ。k-means法でクラスタリングを行う際にも、派生語群を一つにまとめないと重心に偏りが出てしまうという事情も背景にあるのだが、結果として有用なデータが出力できている。実装上では、派生語群をまとめるのに最も苦労した。派生語を含めると、Basicは30000語程度、Advancedは65000語の収録語数になる。

BasicとAdvancedを分けたのには理由がある。Basicの収録語を知らない人がAdvancedに取り組んでも確実に挫折するからだ。fun, happy, pleasantといった基本語を知らない人が、hilarious, glorious, jubilant, convivialといった難解語を覚えようとするのは現実的ではない。とはいえ、難関校を狙ったり海外留学したり英語の小説を読んだりするのなら、難解語も覚えておくべきだ。よって、まずはBasicで基礎を固めた上で、Advancedに進むべきだ。その意味では、Basic 3200とAdvanced 9600の間にIntermediate 6400とかいうのがあってもよさそうだ。実際、自動生成なので簡単に作れる。Entry 1600とか、Ultimate 12800とかだって作れる。とはいえ、単語集ばっかり何周もする人もそうそういないだろうから、2段階もあれば十分だろう。


まとめ。オープンなデータソースと徹底した自動処理によって、そこそこ使える単語集ができあがった。Basicの方は初学者にとって不可欠な3200語をベースに30000語を重点的に覚えることができるし、Advancedの方はネイティブなら知っているであろう9600語をベースに65000語をカバーしている。市販の単語集でもここまでの規模のものはないだろう。精度や使い勝手に関しても、私が自分で使う限りは、悪くない。世の皆様にもぜひ試してみていただきたいところだ。