オフラインのニューラル翻訳は何がすごい?
本題に入る前に、まず機械翻訳とニューラル翻訳の違いから説明したほうがいいだろう。
機械翻訳は単語と文法のデータが入ったコンピュータが文章を読み取り、他言語に変換するものである。それに対し、ニューラル翻訳はそれらのデータ以外に「文脈」を読み取るAIが介在している。
たとえば「高すぎる」という日本語は英語にすれば「It’s too expensive」と「It’s too high」の2通りが考えられるが、機械翻訳ではどちらを訳語とすればいいかわからず、表現の利用率が高いなどの理由でどちらかを選択する。
なので、往々にして素っ頓狂な翻訳をしてしまい、笑いものになる。あなたも、おかしな誤変換に笑ったことがあるんじゃないだろうか。
一方のニューラル翻訳では、「高すぎる」という言葉の文脈を読む。
その前後で買い物に関連する会話がなされていれば「It’s too expensive」だし、場所や建物に関連する会話があれば「It’s too high」を選んでくれるのだ。以前の記事で紹介した「ili(イリー)」が、まさにニューラル翻訳を実装している。
オフラインで、かつ小さな筐体にすべてを収めるよう、旅行用に最適化されたAIが組み込まれ、「高すぎる」は「It’s too expensive」を選択する。
次ページ >
ニューラル翻訳がオフラインになるメリット
Googleのニューラル翻訳がオフラインになるメリット
iliの記事でも、ニューラル翻訳のオフライン化は大きなメリットがあることを書いた。
まず第一に、海外での不安定で高価なネットワークを利用する必要がないこと。つぎに、機械翻訳による誤訳を減らし、無駄なコミュニケーションロスを減らすこと。特に後者は場合によっては命にかかわる。
たとえば、あなたが喫茶店で「砂糖もミルクもいらない」の意味でコーヒーを「コーヒーはブラックで」と言ったとする。機械翻訳では「Coffee in black」となるが、 これは日本語で「喪服でコーヒーを持ってこい」という意味に取られかねない。
自分の店に来た観光客から急に「喪服を着ろ」と言われたら… その国の治安によってはどんなことが起こるか、想像できるだろう。そういったロスをなくすのが、ニューラル翻訳である。
iliは安価で旅行専用、しかもオフラインで電池持ちが2日以上という利便性を提供しながらも、翻訳自体は「自国語→多国語」の一歩通行で、かつ、切り替えには再起動を要する。
一方、Googleのニューラル翻訳は、言語を自動検知する能力もあるので双方向に自然なコミュニケーションをとることが可能である。
ニューラル翻訳は育ち続ける
そもそも、なぜニューラル翻訳が可能かということを考えると、それは「ニューラル翻訳を我々が使うから」と話が一回転して戻ってきてしまう。というのも、ニューラル翻訳に必要な文脈はビッグデータと呼ばれている巨大なデータ群。
それらは、Googleが持つ他のデータからも参照されているが、我々が翻訳を利用することでも蓄積されている。
ニューラルネットワークとは、日本語では脳神経ネットワークと訳されるが、まさに多くの知識を蓄積し、多くの場面を経験して人間が発達するように、Googleの翻訳ニューラルネットワークもまた、育っているのだ。