ビジネス ニュース

ビジネスに役立つ情報が満載!「コラム」「漫画で見る」コンテンツを公開中!

2020年1月27日

国産自動翻訳の“自然な日本語”には理由がある

  • facebook
  • twitter
  • line

ここまできた日本の機械翻訳

今日、製品輸出や海外進出など、グローバルビジネスを推進している日本企業のターゲット市場は、中国や欧米各国のみならず、ASEAN諸国へと拡がっています(*1)。英語はもちろん、それ以外の言語での対応が必要になることも増えてきています。
そうした日本企業のグローバルビジネスを、“翻訳の自動化”によって後押しするのが、機械翻訳です。

*1 参考:別ウインドウが開きます日本貿易振興機構(ジェトロ)「2018年度日本企業の海外事業展開に関するアンケート調査」(2019年3月7日公表)

機械翻訳とは、コンピューターが自動で翻訳をするシステムのこと。以前は、その翻訳精度が低く、ビジネス現場の実務を効率化するレベルにはありませんでした。

ところがここ数年で、日本の機械翻訳の精度が跳ね上がり、グローバルビジネスを展開する日本企業が、“言葉の壁”を乗り越えるためにかけている労力やコストを大きく引き下げられる可能性が高まっています。 その変化について、国立研究開発法人 情報通信研究機構(NICT)のフェローで、アジア太平洋機械翻訳協会(AAMT)の会長でもある隅田 英一郎さんは、次のように表現します。

国立研究開発法人 情報通信研究機構(NICT)NICTフェロー 工学博士 隅田 英一郎さん

国立研究開発法人 情報通信研究機構(NICT)
NICTフェロー 工学博士
隅田 英一郎さん

「世界の標準語は英語です。そのため、グローバルビジネスを展開するためには英語を使わなければならない場面が多くあります。ところが、日本語と英語は構造が全く異なる言語で、日本人が英語を習得するには2,200時間以上の学習が必要と考えられます。 一般の日本人が受ける英語教育の時間は1,000時間程度。つまり、ビジネスなどで英語をきちんと使えるようになるには、通常の倍以上の英語学習が必要ということです。 これはたいへんなコストです。ただし、近い将来、そのような苦労をせずとも、英語が使いこなせるようにきっとなります。国産の機械翻訳が年々進化を続けているからです」。

隅田さんが所属するNICTは、情報通信(ICT)分野を専門とする公的研究機関です。 音声翻訳・機械翻訳の研究開発にも長く取組み、その成果を通じて国産機械翻訳の発展に貢献してきました。 実際、NICTが開発した機械翻訳技術や音声翻訳技術は、さまざまな製品/サービスに採用され、それぞれの翻訳精度の向上に役立てられています。

たとえば、“TOEIC960点”クラスの日英翻訳精度(*2)を実現し話題となった、みらい翻訳社の自動翻訳サービス「Mirai Translator」には、NICTとの共同開発の成果が使われています。このことについて、隅田さんは以下のように語ります。
「現在販売中のいくつかの自動翻訳機にもNICTの音声翻訳技術が使われていますし、ほかにも、企業との共同開発の事例は数多くあります。
日本の機械翻訳の性能は、5~6年前とは比べものにならないほど向上しています。プロの翻訳者と完全に同レベルとはいえませんが、ビジネスで十分に役立つ水準にあり、その活用によって、海外との“言葉の壁”を乗り越える時間やコストを大幅に減らせる可能性があります。 しかも、日本語を海外の言葉に訳す、あるいはその逆では、無料インターネット翻訳サービスを上回る精度を実現しています」。

*2 TOEIC960点が人間でどのレベルかについては、コラム末尾に関連コラムへのリンクを記載致します。

では、このような日本の機械翻訳の進化は、どのようにして起きたのでしょうか。

日本語の自然さの秘訣は日本語への特化

隅田さんによれば、ここ数年間で日本を含む世界の機械翻訳が急速に精度を上げはじめたといいます。 その最大の理由として、隅田さんが挙げるのは「NMT」と呼ばれる技術の登場と性能の向上です。

NMTとは、「Neural Machine Translation(ニューラル機械翻訳)」の略称で、大量の翻訳データ(対訳データ)を人の脳を模したニューラルネットを使って学習し、翻訳精度を高めていく技術です。 この技術が登場する以前、機械翻訳技術の主流は、「SMT(Statistical Machine Translation/統計的機械翻訳)」と呼ばれるものでした。 ただし、SMTは30年近く研究開発が続けられてきたものの、ビジネスなどでの実用レベルに到達せず、2010年ごろには限界が見えはじめたといいます。

「その代りに使われはじめたのがNMTです。 この技術は、SMTの限界を瞬く間に突き破り、ほんの5年足らずの間に機械翻訳の精度をビジネスでの実用レベルに押し上げたのです(図1)」(隅田さん)。

図1:SMTとNMTの性能向上のイメージチャート(縦軸単位:BLEUスコア*1)

図1:SMTとNMTの性能向上のイメージチャート(縦軸単位:BLEUスコア*1)

※資料:別ウインドウが開きますBLEU スコアの解釈(Google)

先ほどの隅田さんの言葉にもあるとおり、国産機械翻訳の精度は、世界最大級のIT企業のそれを超えているといいます。 その理由について、隅田さんは「精度の違いは、自動翻訳サービスを提供する目的の違いによるものです」と語り、次のように説明を加えます。

「たとえば、広く使われているインターネット翻訳サービスは、すべての国の人に一定精度の自動翻訳サービスを提供しなければならず、対応すべき言語のペア数は、“100言語×100言語”の1万ペアぐらいになるはずです。 加えて、あらゆる分野の翻訳に対応しなければなりません。 一方で、日本語の翻訳を求めている組織に高精度の自動翻訳システムを提供しようとしているNICTとその技術移転先の日本勢は、対応すべき言語が日本語を含め10言語程度と少なく、特定分野にねらいを定めて翻訳の精度を極限まで高めることができます。 結果として、日本勢の機械翻訳が、精度や日本語の自然さで、世界一になれるわけです」。

ちなみに、日本語とペアを構成するのが10言語ということは、ペア数は10とおりで、双方向を用意しても20とおりでしかありません。 「そのせまい対象に向けて、可能なかぎり多くの対訳データを収集し、リソースを集中投下してきたからこそ、NICTの機械翻訳が高い精度を実現できているといえます。 また、日本語以外に10言語というと少なく聞こえるかもしれませんが、それで日本と海外とのコミュニケーションの8~9割はカバーできています」(隅田さん)。

さらにNICTでは、業界ごと、あるいは分野ごとに高精度の自動翻訳システムを構築する取組みも展開しています。

「特許とITの領域についてはすでに精度目標を達成し、製薬についても目標に近づいています。 今後は、契約、金融IR、製造、エネルギー、自動車、食品といった分野/業界の開拓を進めようと考えています」と隅田さんは語り、さらにこう続けます。

「特定の業界や分野にターゲットを絞るというのは、機械翻訳の精度を高めるうえで、とても大切な取組みです。 実際、Mirai TranslatorがTOEIC960点クラスの精度(*3)を達成できたのも、ビジネス対話という分野にねらいを定めて、対訳データを大量に収集したことによる成果だと見ています。 また、NICTでは、多言語音声翻訳のスマホアプリ『VoiceTra(ボイストラ)』を無償で提供していますが、このアプリでは“観光・医療・防災・生活”という分野に照準を合わせ、精度を高めています。 ちなみに、海外の方が日本滞在中に最も困るとされている主な事柄のひとつに『自分の病状やほしいクスリが病院や薬局で説明できない』ということがあり、この問題解決に有効ということで、VoiceTraは、日本の方のみならず、海外の方からも高い評価をいただいています」。

*3 TOEIC960点が人間でどのレベルかについては、コラム末尾に関連コラムへのリンクを記載致します。

機械翻訳で日本企業のすばらしさをもっと世界へ

もうひとつ、日本企業のためにNICTが注力してきたことがあります。それは、日本語とアジア言語との機械翻訳精度を高めることです。

国立研究開発法人 情報通信研究機構(NICT)NICTフェロー 工学博士 隅田 英一郎さん

「日本にかぎらず、世界的な傾向として、アジア言語の研究はあまりさかんではありませんでした。ただし、日本企業にとって、アジア諸国との付き合いは、これまで以上に重要になるはずです。 そうした時代に備えて、NICTは以前からアジア言語の研究と翻訳の自動化に力を注ぎ、アジア言語の機械翻訳で世界をリードしてきました。 たとえば、ミャンマー語の音声翻訳については世界ではじめて実現し、その機能をVoiceTraに組込み、いまでもミャンマーでよく使われています。 現在は、タイ語、ベトナム語、インドネシア語、クメール語や、ヒンディ語、ネパール語の研究も進めています」(隅田さん)。

このように、国産の機械翻訳は着々と機能が強化され、精度を上げています。それによって切りひらかれる日本企業の近未来について、隅田さんは次のように展望します。

「日本の企業や日本人はこれまで、言葉の壁を乗り越えるために多くのコストと時間を犠牲にしてきました。 そうした言葉の壁の問題から、海外進出に二の足を踏んできた企業も多いでしょう。 しかし、国産機械翻訳が飛躍的な進化を遂げているいま、言葉の壁は以前に比べてはるかにかんたんに乗り越えられるようになっています。 日本には世界に紹介されていない、すばらしい製品や技術が数多くあります。 国産機械翻訳の力で、そうした製品・技術が世界にどんどん進出していけば、日本経済が活性化すると確信しています」。

以上、国産の機械翻訳の可能性について、隅田さんのお話しをもとに見てきました。 そのお話しを総合すると、国産の機械翻訳は、日本の企業にとって世界最高精度の自動翻訳ソリューションへと発展しつつあり、グローバルビジネスを展開している、あるいは展開しようとしている全ての企業にとって欠かせない効率化のツールへと成長しつつあるようです。

では、たとえば、隅田さんのお話にも登場した「TOEIC960点クラス」の精度を持った機械翻訳は、具体的にどのような効果を日本企業のグローバルビジネスにもたらしうるのでしょうか。 その点を、下記のコラムでまとめて紹介してあります。ぜひ、ご一読ください。

別ウインドウが開きます【コラム:TOEIC960点の機械翻訳で変わるグローバルビジネス】

<隅田氏プロフィール>
隅田 英一郎(すみた えいいちろう):国立研究開発法人 情報通信研究機構(NICT)フェロー/先進的音声翻訳研究開発推進センター(ASTREC)副研究開発推進センター長。 1982年に電気通信大学大学院修士課程修了後、京都大学大学院で工学博士号を取得。 大手IT企業や民間の研究開発機関を経て、情報通信研究機構(NICT)に移籍。30年以上の長きにわたって自動翻訳・音声翻訳の研究開発に携わり、ルールベース翻訳(規則翻訳・用例翻訳)、 統計翻訳、ニューラルネット翻訳の基礎研究を推進し、日本語と多言語間の高精度な自動翻訳システムを作り上げた。 2010年に音声翻訳のスマホアプリ「VoiceTra(ボイストラ)」をリリース、2014年にはテキスト翻訳の公開サイト「TexTra(テキストラ)」を立ち上げる。 2014年に京都大学と連携し国際会議Workshop on Asian Translation(WAT)を創始し、アジア言語の自動翻訳の研究加速を主導。アジア太平洋機械翻訳協会 会長の任にもあたる。

  • 文中の社名、商品名等は各社の商標または登録商標である場合があります。
  • facebookfacebook
  • twittertwitter
  • line

お問い合わせ

メールでのお問い合わせ

お電話でのお問い合わせ

ドコモ・コーポレートインフォメーションセンター

0120-808-539

携帯電話・PHS OK

受付時間:平日午前9時~午後6時(土・日・祝日・年末年始を除く)

  • 海外からはご利用になれません。

このページのトップへ