2018年5月16日水曜日

「グーグルには絶対に売らない」 日本勢は音声翻訳で覇権を握れるか

 「東京オリンピックまでには翻訳精度を高めて、世界最高の翻訳アプリを作りたい」。最新の音声翻訳アプリ『VoiceTra(以下、ボイストラ)』のデモ発表会で、人工知能(AI)を使った音声翻訳技術を開発する国立研究開発法人情報通信研究機構(NICT)の開発担当者である隅田英一氏は、こう意気込んでいた。

 この日は、空港でスーツケースをなくしたという設定で日本語と中国語でタブレットを使用してのやりとりや、病院において採血と血圧を測定するという中での日本語と英語での会話を、「ボイストラ」を使って翻訳するデモを実施した。1秒もかからずに相手国の言葉に訳され、ネイティブスピーカーと変わらないスムーズな翻訳には驚かされた。

 今回のデモでは話す人が静かな環境の中、クリアな声で話したため、間違うことなく同時翻訳された。しかし、雑音が多かったり、「あー、うー」といったような前置きが長かったりすると翻訳できないなど改善点が残されており、今後はさらにデータを集積することで、こうした点を修正したいという。

 音声翻訳は難しいと言われてきたが、AIなどの進歩により翻訳性能が飛躍的に向上し、2020年の東京オリンピックまでには多くの場所で手軽に使えるようになりそうだ。しかし、米IT大手のグーグルやマイクロソフトなども開発を急いでおり、日本勢がブランド力抜群の巨大IT企業に打ち勝って、音声翻訳アプリの市場で覇権を握れるかどうかが今後のカギとなる。

 日本で音声翻訳が始まったのは1986年だったが、当時は定型の文章しか翻訳できず、文法に沿っていない会話は翻訳しにくかった。翻訳された音声もロボットが話すような声で、違和感があった。その後93年にできた音声翻訳システムは、1文を翻訳するのに30秒もかかり、実用化には程遠かった。

 08年には改良を重ねて翻訳機を作ったものの、弁当箱サイズと大きかったため実用化には適さなかった。「ボイストラ」はそれまでとは異なるコンセプトで10年8月からスマートフォン(スマホ)アプリ用に開発を進めた。あらゆる部品を小型化することにより、「iPhone」「Android」の両タイプにも内蔵できるように改良した。14年からは国家プロジェクトの「グローバルコミュニケーション計画」になり、通信、電機メーカーなどから40人の優秀なエンジニアが参加したオールジャパンで開発を加速させてきた。5年前の段階の「ボイストラ」は誤訳が目立っていたものの、この1~2年のAIを活用したニューラルネットワーク技術、通信速度の高速化などにより翻訳精度が飛躍的にレベルアップした。

 その結果、英語、中国語、フランス語、スペイン語など31言語の文字翻訳に対応し、そのうち23言語で音声入力、17言語で音声出力が可能になった。このアプリはスマホなどにダウンロードして使うが、個人利用は無料だ。すでに300万回もダウンロードされている。現在はこの機能を生かして、パナソニックはすでに「対面ホンヤク」というサービス名で製品化し、富士通も製品化しようとしている。

 NICTは総務省とともに、さまざまな分野の翻訳データをオールジャパン体制で集積し、自動翻訳の多分野化・高精度化に活用しようとしている。具体的には、医療、ファイナンス、法律、知的財産、IRなど、それぞれの分野に合わせてデータを蓄積することで、その分野の翻訳精度をアップすることが目標だ。現在この自動翻訳アプリは、特許庁でも実際に利用されている。特許の審査をする上で、下訳をするために活用され、難しい特許関連の審査をスピーディに進める上で役立っているという。

 また、自動翻訳システムのさまざまな分野への対応や高精度化を進めるため、オールジャパン体制で翻訳データを集積する「翻訳バンク」の運用を17年9月から開始した。これにより、社会・経済活動のグローバル化が進む中で、わが国の国際競争力の強化に貢献できるとしている。

 自動翻訳技術の性能向上のためには、NICTが研究開発において取り組んでいる翻訳アルゴリズムの改良に加え、翻訳データの質と量の確保が重要となる。翻訳バンクでは翻訳データを集積して自動翻訳技術に活用することで、自動翻訳技術で対応できる分野を広げるとともに、さらなる高精度化を実現する。翻訳バンクの当面の目標として、100万文×100社=1億文の翻訳データの集積を目指す。

 京浜急行電鉄は、4月から「ボイストラ」をベースとした音声翻訳エンジンを使用する新たな翻訳アプリを全駅(泉岳寺駅を除く)のiPad端末に試験導入し、7月から本格的に配備する。このアプリは、同社がNICTなどと実施した共同研究の成果を活用し、日立超LSIシステムズが開発したものだ。外国人旅行客に多言語で案内を行う際のコミュニケーションツールとして活用するのが目的で、対話型の翻訳だけでなくタッチパネル型の忘れもの確認など、鉄道分野のニーズに対応した機能が搭載されている。

 急病人が出た場合などで、医学用語など専門知識が必要な場合は、このアプリだけでは正確な翻訳が難しいため、同時通訳のコールセンターにつなぐこともできるようになっており、2段構えの通訳方式を採用している。このようなサービスを鉄道会社が導入するのは初めてで、同社は利用状況を見た上で、バスやホテルなど他の分野にも展開したいとしている。

 また、富士通は「ボイストラ」アプリを医療の現場に使えないかと、重さがわずか65グラムの小型で軽量なハンズフリー音声翻訳端末を開発、18年度から製品化する計画だ。胸のポケットに挟むだけの小型のもので、手がふさがりやすい診察や検査の仕事も医師や看護師がこの端末を使いながら患者と話ができる。

 インバウンドの急増によって病院に来る外国人も増えており、外国人対応としての翻訳のニーズは高まっている。雑音が多く飛び交う病院内で、患者と医師の声だけを拾って翻訳するには独自のノウハウが必要となり、富士通はこの部分の技術開発に苦労したという。

 販売にこぎつけるためには、コストがポイントになる。いくら技術的に優れた翻訳端末でも、価格が折り合わなければ病院などで購入してはもらえない。端末のコストをどこまで下げられるかにかかっている。

 音声翻訳の研究は日本国内にとどまらず、世界中の優秀な研究者が最新のAI技術を駆使して実施している。米国のグーグル、マイクロソフト、中国のテンセント、大学では米国のカーネギーメロン大学(CMU)、中国の清華大学などが先進的で、競争は激しい。中でもAIを活用したディ-プラーニング(深層学習)に関しては欧米や中国が先行する。

 NICTが開発した音声翻訳アプリを海外のプレーヤーに販売することには、開発した技術を使いたいという海外の会社があれば技術移転にも応じる意向であるものの、グーグルに売ることに対しては否定している。かつて日本にあった高性能の検索エンジンがグーグル検索によりなくなってしまったように、グーグルに飲み込まれてしまうことを懸念しているのだ。貴重な情報処理ノウハウを全面的に外国に譲り渡すのは危険とNICTはみている。

 この音声アプリを世界に普及させるためには、「グーグル翻訳」に組み込んだ方が手っ取り早いという見方もある。だが、国立の研究機関がせっかくオールジャパンで開発した最高レベルのアプリだけに、絶対にグーグルには渡したくないようだ。日本独自で開発した技術だけに、まずは日本のメーカーに製品化してもらいたいものだ。

 日本はAIそのものの開発では出遅れているが、AIの最新技術を組み込んだ端末製品においては、得意とする小型化や軽量化技術を生かすことができる。世界的な海外旅行需要の増加によって、通訳への需要は拡大傾向にある。その中で、世界最高水準の、簡単にはマネできない音声翻訳アプリを製品化することができれば、この市場で優位に立てる。

 ただし、いくら軽量、超小型の翻訳精度の高い音声翻訳アプリを開発しても、普及しなければ宝の持ち腐れになり、日本だけで普及してもインパクトがない。世界の主要言語を同時に翻訳できるアプリを内蔵したスマホを世界中に広めるには、発想を転換してグーグルかマイクロソフトと手を握るというのも新しいマーケティング戦略になるかもしれない。国内技術だけに頼っていては、かつての日本製の携帯電話がガラパゴス化したのと同じ轍を踏む恐れがある。

 世界の音声翻訳市場で日本が覇権を握るためには、欧米、中国など大きな市場でも普及できるマーケティング力がなければ、オールジャパンで開発したオンリーワンの技術も世界市場では陽の目を見ないかもしれない。音声翻訳アプリで世界ブランドを確立するためには、日本で開発した最新技術プラス世界で「売る力」が必要になる。ましてや「ボイストラ」アプリも消費者向けの製品なので、消費者に浸透させるためには一層の努力が必要だ。オールジャパンにこだわるよりも、世界に普及させるためにどうすべきかを優先すべきではないか。 

 東京五輪に向け、この1~2年以内に消費者に「ボイストラ」を世界に浸透させる努力を怠れば、結局、「売り方が下手な日本勢」として、グーグルなどの海外企業に淘汰される可能性は否定できない。 

0 件のコメント:

コメントを投稿