Event

機械翻訳は人間の介在が不要な段階に。「AI/SUM:Applied AI Summit・AIの最大難関 自然言語への挑戦」レポート

4月22日~24日、東京・丸の内で、日本経済新聞社主催の人工知能をテーマにした初のグローバルイベント「AI/SUM:Applied AI Summit」(アイサム : アプライドAIサミット)が開催されました。

4月24日にこのイベントの最後を飾ったのが「AIの最大難関 自然言語への挑戦」を議題としたパネルディスカッション。モデレーターをストックマークCEO・林 達(以下、林)が務めました。今回はその内容をレポートします!

登壇者のご紹介

Jordi Torras(以下、ジョルディ):米国のスタートアップ企業であるInbenta Technologies Inc.(インベーター テクノロジー社)の創設者、CEO

Vijay Daultani(以下、ヴィジャイ):楽天株式会社 自然言語処理チーム アシスタントマネージャー

榮藤 稔(以下、榮藤):大阪大学教授、株式会社みらい翻訳、株式会社コトバデザイン CEO

林: 本日のパネルディスカッションでは自然言語処理を大きなテーマとして

・国や地域の言語の壁

・業界、業種の壁

・自然言語における競合優位性の今後

・日本のマーケットにおける課題と今後の期待

以上4つのトピックについて、自然言語処理領域の3名の有識者にパネルディスカッション形式でお話を伺います。

「国や地域の言語の壁」をどのように越えていけるか

林: 自然言語処理を進めるにあたり、言語によってモデルを変えたり、特徴的な処理が必要だったりする場合があります。これについて現状の課題と、今後どうなっていくと予想しているか、考えをお聞かせください。

ヴィジャイ:「話す」「読む」「書く」というのは、人間にとって不可欠なタスク。人間は言語で物事を考えており、話すときはもちろん、読むときや書くときも言語の観点から行っています。これからさらに自然言語処理の精度が向上することが予想され、この3つのタスクすべてで改良が進むと思います。

榮藤: 満点を5.0 (プロの通訳並み)とした時、「3.5」というのは3年前の機械翻訳のパフォーマンスであり、「4.5」は1年前のパフォーマンスです。
3年前は受け入れ可能から良好程度のパフォーマンスであったものが、2016年にGoogleが開発したNeural Machine Translation(NMT)が既存技術に破壊的な影響をもたらしました。今では4.7くらいまで上がっていて、もはや機械翻訳に人間の介在がなくてもよい段階にきています。

また通常はAIの学習段階において、日本語と英語、日本語とドイツ語というように言語のペアリングが必要です。しかし、少ないデータでも高い精度で自然言語処理できるモデルである「BERT」を用いれば、モノリンガルなトレーニングでも汎用性の高い機械翻訳が可能になるかもしれません。ビッグデータが不要になることも考えられます。

業界・業種特有の言葉はどのように学習、処理されるか

林: 機械翻訳における自然言語処理の技術は、さまざまな業務で使われることが予想されますが、業界・業種特有の言語はどのように学習、処理されるようになるとお考えでしょうか?

ジョルディ: 業界別の言語があると思われがちですが、そうとは言い切れません。例えば、カスタマーサポート業務の場合で考えても、業界に応じて相談者自身が言葉を変えるわけではないので、学習や処理の根幹部分は変わらないのではないでしょうか。

ヴィジャイ: 私は言語それぞれに独自の構造があると考えています。また、ある特定のタスクを行う時でも、業種が違えばそこで使われる言葉は異なるのではないでしょうか。例えば、投資会社と旅行会社では、同じタスクを行っていたとしても、使われる言葉はまったく違うというように。

我々はまだこの問題のソリューションを見つけられていません。現状は汎用的なソリューションを、タスクごとに適用させるという方法をとっています。

しかし今後数年間の間に、パラダイムシフトが起こると考えています。これからは、タスク固有の状況を考えるだけではなく、言語やドメインごとに対応する必要がありますね。

自然言語における競合優位性の今後

林: 榮藤さんにはGoogle翻訳にどう勝つのか、ヴィジャイさんには楽天とAmazonの違い、ジョルディさんには数多くのNMTサービスが出てきている中で、御社の強みはどこだと感じているかという点を特にお聞きしたいです。

榮藤: Googleが持っていないローカルデータに特化し、垂直統合に取り組むことによって、巨大企業が相手でも勝つことは可能だと考えています。

ヴィジャイ: 競合優位性を獲得するための中核をなすのは、文脈に応じて言語の意図を解釈した、明確なデータを保有することです。

楽天の強いところはこういった良質なデータを多岐に渡る分野で持っていること。Eコマースで大きくなってきた会社ですから、ニッチなデータを持っていますし、ユーザー接点が多いので、精度の高いレコメンドをすることもできています。

確かにAmazonもたくさんのデータを保有していますが、楽天は巨大なエコシステムを持っています。楽天トラベルや楽天チケットなどのさまざまな自社サービスによるエコシステムです。こういったエコシステムの中で多くのデータを収集、生成できていることから、十分に勝機はあると考えます。

日本のマーケットにおける課題と今後の期待

林: 日本のマーケットの印象や今後期待していることをお聞かせいただきたいです。ジョルディ:私たちにとって、日本マーケットは以前からとても魅力的なマーケットでした。しかし、多くの企業が苦戦しているのを見て日本で戦うのは難しいと考えたこともありました。縁あってNTTコミュニケーションズ様とパートナーシップを組めたのは本当によかったですし、今後日本マーケットの拡大とともに、さらに成長していけたらと思います。

ヴィジャイ: 日本は高齢社会であり70歳以上の人口が増えていますよね。機械翻訳における自然言語処理はその課題に対するひとつの解決策にすぎません。テキスト要約やさまざまアプリケーションと組み合わせるなど、NMTが役に立つ場面は今後もたくさんあると思います。

NMTは日本マーケットを一変させる可能性が大いにあると思っています。

NMT領域における「Google」は現れるのか?質疑応答

質問者: 現在、世界中に数多くのNMTエンジンがありますが、今後はどうなっていくと考えていますか。これらは淘汰され、検索エンジン領域のGoogleのようにひとつの企業が独占するのでしょうか?それとも分野に特化したNMTエンジンが多数共存するのでしょうか?

ヴィジャイ: 良い質問ですね。Googleは単なる検索ツールから、巨大なデータを保有する独占的企業になりました。そのように、世界を変えるものを投資家たちは求めています。しかし単独企業がNMT領域を席巻するとは考えにくいですね。

ジョルディ: Googleにも失敗したプロジェクトがあったことを思えば、どの企業にもチャンスがあります。特定産業を対象とすれば独占することも可能かもしれませんが、人間のコミュニケーションすべてを処理するのを考えた場合には、1社が独占する未来は考えにくいですね。

ー有識者3名からのメッセージー 数年後、NMTで世界は大きく変わる

榮藤: 我々は自然言語処理をネットワークで使い始めていますが、これがNMTの革命を起こしています。今はそのスタート地点。ぜひ5年後に期待していてください!

ヴィジャイ: NMTは今後、重要な駆動力になると思います。時間をかければ、ディープラーニングに関するすべての課題を解消することができるはずです。まだ発見できていない活用方法もあると考えています。

ジョルディ: 自然言語処理の問題は遺伝子解析と似ている気がします。情報があるのはわかっているけれど、そのすべてを解明している人は誰もいません。解明するには、持っているデータを分析する小さなステップを踏んでいくことです。しかし、NMTを使った明日すぐにでも使用可能な、有益なツールを生みだす必要があることも感じています。

林:本日はありがとうございました。

大盛況のうちにイベントは終了しました。ストックマークはAIや自然言語処理に関連するイベントへの登壇を随時行っています。

今後もこうしたイベントを通じて、自然言語処理分野の発展への寄与、技術に対する理解促進をしていきます。

2 comments on “機械翻訳は人間の介在が不要な段階に。「AI/SUM:Applied AI Summit・AIの最大難関 自然言語への挑戦」レポート

  1. Pingback: 日経新聞社主催 「AI/SUM:Applied AI Summit」に参加しました | StockMark Inc.

    • stockmark

      公開、お願いします!

Comments are closed.

%d人のブロガーが「いいね」をつけました。