中國(guó)の検索大手?百度が開(kāi)発したスマート翻訳機(jī)が今月21日に日本に上陸した。名古屋の観光スポットから最も便利な交通ルートまで、翻訳機(jī)は流暢かつ正確な中國(guó)語(yǔ)と日本語(yǔ)の雙方向翻訳で人々を驚嘆させた。人工知能(AI)翻訳サービスはハードとソフトウェアを通じて様々な対話シーンを繋ぎ、言葉が通じないという問(wèn)題を解決しようとしている。なかにはAI翻訳は翻訳者を「抹殺する者」になりうると考える人すらいるほどだが、現(xiàn)実はどうなのだろうか?
▽現(xiàn)狀:翻訳機(jī)は多いが、精度の向上が望まれるレベル
2017年はAIが大躍進(jìn)した1年と言えるだろう??茖W(xué)技術(shù)のトレンドとして、グーグルやアップルだけでなく、百度やアリババも人工知能の製品を相次いで発表し、スマート業(yè)界に勢(shì)いよく進(jìn)出している。なかでも「AI翻訳」はインターネットの大手企業(yè)のほとんどが進(jìn)出したいと考えている分野となっている。
海外では、マイクロソフトが9種類(lèi)の言語(yǔ)をリアルタイムで文字テキストに翻訳する「Microsoft Translator」という翻訳アプリを発表した。中國(guó)國(guó)內(nèi)では、百度翻訳が全世界の28種類(lèi)の言語(yǔ)の雙方向翻訳と756分野に対応している。テンセントのリアルタイム音聲通訳アプリ「翻訳君」は、AIカーネルをドライバとして、音聲認(rèn)識(shí)やN(xiāo)MT(ニューラルネットワーク)などの技術(shù)を用いて、「同時(shí)通訳」機(jī)能を?qū)g現(xiàn)している。
AI翻訳が急速な進(jìn)展を見(jiàn)せているが、オーソドックスな翻訳業(yè)界からは認(rèn)められているとはいいがたい。伝神語(yǔ)聯(lián)網(wǎng)絡(luò)科技股フン有限公司(フンはにんべんに分)の何恩培董事長(zhǎng)は、「翻訳機(jī)にしても、アプリにしても、中國(guó)語(yǔ)を英語(yǔ)または他の言語(yǔ)に翻訳する場(chǎng)合の精度はまあまあだが、外國(guó)人が話す英語(yǔ)やその他言語(yǔ)を中國(guó)語(yǔ)に翻訳した場(chǎng)合の精度は低く、実際のコミュニケーションにはほとんど役に立たない」としている。
▽難點(diǎn):データ不足で言語(yǔ)の仕組みは不文律
世界において國(guó)際會(huì)議や発表會(huì)などに用いられる30種類(lèi)以上の翻訳機(jī)は、一部のシーンにおける言葉の交流問(wèn)題を解決しており、その現(xiàn)狀として翻訳機(jī)はすでに非常に大きな進(jìn)歩を遂げたものの、一方で、高いレベルの翻訳が目指すところの「信頼性と老練さ、品の良さ」といった點(diǎn)ではまだまだ大きな隔たりが存在している。
囲碁界を制覇している人工知能?AlphaGoはなぜ翻訳分野においてはその完璧な力を発揮できていないのかという點(diǎn)について、何氏は、「人工知能の分野において、翻訳機(jī)が最も難しい課題の一つだというのは周知の事実。囲碁と異なり、言語(yǔ)にはその背後には多元的な文化や複雑な社會(huì)的屬性が含まれているので、その仕組みを規(guī)則化するのは不可能なことだ」と話す。
また、AI翻訳が「信頼性と老練さ、品の良さ」という高い要求を満たそうとした場(chǎng)合、話し言葉における二つの難題を克服しなければならない。一つは発言者の発音や切れ目を正しく判斷し、しかもごく短時(shí)間のうちに「発音の區(qū)切り」を判斷しなければならない。もう一つは話し言葉特有の文法の亂れや文脈の一貫性の無(wú)さ、センテンスの切れ目がはっきりしていないといった問(wèn)題を解決しなければならない。
翻訳機(jī)がどのようにしてこのような問(wèn)題を解決するのかという點(diǎn)について、清華大學(xué)計(jì)算機(jī)學(xué)部の劉洋副研究員は、「AI翻訳機(jī)の難點(diǎn)はいかに機(jī)械に人間と同じようにスマートな行動(dòng)をさせるかという點(diǎn)だ」としている。彼は翻訳機(jī)はデータをドライバとしているので、その精度はデータによって決まるとしている?,F(xiàn)在、翻訳データの多くは政府機(jī)関の書(shū)類(lèi)であり、スポーツやエンターテイメントなどの分野に関するデータがほとんどない。それに加えて、各國(guó)の話し言葉にはくだけた表現(xiàn)やネット用語(yǔ)も多用されるので、AI翻訳は膨大な基礎(chǔ)語(yǔ)彙のデータベースのサポートを必要とする。
▽展望:データでAI翻訳の進(jìn)展を推進(jìn)
近年、ニューラルネットワーク(Neural Machine Translation, NMT)の技術(shù)によって、翻訳の応用がさらなる進(jìn)歩を遂げた。NMTは脳の思考モデルを模倣しており、翻訳者と肩を並べるほどの高水準(zhǔn)の翻訳文を作成できるようになっているのと同時(shí)に、その誤差を55%~85%にまで下げている。
また、言語(yǔ)処理や対話型言語(yǔ)などの技術(shù)の進(jìn)歩は翻訳製品のバージョンアップを加速させ、コンピューター支援翻訳(CAT,Computer Aided Translation)から人工知能インタラクティブ翻訳への転換を促している。
清華大學(xué)計(jì)算機(jī)學(xué)部の教授は、「世界には數(shù)千種類(lèi)の言語(yǔ)がある。大部分の言語(yǔ)同士の間の言語(yǔ)資料が不足している。そのため、言語(yǔ)モジュールの構(gòu)築など言語(yǔ)資料の翻訳をする必要がある」としている。
AI翻訳は複合學(xué)科であり、數(shù)學(xué)や言語(yǔ)學(xué)、コンピューター科學(xué)、神経認(rèn)識(shí)科學(xué)など多方面の進(jìn)展にかかっている。そのため、AI翻訳はより多くの分野と一緒になって、データによる翻訳機(jī)の発展を促すべきだ。また、コンピューターに婉曲な言い回しや不規(guī)則な話し方を理解させるには、まだかなり長(zhǎng)い時(shí)間を必要とするだろうとみられている。(編集HQ)
「人民網(wǎng)日本語(yǔ)版」2017年9月27日
このウェブサイトの著作権は人民日?qǐng)?bào)社にあります。
掲載された記事、寫(xiě)真の無(wú)斷転載を禁じます。
Tel:日本(03)3449-8257
Mail:japan@people.cn