人工知能がその威力を大いに発揮している昨今だが、現(xiàn)在の音聲認(rèn)識(shí)技術(shù)では、デバイスはまだ十分に自然言語(yǔ)を理解するにはいたらず、いわゆる「言外の意味」を聞き取り、理解することは、SF作品の中においてのみ存在する出來(lái)事。しかしこの狀況には現(xiàn)在、変化が生じている。新華社が伝えた。
中國(guó)最新のスマート音聲技術(shù)の成果によると、デバイスはすでに高い正解率により音聲の文字化、多言語(yǔ)同時(shí)通訳、そして聲の模倣を可能にしているという。
1000人以上が集まる會(huì)場(chǎng)で、複數(shù)のゲストが3時(shí)間近くスピーチ?交流する。スピーチの內(nèi)容は速記者がいなくても、リアルタイムで巨大スクリーンに文字化される。
記者が安徽科大訊飛信息科技有限公司(科大訊飛)の年次総會(huì)を取材したところ、スピーチの一部の人名?地名のミス、発言者の口語(yǔ)表現(xiàn)に含まれる冗長(zhǎng)な語(yǔ)彙を除く、ほぼすべての內(nèi)容が非常に正確に整理され、同時(shí)に英語(yǔ)?日本語(yǔ)?韓國(guó)語(yǔ)などの言語(yǔ)に翻訳されていた。
説明によると、これはディープニューラルネットに基づく音聲認(rèn)識(shí)技術(shù)によって実現(xiàn)されるのだという。音聲認(rèn)識(shí)技術(shù)とは分かりやすく言えば、コンピュータに人間の言葉を理解させ、その音聲に含まれる文字情報(bào)を読み取らせる技術(shù)だ。同技術(shù)はスマートコンピュータシステムで重要な役割を演じており、コンピュータに「耳」を與えることでマンマシンの通信?交流を?qū)g現(xiàn)する。音聲認(rèn)識(shí)の正解率は、現(xiàn)在97%に達(dá)する。
同社の劉慶峰董事長(zhǎng)(會(huì)長(zhǎng))は「萬(wàn)物がインターネット化する時(shí)代を迎え、音聲を中心としキーボードを補(bǔ)助とするマンマシン交流が実需になる。今後5?10年で、人工知能は水や電気のように私たちの生活必需品になり、私たちの世界に大きな変化をもたらす」と述べた。
![]() |
このウェブサイトの著作権は人民日?qǐng)?bào)社にあります。
掲載された記事、寫(xiě)真の無(wú)斷転載を禁じます。
Tel:日本(03)3449-8257
Mail:japan@people.cn