주요 기사 바로가기

成長する音声認識技術市場、韓国語は認識率低く(1)

ⓒ 中央日報/中央日報日本語版2014.05.13 16:48
0
「私の声、聞こえてる? ドアを開けて」。「悪いが、デイブ。それはできない。あなたとフランクが私を殺そうとしているのを知っている」。世界的な名将スタンリー・キューブリック監督が1968年に制作した空想科学(SF)映画『2001年宇宙の旅』に出てくるセリフだ。声の主人公は木星に向かうディスカバリー号の船長デビッド・ボーマンと人工知能コンピュータ「HAL-9000」だ。HALはあたかも信号の赤信号または一つ目小僧のような姿で、船長のボーマンとチェスを楽しみ、対話をしながら宇宙船を統制する。しかしある時、エラーのために混乱し、作動を止めようとする人間を攻撃する。

この映画から半世紀近く過ぎた現在、「話すコンピューター」はすでに映画の中の想像や研究室だけの話ではない。スマートフォンなどモバイル機器に人工知能基盤音声認識機能が入り、本格的な「手の中のアシスタント」時代が開かれていることだ。

米アップル社が2011年にアイフォン向け知能型音声認識サービス「Siri」を試験サービスして以降、世界トップ圏の情報通信(IT)企業は競って音声認識と人工知能研究に没頭している。中国のような後発走者が猛追撃してくるほど、スマート機器のハードウェア競争が限界に達したのも刺激になった。特に今年に入ってスマートウォッチなどウェアラブル機器とモノのインターネット(IoT=Internet of Things)市場が本格化し、「音声認識と人工知能」は核心機能に浮上している。デスクトップやノートブックは入力装置としてキーボードを使えばよいが、ウェアラブルコンピュータやモノのインターネットは「音声」で指示するのがはるかに便利であるからだ。このためスマートフォンはもちろん、最近発売されているスマートウォッチ、グーグルグラスなどはほとんどの人工知能に基づいた音声認識機能を付けている。

市場調査会社BCCリサーチによると、世界音声認識技術市場規模は2011年にすでに470億ドル(約48兆2200億ウォン)にのぼり、今後も年平均16.2%ずつ成長し、2017年には1130億ドルに達する見込みだ。

アップルは昨年9月、新しいモバイル基本ソフトiOS7を出し、Siriに付いていたbeta(テストサービス)文字を切り離した。もう技術を整えて正式サービスができるという自信の表れだ。今年3月に発売した車両用iPhoneソリューション「CarPlay」は、Siriを活用した音声認識が代表的な機能だ。運転中に音声で指示すれば、車が運転手の声を認識して電話をかけ、地図も見せる。退屈な時に冗談を言えば適当に返事もする。例えば「私は酔った」と話せば、「私があなたを家につれていくことを期待しないでほしい」と答える。

グーグルの音声認識機能は2012年グーグルグラスを公開しながら作った動画広告(CF)で大きな関心を集めた。広告で主人公は音声だけで友人に文字を送り、公演チケットを購入し、地図を検索し、写真を撮り、音楽プレーヤーを消す。スマートフォンのアプリケーションとして出てきたグーグル翻訳機は80以上の言語を音声に通訳する。アンドロイドフォンで見ることができる「グーグルナウ」は、位置情報と使用者の個人情報を利用し、使用者が尋ねる前に必要な情報を提供するという点でSiriを上回る。例えば、出勤する際、「今日は雨が降って渋滞するので乗用車より地下鉄を利用するのがよい」と助言する。

モバイル分野で一歩遅れていた米マイクロソフト(MS)も今は速かに動いている。先月初めMSはサンフランシスコで開催された開発者会議で、スマートフォンOS「ウィンドウズ ・フォン8.1」のアップデート計画を発表し、ウィンドウズ音声認識機能「Cortana(コルタナ)」を出すと明らかにした。
成長する音声認識技術市場、韓国語は認識率低く(2)


関連記事

最新記事

    もっと見る 0 / 0
    TOP