주요 기사 바로가기

成長する音声認識技術市場、韓国語は認識率低く(2)

ⓒ 中央日報/中央日報日本語版2014.05.13 16:48
0
Siriとグーグルナウ、Cortanaの共通点は、使用者が使うほどさらに賢くなるという点だ。音声認識サービスが使用者の個人情報と各種利用データを保存し、これに基づいて自ら学習するため可能なことだ。

問題は認識率だ。現在、英語の場合は認識率が高いほうだが、韓国語を含む他の言語はまだ前途が長い。音声認識機能を1、2回使って失望した後、使用しなくなる人も少なくない。

 
このためグーグルは2012年末、世界的な発明家で人工知能分野の大家レイ・カーツワイル氏を迎え、音声認識機能の進化速度を高めている。カーツワイル氏は「5-8年以内にグーグル検索エンジンが革新的に変わるはずで、2029年には人のように長くて複雑な質問までも理解し、答えることができるだろう」と話した。

では、サムスン電子・LG電子など韓国企業はどうか。両社ともにグーグルのアンドロイド体制を使用しているため、音声認識機能を別途に開発する必要がないように見えるが、実際は両社とも独自の音声認識機能の開発に力を注いでいる。グーグルの音声認識機能が韓国語サービスと自然に互換されるうえで限界があるうえ、テレビや冷蔵庫など家電機器をインターネットにつなげようという計画のため、グローバル競争で優位を占めるためには独自の音声認識機能開発が必須だ。ただ、国内企業の音声認識サービスはグーグル・アップルとは違い、使用者の個人情報を収集せず、また、これに基づいて自ら学習する機能がないため、現在としては“手の中のアシスタント”となるには限界がある。

LG電子は2012年、国内で初めて音声認識機能「Qボイス」を搭載したスマートフォンOptimus LTE2を出した。音声で電話をかけるほか、文字伝送・写真撮影・音楽再生・アラーム設定・日にち確認など計20種類の分野で作業を遂行できる。例えば、文字伝送の場合「OOに明日3時に会おうと文字メッセージを送ってほしい」と命令すれば、そのまま遂行する。インターネットを通じて望む情報を検索したり、しりとりなどひまつぶし用としてQボイスと対話することも可能だ。

LG電子MC事業部のクァク・ジェド部長は「現在、音声認識率は80%程度」とし「まだ遊びレベルで音声認識機能を使う人が多いが、遠からず本当に手の中のアシスタントの役割をする時がくるだろう」と述べた。今後5年以内にスマートフォンで顧客が望む機能を音声ですべて処理できる水準へと発展させるというのがLGの目標だ。

サムスンも2012年、ギャラクシーS3に初めて搭載した音声認識機能「Sボイス」を進化させている。音声命令だけで電話・文字はもちろん、カメラ作動などさまざまな作業ができる。昨年4月に発売されたギャラクシーS4では翻訳機能も新たに追加された。情報技術(IT)業界のある関係者は「ハードウェア競争が限界に達した今は、ソフトウェア生態系の構築に力を注がなければならないだろう」と述べた。


成長する音声認識技術市場、韓国語は認識率低く(1)

関連記事

最新記事

    もっと見る 0 / 0
    TOP