韓国語は機械翻訳が難しい…英語に訳すにはまず日本語に1次翻訳

韓国語は機械翻訳が難しい…英語に訳すにはまず日本語に1次翻訳

2016年10月19日08時09分
[ⓒ 中央日報/中央日報日本語版]
comment
0
share
このエントリーをはてなブックマークに追加
mixi
  韓国語は機械翻訳が難しい言語に挙げられている。語根や接頭語、接尾語によって単語の機能が決まるからだ。例えば基本文「私は学校に行く(ナヌン・ハッキョエ・カンダ)」もさまざまな形態に変わる。基本文を丁寧語に置き換えた「私は学校に行きます(ナヌン・ハッキョエ・カネヨ)」、動詞の接尾語を取ってややぞんざいな表現にした「私は学校に行く(ナヌン・ハッキョエ・カ)」、助詞を省いた「私、学校行く(ナ・ハッキョ・カンダ)」のような変化が起きるためだ。

  韓国電子通信研究院(ETRI)のキム・ヨンギル室長は「語順も変化が多くて述語が省略される場合もある。韓国語は英語に比べて翻訳難易度が相当高い言語」と説明した。

  単語の順序を意味する語順も機械翻訳の品質に影響を及ぼす。韓国語と日本語は主語-目的語-述語形態を有している。これに対し、英語・スペイン語・フランス語は主語-述語-目的語の語順だ。語順が同じであれば当然機械翻訳した時の正確度は高まる。反対に語順が異なれば正確度は落ちる。

  その半面、韓国語を英語に翻訳したり英語を韓国語に翻訳する場合、日本語を間に入れて「韓国語→日本語→英語」、「英語→日本語→韓国語」の順で機械翻訳をすると正確度が高まる。これをピボット(飛び石言語を利用して機械翻訳をすること)という。東南アジア言語のようにコンピュータの学習データを入手するのが難しい言語も翻訳の品質が落ちる。

  「私は栗を食べた(ナヌン・パムル・モゴッタ)」という韓国語の文章をグーグル翻訳機に通すと、「栗」を意味する「パム」が同音異義語の「夜」と解釈されて「I had nights」という誤った文章が出てくる。半面、韓国のソフトウエア大手ハンコムの翻訳アプリ「GenieTalk」に同じく「ナヌン・パムル・モゴッタ」という韓国語の文章を入れると「I ate a chestnut」という正確な結果が出てくる。

  このように結果が異なって出てくる理由は「翻訳の中心言語」が違うためだ。ハンコムの子会社ハンコムインターフリーのシン・ソウ代表は「グーグル翻訳は英語を中心にし、GenieTalkは韓国語を中心にしているためこのような違いが生まれる」と話した。
【今日の感想】この記事を読んで・・・
興味深い
悲しい
すっきり
腹立つ
役に立つ

今日のイチオシ記事