주요 기사 바로가기

韓国語は機械翻訳が難しい…英語に訳すにはまず日本語に1次翻訳

ⓒ 中央日報/中央日報日本語版2016.10.19 08:09
0
韓国語は機械翻訳が難しい言語に挙げられている。語根や接頭語、接尾語によって単語の機能が決まるからだ。例えば基本文「私は学校に行く(ナヌン・ハッキョエ・カンダ)」もさまざまな形態に変わる。基本文を丁寧語に置き換えた「私は学校に行きます(ナヌン・ハッキョエ・カネヨ)」、動詞の接尾語を取ってややぞんざいな表現にした「私は学校に行く(ナヌン・ハッキョエ・カ)」、助詞を省いた「私、学校行く(ナ・ハッキョ・カンダ)」のような変化が起きるためだ。

韓国電子通信研究院(ETRI)のキム・ヨンギル室長は「語順も変化が多くて述語が省略される場合もある。韓国語は英語に比べて翻訳難易度が相当高い言語」と説明した。

 
単語の順序を意味する語順も機械翻訳の品質に影響を及ぼす。韓国語と日本語は主語-目的語-述語形態を有している。これに対し、英語・スペイン語・フランス語は主語-述語-目的語の語順だ。語順が同じであれば当然機械翻訳した時の正確度は高まる。反対に語順が異なれば正確度は落ちる。

その半面、韓国語を英語に翻訳したり英語を韓国語に翻訳する場合、日本語を間に入れて「韓国語→日本語→英語」、「英語→日本語→韓国語」の順で機械翻訳をすると正確度が高まる。これをピボット(飛び石言語を利用して機械翻訳をすること)という。東南アジア言語のようにコンピュータの学習データを入手するのが難しい言語も翻訳の品質が落ちる。

「私は栗を食べた(ナヌン・パムル・モゴッタ)」という韓国語の文章をグーグル翻訳機に通すと、「栗」を意味する「パム」が同音異義語の「夜」と解釈されて「I had nights」という誤った文章が出てくる。半面、韓国のソフトウエア大手ハンコムの翻訳アプリ「GenieTalk」に同じく「ナヌン・パムル・モゴッタ」という韓国語の文章を入れると「I ate a chestnut」という正確な結果が出てくる。

このように結果が異なって出てくる理由は「翻訳の中心言語」が違うためだ。ハンコムの子会社ハンコムインターフリーのシン・ソウ代表は「グーグル翻訳は英語を中心にし、GenieTalkは韓国語を中心にしているためこのような違いが生まれる」と話した。

関連記事

最新記事

    もっと見る 0 / 0
    TOP