Facebookは英語に頼らずに100言語間の翻訳を行う

Facebookは、英語データを使わずに100言語間の翻訳が可能な初の多言語機械翻訳モデル(MMT)だと主張する「M2M-100」の発売を発表した。

利用可能な主な多言語モデルは、英語に焦点を当てています。例えば、中国語からフランス語に翻訳するには、中国語から英語に、英語からフランス語に翻訳するには、実際に翻訳してくれます。

“我々のモデルは、中国語からフランス語にデータを直接配信しているため、元の意味をより良く保持しています。“と、同社の人工知能部門であるFacebook AIの研究アシスタント、アンジェラ・ファン氏は述べています。

Facebookによると、機械翻訳システムの品質を評価する手法であるBLEU(Bilingual Evaluation Understudy)メトリクスによると、M2M-100モデルは英語中心のモデルを10ポイント上回っているという。

このような結果を得るために、同社は100言語75億文のデータセットを構築した。

このようにして、150億以上のパラメータを持つ普遍的な翻訳モデルを作成することができ、Facebookによると、「関連言語からの情報を取り込み、より多様な言語と形態素のスクリプトを反映させることができる」という。

同社では、このモデルの導入により、特に英語以外の言語を話す数十億人の人々の翻訳品質が向上することを期待している。Facebookが毎日投稿している160言語の投稿総数のうち、3分の2は英語ではありません。

同社は、モデルの構成、トレーニング、評価をオープンソースとして公開し、他の研究者がモデルを洗練させることができるようにしたという。

comments powered by Disqus