![]() |
![]() |
|
1987年度から政府開発援助(ODA)の一環として、「近隣諸国間の機械翻訳システム」に関する共同研究を中華人民共和国、インドネシア共和国、マレーシア国、タイ王国と共同で実施し、95年度からフォローアップ事業を行っています。 |
|
■背景 |
![]() |
|
|
![]() |
|
機械翻訳システムは、次の目的を持って研究開発されました。 ・最新の情報処理システムの共同研究開発 また、技術面、および経済面 の2つの面から、次の開発目標が揚げました。 【技術面】 |
![]() |
|
機械翻訳システムは、日本、中華人民共和国、インドネシア共和国、マレーシア国、およびタイ王国の5カ国で共同研究開発されました。日本においては、通商産業省から研究開発の委託を受けた(財)国際情報化協力センターが中心になり、いくつかの企業が機械翻訳システムの研究開発、およびプロジェクトへの支援を行ないました。近隣アジア諸国においては、それぞれの国の研究推進機関が研究開発を行いました。 ![]() 図1 体制図 |
| 関連機関へのリンク |
![]() |
|
この研究開発では、5か国語間の機械翻訳システムにおいて「中間言語方式」を採用しました。したがいまして、研究開発の内容及び成果としては、中間言語の仕様の作成、作成した仕様に基づく機械翻訳システムの開発及び電子化辞書・コーパスの作成、開発したシステムによる機械翻訳の実証実験等が挙げられます。 |
![]() |
|
1987年度から1994年までの8年をかけて、機械翻訳システムの研究開 発を進めました。図2に機械翻訳システムの研究開発の経緯を示します。1995年から1996年度には、8年間の共同研究の成果をもとに、フォローアップ事業を行なっています。 ![]() 図2 研究開発の経過 (1)機械翻訳システムの基礎研究 最初の2年間で、機械翻訳システムを構成するいくつかのシステムと要素(参 考1の1を参照)の基本仕様を設計し、試作しました。約5000語の辞書と数10の例文を作成し、文法規則の仕様を設計しました。また、限定された翻訳例文を使って、機械翻訳システムの処理能力を確認しました。 (2)機械翻訳システムの研究開発 次の4年間で、基本語辞書約5万語、情報処理関連の専門語辞書2万5千語、 および約3000の例文を作成し、文解析や文生成を制御する文法規則を試作しました。また、追加した翻訳例文と任意の自然文を使って、機械翻訳システムの翻訳処理能力を確認しました。 (3)機械翻訳システムの評価と改良 最後の2年間で、第(2)段階までに試作された機械翻訳システムを使って、 翻訳処理能力実験を繰り返し、辞書、文法規則、およびシステム全体を改善しました。 (4)機械翻訳研究フォローアップ事業 8年間の共同研究の成果をもとに、研究に参加した各国において辞書・文法の 改良・追加、機械翻訳システム実用化に向けた追加研究を独自に実施できるよう支援しています。 |
![]() |
|
ここでは、多言語機械翻訳システムの翻訳の流れ、およびシステムの概要について説明します。
![]() 図3 機械翻訳システムの構成と翻訳の流れ
|
|
|
さらに、各言語対応の”文章ファイル管理機能”を持った「総合システム」があります。総合システムは、機械翻訳システムを一つのワークステーション(スタンドアロン)上で実現したり、また、ワークステーションどうしをネットワーク上に接続するためのインターフェースを実現します。 以下に翻訳の流れを説明します。 |
|
操作1. 原文入力
原文をシステムに入力します。原文はワードプロセッサなどを利用して端末から直接入力するか、またはフロッピーディスクやハードディスクなどの磁気媒体から入力されます。 操作 2.前編集 翻訳支援システムの前編集では、翻訳オペレータが原文を端末の画面上で機械翻訳の処理がしやすいように、必要に応じて修正します。処理されたデータは文解析システムに送られます。 操作 3.文解析 文解析システムでは、電子化辞書システムに蓄積されている機械翻訳情報(文法情報や意味情報などの解析文法規則、および各言語と中間言語との対応情報)を基に入力されたデータの形態素、構文、および意味の解析を行ないます。さらに解析されたデータを機械翻訳情報を基に中間言語に変換し、文生成システムに送ります。 操作 4.文生成 文生成システムでは、電子化辞書システムの機械翻訳情報(生成文法規則、および各言語との中間言語との対応情報)をもとに指定された言語に合わせて中間言語から文体、構文、および形態素を生成し、出力システム・翻訳支援システムに送ります。 操作 5.後編集 翻訳支援システムの後編集では、翻訳オペレータが機械翻訳結果と原文を対照しながら画面上で確認し、必要に応じて編集します。 操作 6.訳文出力 編集された訳文は、出力システムを介してプリンタや磁気媒体に出力されます。 |
この多言語機械翻訳システムでは、日本語、中国語、インドネシア語、マレーシア語、およびタイ語を対象言語としました各国の言語は中間言語を経由して、相互に翻訳されます。このような方式を中間言語方式といい、図4に示すように、1つの言語を一度に複数の他国語に翻訳できるのが特徴です。 ![]() 図4 言語構成 |
この機械翻訳システムでは、多言語の翻訳処理を目標としています。日本語から中国語へ、中国語からインドネシア語への翻訳など、機械翻訳システムを共同開発している国の言語であれば、相互に翻訳処理できるというものです。 |
![]() |
|
多言語機械翻訳システムのハードウェア構成・ソフトウェア構成及びネットワークを説明します。
多言語機械翻訳システムのハードウェア構成のモデルとして以下のタイプがあります。
|
機械翻訳システムのソフトウェア構成を以下に示します。
![]() 図7 ソフトウェア構成図 |
WANを利用するネットワーク構成には、以下の方法があります。
|