jiqi fanyi
機器翻譯
machine translation
用計算機把一種自然語言翻譯為另一種自然語言,又稱自動翻譯。被翻譯的語言稱為源語,譯出的語言稱為目標語。機器翻譯不僅和人工智能研究關係密切,而且還涉及語言學研究(特別是應用語言學研究)。它是有一定代表性的計算機非數值應用研究。機器翻譯過程和人翻譯有某些類似之處,也要通過查詞典、源語分析和目標語綜合等幾個階段。機器翻譯係統一般包括詞典、語法分析、語義分析和轉換與綜合等4個子係統。
詞典子係統 機器詞典是存儲在計算機係統內的一部雙語或多語大詞典,其中對每個源語詞不僅指出對應的目標語的譯法,而且還給出翻譯過程中需要使用的其他一係列信息,例如詞類信息、詞組信息、語法信息、語義信息和目標語綜合信息等。機器詞典是機器翻譯工作的基礎,詞典子係統的任務就是在計算機內建立並使用這樣一部大詞典。在翻譯過程開始時,通過自動查找這部機器詞典,提供源語句子中每個詞的有關信息。
語法分析子係統 求得源語詞彙和詞組信息之後,計算機還要對源語句子進行語法分析,求出源語句子的語法結構,即查明句中各詞之間的語法關係。通常,這種語法結構用一種倒置的樹狀圖來表示,稱為語法樹。例如,英語句子“I read a book”,通過翻譯係統的語法分析子係統,可得到語法結構描述(見圖語法樹)。
語義分析子係統 為了得到正確的譯文,不能僅僅進行形式語法分析。例如有些詞彙具有多種詞義,即所謂多義詞;有些句子脫離上、下文的語義就可能有一種以上的不同語法解釋,形成多值語法結構。為解决這些多義和多值問題,必須使用語義手段進行一定的語義分析。在機器翻譯研究中,語義分析是一個比較薄弱的環節,還需要結合人工智能和語言理解的研究進行深入的探討。
轉換和綜合子係統 根據求得的詞彙信息、語法信息和語義信息,計算機進行翻譯的最後一個階段是目標語譯文的綜合。譯文的産生考慮源語與目標語之間在詞彙和語法等方面的差異,找出對應的規則,進行必要的詞彙轉換和語法結構轉換,綜合出合乎目標語語言規範的譯文。轉換和綜合子係統是翻譯過程的主要完成者,其他子係統都是在為機器翻譯提供必要的信息準備。
特點 機器翻譯的特點是速度快,計算機能在較短的時間內“不知疲倦地”完成大量的文字翻譯工作;但是機器翻譯質量尚不理想,譯文比較生硬呆板,有些譯句不通順,甚至譯錯。機器翻譯衹適用於翻譯語法結構比較嚴謹、詞彙含義比較明確的文獻,例如科技文獻。為保證機器翻譯具有一定的譯文質量,往往還需要人從旁協助,進行所謂的“譯前加工”(源語句子輸入計算機時,對機器難於處理的某些語言現象由人先提供一定的註釋和解法)或“譯後編輯”(對計算機翻譯出來的譯文由人再去校對和潤色),甚至要求建立人機合作式的機器翻譯係統,對計算機翻譯過程中出現的疑難問題,隨時由人提供解答。
(耿立大)
|