詞語 : 語言學術語 : 物理學類 : 冶金 : 計算語言學 : 軟件 > 機器翻譯
目錄
統計機器翻譯
  最早提出可行的統計機器翻譯模型的是IBM 沃森研究院的研究人員。在著名的文章《機器翻譯的數學理論》中提出了由五種詞到詞的統計模型,稱為 IBM 模型 1 到 IBM 模型 5。這五種模型均源自信源-信道模型,采用最大似然法估計參數。由於當時(1993年)計算條件的限製,無法實現基於大規模數據訓練。其後,由Stephan Vogel提出了基於隱馬爾科夫模型的統計模型也受到重視,該模型被用來替代IBM Model 2.
  在此文發表後6年,一批研究人員在約翰·霍普金斯大學的機器翻譯夏令營上實現了GIZA軟件包。Franz Joseph Och 在隨後對該軟件進行了優化,加快訓練速度。特別是IBM Model 3 到 5的訓練。同時他提出了更加復雜的Model 6。Och發佈的軟件包被命名為GIZA++,直到現在,GIZA++還是絶大部分統計機器翻譯係統的基石。針對大規模語料的訓練,已有GIZA++的若幹並行化版本存在。
  基於詞的統計機器翻譯的性能卻由於建模單元過小而受到限製。因此,許多研究者開始轉嚮基於短語的翻譯方法。Franz-Josef Och提出的基於最大熵模型的區分性訓練方法使統計機器翻譯的性能極大提高,在此後數年,該方法的性能遠遠領先於其他方法。一年後Och又修改最大熵方法的優化準則,直接針對客觀評價標準進行優化,從而誕生了今天廣泛采用的最小錯誤訓練方法(Minimum Error Rate Training)。
  另一件促進統計機器翻譯進一步發展的重要發明是自動客觀評價方法的出現,為翻譯結果提供了自動評價的途徑,從而避免了繁瑣與昂貴的人工評價。最為重要的評價是BLEU評價指標。絶大部分研究者仍然使用BLEU作為評價其研究結果的首要的標準。
  Moses 是目前維護較好的開源機器翻譯軟件,由愛丁堡大學研究人員組織開發。其發佈使得以往繁瑣復雜的處理簡單化。
百科大全
  jiqi fanyi
  機器翻譯
  machine translation
    用計算機把一種自然語言翻譯為另一種自然語言,又稱自動翻譯。被翻譯的語言稱為源語,譯出的語言稱為目標語。機器翻譯不僅和人工智能研究關係密切,而且還涉及語言學研究(特別是應用語言學研究)。它是有一定代表性的計算機非數值應用研究。機器翻譯過程和人翻譯有某些類似之處,也要通過查詞典、源語分析和目標語綜合等幾個階段。機器翻譯係統一般包括詞典、語法分析、語義分析和轉換與綜合等4個子係統。
    詞典子係統 機器詞典是存儲在計算機係統內的一部雙語或多語大詞典,其中對每個源語詞不僅指出對應的目標語的譯法,而且還給出翻譯過程中需要使用的其他一係列信息,例如詞類信息、詞組信息、語法信息、語義信息和目標語綜合信息等。機器詞典是機器翻譯工作的基礎,詞典子係統的任務就是在計算機內建立並使用這樣一部大詞典。在翻譯過程開始時,通過自動查找這部機器詞典,提供源語句子中每個詞的有關信息。
    語法分析子係統 求得源語詞彙和詞組信息之後,計算機還要對源語句子進行語法分析,求出源語句子的語法結構,即查明句中各詞之間的語法關係。通常,這種語法結構用一種倒置的樹狀圖來表示,稱為語法樹。例如,英語句子“I read a book”,通過翻譯係統的語法分析子係統,可得到語法結構描述(見圖語法樹)。
    語義分析子係統 為了得到正確的譯文,不能僅僅進行形式語法分析。例如有些詞彙具有多種詞義,即所謂多義詞;有些句子脫離上、下文的語義就可能有一種以上的不同語法解釋,形成多值語法結構。為解决這些多義和多值問題,必須使用語義手段進行一定的語義分析。在機器翻譯研究中,語義分析是一個比較薄弱的環節,還需要結合人工智能和語言理解的研究進行深入的探討。
    轉換和綜合子係統 根據求得的詞彙信息、語法信息和語義信息,計算機進行翻譯的最後一個階段是目標語譯文的綜合。譯文的産生考慮源語與目標語之間在詞彙和語法等方面的差異,找出對應的規則,進行必要的詞彙轉換和語法結構轉換,綜合出合乎目標語語言規範的譯文。轉換和綜合子係統是翻譯過程的主要完成者,其他子係統都是在為機器翻譯提供必要的信息準備。
    特點 機器翻譯的特點是速度快,計算機能在較短的時間內“不知疲倦地”完成大量的文字翻譯工作;但是機器翻譯質量尚不理想,譯文比較生硬呆板,有些譯句不通順,甚至譯錯。機器翻譯衹適用於翻譯語法結構比較嚴謹、詞彙含義比較明確的文獻,例如科技文獻。為保證機器翻譯具有一定的譯文質量,往往還需要人從旁協助,進行所謂的“譯前加工”(源語句子輸入計算機時,對機器難於處理的某些語言現象由人先提供一定的註釋和解法)或“譯後編輯”(對計算機翻譯出來的譯文由人再去校對和潤色),甚至要求建立人機合作式的機器翻譯係統,對計算機翻譯過程中出現的疑難問題,隨時由人提供解答。
     (耿立大)
    
相關詞
藝術傢自然語言歷史人物西晉
包含詞
機器翻譯評價華建機器翻譯公司以例句為本的機器翻譯
知識為本之機器翻譯基於知識的機器翻譯