
- 簡體中文
- 繁體中文
- English
- Japanese
- Korean
- Russian
- French
- Spanish
互聯網的飛速發展極大地豐富了翻譯方式,帶動了全球翻譯市場的繁榮。為了節約成本,提高翻譯效率,譯員紛紛借助于現代網絡技術及工具來輔助完成翻譯任務,出現了眾多新穎的翻譯方式。其中尤其以MT(Machine Translation,機器翻譯)和CAT(Computer - Aided Translation,計算機輔助翻譯)兩種翻譯方式使用最廣、接受度最高。有鑒于此,文章詳細描述這兩種翻譯方式的發展演變及工作原理,指出其異同及優缺點,從而幫助譯員在翻譯實踐中選擇適合自己的翻譯方式。
一、兩種主要翻譯方式概述
(一)機器翻譯概述
機器翻譯,顧名思義就是指通過機器將一種語言形式自動轉換為另一種語言形式的過程。在整個語言轉換過程中,機器始終是語言轉換的直接參與者或參與主體,是譯文生成的核心形式。
根據不同發展階段所呈現出的不同特征,機器翻譯主要可以劃分為基于語言規則的翻譯和基于語料庫的翻譯兩種形式,其翻譯特點及具體流程如下所述。
1.基于語言規則的機器翻譯
任何一種語言都有自己獨特的諸如語音、詞匯、句法、語義等系統。在這些系統的協調作用下,語言的交流功能得以成功實現。20 世紀后半期,隨著計算機技術和現代語言學特別是喬姆斯基的轉換生成語法理論的日益發展,語言學家開始嘗試著將語言學與計算機技術相結合,編制出一套公式化、規則化的語言結構模型,嘗試著用規則去描述語言進而翻譯語言以實現不同語言間的轉換,即基于語言規則的機器翻譯。
基于語言規則的機器翻譯的工作原理為:計算機軟件將輸入的原語文本通過詞法、句法、語法、語義等分析轉換生成為計算機系統內儲存的中間語言結構模型,再經由中間語言結構模型轉換生成為另一種語言即目標語言,從而實現不同語言間的近乎等值的轉換。這類機器翻譯主要集中在詞典類查閱翻譯軟件方面。代表性的以雙語詞典類軟件為主,主要有:金山詞霸、巴比倫翻譯家、金山快譯、東方快車、南極星、通譯、雅信譯霸等等。
2.基于語料庫的機器翻譯
互聯網技術的日趨普及以及全球國家間經濟與文化交流的深入,為了促進行業間專業化國際化交流,大量不同領域專業文獻資料亟待翻譯,為了系統高效地完成翻譯任務,諸如機械、電子商務、法律、汽車制造、生物醫學等不同領域不同行業的雙語或多語種語料庫應運而生。海量的資源以語料庫的形式被保存于互聯網平臺供譯員使用,尤其是一些專業化程度高、普及度廣的雙語平行語料庫,更為不同語言間的轉換提供了便利。
雙語平行語料庫基于 SGML標記語言對采集到的流通中的真實動態語料通過 TEI 和 CES 文本編碼,以詞、短語及句子為單位進行自動對齊排列,譯員實際翻譯中對有疑問或不懂的地方,只需打開相關的語料庫平臺直接輸人原語文本中的詞頻或句頻進行搜索,就會得到基于統計和實例的鮮活目標語文本語料,極大地提高了翻譯效率,成為翻譯過程中的“機器譯員”。國內外知名的語料庫主要有:北京大學中國語言學研究中心開發研制的“漢英雙語語料庫”、北京語言大學高翻學院開發研制的“高翻記憶庫”、上海交通大學語言工程研究所的四個語料庫、國家語言文字應用研究所開發研制的“計算機專業雙語語料庫”等。一些基于網絡平臺的在線翻譯工具諸如 Google 在線翻譯、百度在線翻譯等正是利用網絡大數據語料庫平臺,為廣大譯員提供質量上乘而又便捷高效的翻譯,在眾多基于網絡語料庫的機器翻譯工具中脫穎而出。
機器翻譯無論是基于語言規則還是基于語料庫的翻譯形式,其翻譯過程都可以歸納為分解、轉換及合成三個步驟。分解階段,系統根據提交的原語詞匯或句子,檢索匹配系統中儲存的語言結構模型或實例,形成原語匹配表達;轉換階段,機器根據系統中的對齊功能將原語匹配表達轉換成目標語匹配表達;合成階段,將目標匹配表達融合到目標語全文文本中,輸出目標譯文。
(二)計算機輔助翻譯概述
機器翻譯較于人工翻譯費時低效帶來了翻譯效率的極大提升,但是由于其糟糕的翻譯質量,到了20 世紀80年代進入了“反思的理性階段”。德國翻譯理論家認為技術的產物,無論怎么復雜,都不能和人腦的創造能力相媲美。20 世紀 80 年代末,隨著計算機技術革命浪潮的蓬勃發展以及網絡平臺大數據資源庫的日益完善,一種新型的基于記憶庫和術語庫的計算機輔助翻譯形式應運而生。廣義的計算機輔助翻譯概念是指,能夠輔助譯員進行翻譯的所有計算機工具,包括文字處理軟件、語法檢查工具、電子郵件和互聯網等。也就是上文所提到的機器翻譯。狹義的計算機輔助翻譯概念是指“為提高翻譯效率,優化翻譯流程而設計的專門的計算機輔助翻譯軟件”。主要包含翻譯記憶工具、術語管理工具等。其中以中國的雅信 CAT、法國的 DejaVu、德國的 Trados 等為典型的代表。
1.翻譯術語庫模塊及其功能
術語庫管理模塊,可以轉換、編輯及生成項目術語庫。確保譯文術語前后的統一性。通過譯前導入客戶所提供的術語資料或譯前翻譯公司及譯員整理的術語資料,系統將導入的術語信息編輯并自動保存到后臺術語庫,在后面的翻譯過程中系統自動從后臺調取供譯員使用。
2.翻譯記憶庫模塊及其功能
翻譯記憶模塊作為計算機輔助翻譯軟件的核心模塊,是“譯者運用計算機程序部分參與翻譯過程的一種翻譯策略”。其工作的原理是:“譯員利用已有的原文和譯文,建立起一個或多個翻譯記憶庫,在翻譯過程中,系統將自動搜索翻譯記憶庫中相同或相似的翻譯資源(如短語、句子、段落等),然后給出參考譯文供譯員選擇,對于給出的參考譯文,譯員可以完全照搬,也可以修改后使用,如果覺得不滿意,還可以棄之不用。這樣譯員就可以避免無謂的重復勞動,專注于新內容的翻譯。而翻譯記憶庫司時在后臺不斷學習并自動儲存新的譯文,變得越來越聰明,效率越來越高。”
二、兩種翻譯方式的比較及翻譯選擇
機器翻譯與計算機輔助翻譯兩者既有聯系又有區別,不能混為一談。機器翻譯是計算機程序自動參與翻譯全過程并直接生成目標譯文;而計算機輔助翻譯,程序本身并不直接參與翻譯,并不能直接生成目標譯文,只是輔助人工提高效率。機器翻譯與計算機輔助翻譯作為“互聯網 +”時代影響較廣的兩種翻譯方式,各有其優劣之處。譯員在翻譯時,應根據所需,揚長避短、趨利避害,選擇適合自己的翻譯方式。兩者的優劣分析如下。
(一)MT和 CAT的優勢比較分析
不論是機器翻譯還是計算機輔助翻譯,較于之前的人工翻譯,速度快、成本低,都從根本上減輕了譯員的負擔,提高了翻譯的效率。
機器翻譯由于系統自身儲存的數以萬計的詞匯、龐大的中間語言結構模型庫及大量分門別類的多語種平行語料庫,可以快速地實現原語與目標語之間的轉換,提高翻譯效率。
計算機輔助翻譯由于系統自身攜帶的術語庫與記憶庫,可以在翻譯進行中自動為譯員從儲存庫中檢索匹配相似詞段及句段供譯員選擇使用,確保譯文前后表達的一致,減少了譯員單調重復的機械勞動。計算機輔助軟件本身還兼容市面上眾多格式的文本并生成與原語文本格式相同的目標文本,省去了專門技術譯員進行排版及格式轉換等工作,降低了翻譯的成本。符合翻譯流程管理本地化節省開支的要求,從而有效地提高了翻譯效率。同時這種以人工為主機器為輔的人機交互翻譯模式,集合人工與機器的優點,在一定程度上避免了以機器為主體自動翻譯模式的弊端,進一步提升了譯文的質量。
(二)MT和CAT的劣勢比較分析
機器翻譯快速便捷,翻譯的前提是必須有大量的概率化的語言結構模型及基于鮮活實例的語料庫供計算機系統進行檢索匹配,從而進行編碼解碼生成目標譯文。語言結構模型模擬人類真實語言規律,通過一定的規則來描述自然語言。盡管計算機具有儲存記憶等功能,但是人類自然語言具有靈活性、復雜性、變化性及開放性等特點,計算機需要識別原語的形態,進行形態分析、語義分析以及句法分析,這就使得中間語言結構模型的構建變得異常困難。王金銓認為,翻譯過程不是一個簡單的語碼轉換過程,而是一個極其復雜的心理過程,是一個非線性的波浪式前進的動態思維過程。尤其是隨著“互聯網+”大數據時代的到來,翻譯的信息量更加龐大,從而一定程度上進一步加深了中間語言結構模型構建的難度。這就導致了基于語言規則的機器翻譯生成的所謂“草稿譯文”質量令人憂慮。而基于語料庫的機器翻譯由于鮮活語料的幫助相對于基于語言規則的翻譯就相對容易許多,譯文的質量更有保障。但是眾所眾知,平行語料庫的建構不是一朝一夕一蹴而就的簡單事情,另外網絡數據平臺儲存的鮮活實例需要耗費大量的人力物力進行篩選整理去粗取精去偽存真。
計算機輔助翻譯充分發揮人工的主體性及能動性以及機器的存儲性與記憶性的特點,在語料庫機器翻譯的基礎上又往前推進了一步。但是作為計輔翻譯的核心組件,術語庫與記憶庫的構建同樣也任重道遠。記憶庫的質量控制、成本維護、開源與封閉、知識產權歸屬等也時刻制約著計算機輔助翻譯的廣泛與長遠的發展。
翻譯活動的復雜性決定了譯員不可能僅單純地依靠某一種翻譯方式就能完成翻譯任務,而是需要綜合使用多種翻譯方式,優勢互補,揚長避短,共同作用于翻譯實踐。
隨著“互聯網+”大數據時代的不斷發展,需要翻譯的文獻資料數量日趨龐大,對翻譯方式的選擇也愈來愈頻繁,選擇什么樣的翻譯方式來進行翻譯是每個譯員急需解決的問題。希望譯員在本文的幫助下,綜合考量所要使用翻譯方式的特點及所翻譯的源文本類型特點來選擇合適的翻譯方式,最大化發揮各種翻譯方式的優勢,從而提高翻譯效率。
文章來源:網絡