語言對翻譯、機器翻譯與人工翻譯以及困境
Date: 2019-07-12 09:56:18Source: 志遠翻譯
一種語言被翻譯成另一種語言時,就形成了語言對。英語被翻譯成西班牙語時,就會稱為和英語-西班牙語語言對。如果能夠以相反的方式翻譯信息,就會創(chuàng)建第二語言對:西班牙語-英語語言對。語言對允許信息從一種語言(源語言)共享和傳輸?shù)搅硪环N語言(目標語言)。
世界上大約有 6500 種語言。如果每一種語言都有一個語言對,那么它們的數(shù)量將超過 3600 萬。如果您把使用人數(shù)少于 1000 人的 2000 種語言排除掉,那么您就把必要的語言對減少到了 2000 多萬。雖然這是一個偉大的目標,但開始的時候最好是針對目前互聯(lián)網上使用的 1500 種語言。關注這 1500 種語言,潛在的語言對就會減少到 225 萬對。
按使用人數(shù)排序,世界上排名前十的語言是法語、馬來印度尼西亞語、葡萄牙語、孟加拉語、阿拉伯語、俄語、西班牙語、印度斯坦語、英語和漢語普通話。如果把這些語言和其他 1490 種常用的語言結合起來使用,就需要3 萬多對語言。如果這些主要語言都有彼此的樞軸,那么仍然需要不到 30萬種語言對才能將其本地語言提供給互聯(lián)網上 99% 的用戶。
為什么這很重要?一直以來,商業(yè)研究就有證明,消費者更有可能購買以其母語呈現(xiàn)的產品并且閱讀其相關信息。
世界上有超過 20 億人,但是,根據(jù)戴維·克里斯特爾著作的《英語作為一門全球語言》一書,只有大約 4 億人把英語作為第一語言,另有 6 億人把英語作為第二語言。這表明世界上超過一半的人口,即超過 10 億的人不會說英語。這是一個巨大的市場,如果您的信息只以英語呈現(xiàn),您將無法接觸這些市場。
機器翻譯和總體語言對
幾十年來,計算機一直被用來創(chuàng)建術語庫和翻譯記憶數(shù)據(jù)庫。隨著計算速度的提高、翻譯算法的進步,收集數(shù)據(jù)所花費的時間大大減少,計算機翻譯的進步呈指數(shù)級增長。
術語庫從一種語言中提取單個單詞,并將其直接翻譯成另一種語言中的字面對等詞。翻譯記憶庫是一個將文本片段(獨特的短語、習語或概念等)與等效翻譯相匹配的數(shù)據(jù)庫。這不僅保證了您的文本的連貫性,也保證了所有翻譯文件的一致性。更好的是,由于保存了這些翻譯,未來的翻譯將會更快、更便宜。就速度和成本而言,您建立的術語庫和翻譯記憶的越多,您的項目就會完成得越快,您節(jié)省的錢也就越多。
使用術語庫和翻譯記憶進行翻譯有兩個主要系統(tǒng):基于規(guī)則的系統(tǒng)和統(tǒng)計系統(tǒng)?;谝?guī)則的系統(tǒng)關注語法規(guī)則、術語的準確度等。統(tǒng)計系統(tǒng)并不關注語言規(guī)則,而是關注分析先前翻譯的數(shù)據(jù)對中的數(shù)據(jù),以使其更加流暢。
學術論文、醫(yī)學論文等翻譯經常需要精確性和高度的可靠性?;谝?guī)則的翻譯更適合這類文本。
機器翻譯的困境
機器翻譯可以打開以前沒能打開的翻譯市場,同時大幅減少進入全球市場所需的配對數(shù)量。使用機器翻譯的缺點是需要人工監(jiān)督。目前,還沒有計算機模型能夠產生具有人工翻譯質量的文件。由于有太多的習語和口語,太多的詞匯歧義和太多的文化差異,使得機器翻譯看起來像翻譯而不是地道的產品。
毫無疑問,機器翻譯正在翻譯行業(yè)留下屬于自己的印記,通過使用計算技術可以獲得的語言對的數(shù)量具有革命性的意義,有時,您需要理解的只是信息的要點。在這種情況下,您可以通過使用機器翻譯從而以本地化的語言接觸到全球受眾。然而,如果出現(xiàn)一個錯誤、誤解或誤判,就可能會導致巨大的合同損失、在文化上的重大冒犯,或者就像醫(yī)學文本的情況一,甚至導致出現(xiàn)生命損失。意義接近的翻譯永遠不能成為好的翻譯。
對于希望向不斷擴大的全球市場傳遞信息的企業(yè)來說,這個領域已然成熟。然而,不可忽視的是,必須意識到有一名精通源語言和目標語言的翻譯的重要性,以確保信息準確無誤,從而不會出現(xiàn)不準確、錯誤或令人感到尷尬或冒犯的內容。
機器翻譯 人工翻譯
- 上一篇:與高語境和低語境文化相關的翻譯問題
- 下一篇:翻譯通則:不同的形式、風格和翻譯質量