• / 8
  • 下載費用:30 金幣  

一種專名自動翻譯的方法.pdf

關 鍵 詞:
一種 專名 自動 翻譯 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
摘要
申請專利號:

CN201310638808.8

申請日:

2013.11.30

公開號:

CN103678288A

公開日:

2014.03.26

當前法律狀態:

授權

有效性:

有權

法律詳情: 專利權質押合同登記的生效IPC(主分類):G06F 17/28登記號:2018420000061登記生效日:20181115出質人:語聯網(武漢)信息技術有限公司質權人:交通銀行股份有限公司湖北自貿試驗區武漢片區分行發明名稱:一種專名自動翻譯的方法申請日:20131130授權公告日:20160817|||專利權人的姓名或者名稱、地址的變更IPC(主分類):G06F 17/28變更事項:專利權人變更前:武漢傳神信息技術有限公司變更后:語聯網(武漢)信息技術有限公司變更事項:地址變更前:430073 湖北省武漢市東湖開發區光谷軟件園一期以西、南湖南路以南、光谷軟件園六期2幢5層205號變更后:430070 湖北省武漢市東湖開發區光谷軟件園一期以西、南湖南路以南、光谷軟件園六期2幢5層205號|||授權|||著錄事項變更IPC(主分類):G06F 17/28變更事項:發明人變更前:江潮變更后:江潮 張芃|||實質審查的生效IPC(主分類):G06F 17/28申請日:20131130|||公開
IPC分類號: G06F17/28 主分類號: G06F17/28
申請人: 武漢傳神信息技術有限公司
發明人: 江潮
地址: 430073 湖北省武漢市東湖開發區光谷軟件園一期以西、南湖南路以南、光谷軟件園六期2幢5層205號
優先權:
專利代理機構: 代理人:
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201310638808.8

授權公告號:

|||||||||||||||

法律狀態公告日:

2018.12.07|||2018.01.30|||2016.08.17|||2016.07.20|||2014.04.23|||2014.03.26

法律狀態類型:

專利權質押合同登記的生效、變更及注銷|||專利權人的姓名或者名稱、地址的變更|||授權|||著錄事項變更|||實質審查的生效|||公開

摘要

本發明公開了一種專名自動翻譯的方法,包括:確定待譯文檔中的關鍵詞,將所述關鍵詞與專名庫中的專名進行模式匹配,匹配成功后,將該關鍵詞作為候選專名,并在所述專名庫中的找到與所述候選專名對應的相關詞集;選取所述候選專名在所述待譯文檔中一定范圍內的詞語,并以所述相關詞集在所述選取的詞語中進行模式匹配,根據匹配成功的所述詞語和與其匹配的相關詞的相關度信息進行專名可能性計算,結果滿足可能性要求,將所述候選專名按照所述專名的譯文顯示。本發明通過每個專名關鍵詞的一般相關度和位置相關度,以及專名可能性的進行計算處理,提高了專名翻譯的準確性,提高了翻譯效率、翻譯質量,并有效的降低了人工成本。

權利要求書

權利要求書
1.  一種專名自動翻譯的方法,其特征在于,包括:
確定待譯文檔中的關鍵詞,將所述關鍵詞與專名庫中的專名進行模式匹配,匹配成功后,將該關鍵詞作為候選專名,并在所述專名庫中的找到與所述候選專名對應的相關詞集;
選取所述候選專名在所述待譯文檔中一定范圍內的詞語,并以所述相關詞集在所述選取的詞語中進行模式匹配,根據匹配成功的所述詞語和與其匹配的相關詞的相關度信息進行專名可能性計算,結果滿足可能性要求,將所述候選專名按照所述專名的譯文顯示。

2.  根據權利要求1所述的方法,其特征在于,所述相關詞的相關度信息包括:一般相關度和位置相關度;
其中,所述位置相關度根據具體位置劃分為若干項;
還包括:在所述選取所述候選專名在所述待譯文檔中一定范圍內的詞語的同時,記錄選取的每個詞語的位置信息;
根據所述詞語和所述詞語的位置信息,以及所述相關詞的所述一般相關度和位置相關度進行所述專名可能性計算。

3.  根據權利要求2所述的方法,其特征在于,所述具體位置劃分包括:所述詞語為所述候選專名前第N個、所述詞語為所述候選專名前第M個、所述詞語為所述候選專名所在段、所述詞語為所述候選專名所在句和所述詞語在待譯文檔其他位置。

4.  根據權利要求3所述的方法,其特征在于,所述專名可能性計算包括:
根據所述詞語的位置信息,匹配出其位置相關度;
分別計算每個所述詞語對應的一般相關度和位置相關度的乘積,結果等于預定閾值,則將所述關鍵詞按照所述專名的譯文顯示;
否則,每個候選專名的專名可能性按照如下公式計算:
pos=e·cor_count·ln(1+1cor_count)(1+1cor_count)cor_count]]>
其中,pos為專名可能性,取值范圍為(0-1),e為自然常數,cor_count為該候選專名的所有相關詞語對應的一般相關度和位置相關度的乘積之和;
對得到的pos與專名可能性閾值POS比較,大于POS,則將所述候選專名按照所述專名的譯文顯示。

5.  根據權利要求1所述的方法,其特征在于,所述確定待譯文檔中的關鍵詞的過程包括:
對待譯文檔按照詞性進行分詞處理,并且保留其中的名詞、成語和簡稱略語,作為所述關鍵詞。

6.  根據權利要求1所述的方法,其特征在于,在將所述關鍵詞按照所述專名的譯文顯示之前,還包括:根據待譯文檔的翻譯方向,選取與所述翻譯方向語言一致的譯文。

說明書

說明書一種專名自動翻譯的方法
技術領域
本發明涉及一種計算機輔助翻譯領域,具體而言,涉及一種專名自動翻譯的方法。
背景技術
計算機輔助翻譯(CAT),類似于CAD(計算機輔助設計),實際起了輔助翻譯的作用,簡稱CAT(Computer Aided Translation)。它能夠幫助翻譯者優質、高效、輕松地完成翻譯工作。它不同于以往的機器翻譯軟件,不依賴于計算機的自動翻譯,而是在人的參與下完成整個翻譯過程,與人工翻譯相比,質量相同或更好,翻譯效率可大幅度提高。CAT使得繁重的手工翻譯流程自動化,并大幅度提高了翻譯效率和翻譯質量。
計算機技術在翻譯中的應用主要指將其他行業的一些成熟的方法、工具和資源等利用計算機技術應用到翻譯過程中從而輔助翻譯。計算機輔助翻譯是研究如何設計或應用“方法、工具和資源”以便幫助譯員更好的完成翻譯工作,同時也能有助于研究和教學活動的進行。
專名的翻譯是翻譯中一個重要的方面,由于其特殊性,雖然許多專名雖然按音譯翻譯不是完全準確,但長期以來約定俗成是固定翻譯的,所以應該以固定的翻譯結果出現,否則對于譯文的理解就會產生很大的偏差,比如按韋氏拼音拼寫的“蔣介石”的英文名“Chiang Kai-shek”被誤譯成“常凱申”就是一種非常嚴重的誤翻 譯。專名的翻譯包括人名、地名、機構名、媒體名、文藝作品名、品牌名等各類專有名詞的翻譯,在文字系統相同和相似的語言間,由于書同文的便利,源語言名稱往往能夠以原文的書寫形式被目的語直接借用,而在文字系統各不相同的語言間,由于文字兼容性不足,導致在專名翻譯中音譯、語義翻譯、重新命名等多樣化轉換方式的存在,從而使得專名翻譯的規范化存在困難。
目前,對于一個翻譯任務的翻譯,在進行機器自動翻譯的時候,需要經過標準、校正等過程,并且專名的翻譯準確度很低,經常翻譯的結果與目標相差很遠,嚴重影響翻譯質量。
發明內容
本發明旨在提供一種專名自動翻譯的方法,以解決上述現有技術中專名的翻譯準確度很低、效率底的問題。
本發明公開了一種專名自動翻譯的方法,包括:
確定待譯文檔中的關鍵詞,將所述關鍵詞與專名庫中的專名進行模式匹配,匹配成功后,將該關鍵詞作為候選專名,并在所述專名庫中的找到與所述候選專名對應的相關詞集;
選取所述候選專名在所述待譯文檔中一定范圍內的詞語,并以所述相關詞集在所述選取的詞語中進行模式匹配,根據匹配成功的所述詞語和與其匹配的相關詞的相關度信息進行專名可能性計算,結果滿足可能性要求,將所述候選專名按照所述專名的譯文顯示。
優選地,所述相關詞的相關度信息包括:一般相關度和位置相關度;
其中,所述位置相關度根據具體位置劃分為若干項;
還包括:在所述選取所述候選專名在所述待譯文檔中一定范圍內的詞語的同時,記錄選取的每個詞語的位置信息;
根據所述詞語和所述詞語的位置信息,以及所述相關詞的所述一般相關度和位置相關度進行所述專名可能性計算。
優選地,所述具體位置劃分包括:所述詞語為所述候選專名前第N個、所述詞語為所述候選專名前第M個、所述詞語為所述候選專名所在段、所述詞語為所述候選專名所在句和所述詞語在待譯文檔其他位置。
優選地,所述專名可能性計算包括:
根據所述詞語的位置信息,匹配出其位置相關度;
分別計算每個所述詞語對應的一般相關度和位置相關度的乘積,結果等于預定閾值,則將所述關鍵詞按照所述專名的譯文顯示;
否則,每個候選專名的專名可能性按照如下公式計算:
pos=e·cor_count·ln(1+1cor_count)(1+1cor_count)cor_count]]>
其中,pos為專名可能性,取值范圍為(0-1),e為自然常數,cor_count為該候選專名的所有相關詞語對應的一般相關度和位置相關度的乘積之和;
對得到的pos與專名可能性閾值POS比較,大于POS,則將所述候選專名按照所述專名的譯文顯示。
優選地,所述確定待譯文檔中的關鍵詞的過程包括:
對待譯文檔按照詞性進行分詞處理,并且保留其中的名詞、成語和簡稱略語,作為所述關鍵詞。
優選地,在將所述關鍵詞按照所述專名的譯文顯示之前,還包括:根據待譯文檔的翻譯方向,選取與所述翻譯方向語言一致的譯文。
本發明中的專名自動翻譯的方法,具有以下優點:
1、提高了專名翻譯的準確性;
2、提高了翻譯的效率;
3、有效的降低了人工成本。
附圖說明
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:
圖1示出了實施例的流程圖。
具體實施方式
下面將參考附圖并結合實施例,來詳細說明本發明。
專用名詞的翻譯是翻譯中的重要部分,對于專名的翻譯目前有兩個主要問題,一是由于大量的專名是普通名詞在特定場合、特定環境下的使用,對于這些專名的翻譯是采用普通翻譯還是專名翻譯,需要準確確定;二是由于目前一個翻譯任務往往是多人或多個小組共同完成,對其中專名的翻譯進行統一、準確的規范化翻譯是提高翻譯質量、保持翻譯一致性的重要手段。
專名庫是具有大量的專名,其中,該專名通過在已翻譯文檔和/或網絡上提取得到。專名庫中的專名包括:專用人名、專用地名、專用機構團體名和專用出版物及商標名;專名包括各個語言版本,并且,每個專名對應有一相關詞集,如表1所示,該詞集中的相關詞與該專名具有很強的相關性;相關詞集中的每一個相關詞均至少包含有兩個特征項:一般相關度和位置相關度;其中,二者的取值范圍在0~1之間;
其中,一般相關度是指該相關詞和該專名的相關程度,其中,一般相關度數值,根據詞語之間的語法關系、同時出現頻率或根據多個標準句子的數據庫,進行學習或訓練運算得到。位置相關度是指該相關詞在文檔中與該專名的空間位置及距離所產生的相關度。并且,位置相關度根據具體的位置關系分為五檔,包括:前第N個、后第M個、所在段、所在句和其他位置。
表1:專有名詞“Holmes”(福爾摩斯)的相關詞及其相關度表


如圖1所示,根據上述專名庫,本發明公開了一種專名自動翻譯的方法,包括:
步驟S11,確定待譯文檔中的關鍵詞,將所述關鍵詞與專名庫中的專名進行模式匹配,匹配成功后,將該關鍵詞作為候選專名,并在所述專名庫中的找到與所述候選專名對應的相關詞集;
步驟S12,選取所述候選專名在所述待譯文檔中一定范圍內的詞語,并以所述相關詞集在所述選取的詞語中進行模式匹配,根據匹配成功的所述詞語和與其匹配的相關詞的相關度信息進行專名可 能性計算,結果滿足可能性要求,將所述候選專名按照所述專名的譯文顯示。
進一步的,本發明公開了一個優選的實施例,包括:
提取待譯文檔,將待譯文檔按照詞性進行分詞處理,得到停用詞、形容詞、副詞、動詞、名詞、成語和簡稱略語;
對其中的停用詞、形容詞、副詞和動詞進行剔除處理,保留其中的名詞、成語和簡稱略語作為關鍵詞,構成關鍵詞集。
對得到的關鍵詞集中的每個關鍵詞在專名庫中進行模式匹配,將匹配成功的關鍵詞作為候選專名,構成候選專名集合;
并且對每個候選專名在專名庫中找到對應的相關詞集;
在所述選取每個所述候選專名在所述待譯文檔中一定范圍內的詞語,同時記錄選取的每個詞語的位置信息;
以該候選專名對應的相關詞集在該候選專名的所有詞語中進行模式匹配,匹配成功后,根據匹配成功的所述詞語和與其匹配的相關詞的相關度信息進行專名可能性計算;
進一步的,相關度計算包括:
計算該候選專名的詞語匹配成功的相關詞的相關數,即:

其中,cor_count為相關數,cor_gen為一般相關度,cor_loc為位置相關度。
若存在某一匹配成功相關詞的一般相關度cor_gen和位置相關度cor_loc的乘積為1,則表明該候選專名有一個精確匹配的相關詞,將該候選專名按照所述專名的譯文顯示;其中,根據待譯文檔的翻譯方向,選取與所述翻譯方向語言一致的譯文顯示;
否則,表明該候選專名的任一相關詞都沒有精確匹配,按照如下公式計算進行專名可能性計算:
pos=e·cor_count·ln(1+1cor_count)(1+1cor_count)cor_count]]>
其中,pos為專名可能性,取值范圍為(0-1),e為自然常數,cor_count為該候選專名的所有相關詞語對應的一般相關度和位置相關度的乘積之和;
對得到的pos與專名可能性閾值POS(取值一般不小于0.98)進行比較,pos>POS,則將所述關鍵詞按照所述專名的譯文顯示。
以上所述僅為本發明的優選實施例而已,并不用于限制本發明,對于本領域的技術人員來說,本發明可以有各種更改和變化。凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。

關于本文
本文標題:一種專名自動翻譯的方法.pdf
鏈接地址:http://www.pqsozv.live/p-6180657.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
钻石光影