• / 11
  • 下載費用:30 金幣  

圖像翻譯系統及圖像翻譯方法.pdf

關 鍵 詞:
圖像 翻譯 系統 方法
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
摘要
申請專利號:

CN201310707608.3

申請日:

2013.12.20

公開號:

CN103699527A

公開日:

2014.04.02

當前法律狀態:

駁回

有效性:

無權

法律詳情: 發明專利申請公布后的駁回IPC(主分類):G06F 17/28申請公布日:20140402|||實質審查的生效IPC(主分類):G06F 17/28申請日:20131220|||公開
IPC分類號: G06F17/28; G06K9/20 主分類號: G06F17/28
申請人: 上海合合信息科技發展有限公司
發明人: 丁凱
地址: 200433 上海市楊浦區國定路335號3號樓7樓B區
優先權:
專利代理機構: 代理人:
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201310707608.3

授權公告號:

||||||

法律狀態公告日:

2017.10.24|||2014.04.30|||2014.04.02

法律狀態類型:

發明專利申請公布后的駁回|||實質審查的生效|||公開

摘要

本發明公開了一種圖像翻譯系統及圖像翻譯方法。首先通過文字識別技術對文本圖像中的文字進行識別,然后再利用語言檢測技術對識別出的文字進行語言檢測,緊接著再利用地理信息等輔助信息進一步優化語言檢測的結果從而確定文本圖像的源語言。最后再通過機器翻譯技術將文本翻譯成目標語言。而整個過程中,用戶僅僅需要將文本圖像輸入到系統中,即可以得到最終的翻譯結果和文本圖像本身的源語言信息。

權利要求書

權利要求書
1.  一種圖像翻譯系統,其特征在于,包括:
圖像獲取模塊,獲取包含待翻譯內容的圖像;
文字識別模塊,對待翻譯內容進行文字識別;
定位模塊,確定圖像翻譯系統所在的位置;
語言識別模塊,根據所述定位模塊所確定的圖像翻譯系統所在的位置信息,對待翻譯內容的源語言進行識別;
翻譯模塊,將待翻譯的內容由源語言翻譯成目標語言。

2.  根據權利要求1所述的圖像翻譯系統,其特征在于,所述圖像翻譯系統基于移動數據通信終端平臺。

3.  根據權利要求1所述的圖像翻譯系統,其特征在于,所述圖像獲取模塊包括攝像頭或者掃描設備,對包含待翻譯內容進行拍照或掃描以獲取包含翻譯內容的圖像。

4.  一種采用如權利要求1-3中任意一項所述的圖像翻譯系統實現的圖像翻譯方法,其特征在于,包括以下步驟:
第一步,獲取包含待翻譯內容的圖像;
第二步,對待翻譯內容的源語言以及待翻譯內容的文字進行識別,根據所述圖像翻譯系統所在的位置信息,以該位置的常用語言作為待翻譯內容的源語言或者源語言的優先選擇語言;
第三步,將待翻譯的內容由源語言翻譯成目標語言。

5.  根據權利要求4所述的圖像翻譯方法,其特征在于,所述第一步中采用對待翻譯內容進行拍攝的方式獲取包含待翻譯內容的圖像。

6.  根據權利要求4所述的圖像翻譯方法,其特征在于,所述第一步之后,對待翻譯內容在所獲取的圖像中進行選定,之后第二步中對圖像中選中部分內容進行文字識別。

7.  根據權利要求4所述的圖像翻譯方法,其特征在于,所述第二步中,先對待翻譯內容的文字進行識別,根據文字識別結果識別待翻譯內容的源語言,如果源語言的識別結果為多個,再根據所述圖像翻譯系統所在的位置信息,如果該位置的常用語言在多個識別結果之中,則將該常用語言作為待翻譯內容的源語言或者源語言的優先選擇語言。

8.  根據權利要求4所述的圖像翻譯方法,其特征在于,所述第二步中,根據所述圖像翻譯系統所在的位置信息,確定該位置的常用語言,如果該位置的常用語言為多個,再根據對待翻譯內容的文字識別的結果在該多個常用語言中識別待翻譯內容的源語言或者源語言的優先選擇語言。

9.  根據權利要求4-8中任意一項所述的圖像翻譯方法,其特征在于,如果所述源語言或者源語言的優先選擇語言為多個,在多個源語言或者源語言的優先選擇語言之中包含有用戶在以前選擇過的源語言,則將該選擇過的源語言作為待翻譯內容的源語言或者源語言的優先選擇語言。

10.  根據權利要求9所述的圖像翻譯方法,其特征在于,如果存在多個以前選擇過的源語言,則將以前選擇次數最多的源語言作為待翻譯內容的源語言或者源語言的優先選擇語言。

11.  根據權利要求9所述的圖像翻譯方法,其特征在于,如果存在多個以前選擇過的源語言,則將以前翻譯內容最多的源語言作為待翻譯內容的源語言或者源語言的優先選擇語言。

說明書

說明書圖像翻譯系統及圖像翻譯方法
技術領域
本發明涉及一種翻譯系統,尤其是一種圖像翻譯系統。本發明還涉及一種圖像翻譯方法。
背景技術
隨著電腦的普及,翻譯工作已經越來越多的由電腦取代人工來完成。雖然翻譯結果目前還不能稱為完美,但是翻譯質量已經在明顯的逐步提高。
最為傳統的機器翻譯方法需要用戶以文本輸入待翻譯的內容,之后用戶可設定將該部分內容由哪種源語言翻譯成哪種目標語言,然后電腦根據用戶的設定對待翻譯的文本進行翻譯并顯示翻譯結果。
近來,隨著智能手機的普及以及文字識別技術的提高,已經有人發明了更加便捷的及其翻譯方法,如公開號為CN101339617A的中國發明專利公開文本中,公開了拍照后對拍照內容進行文字識別,然后進行翻譯的技術方案。
現有主流的文字識別技術提供商已經能做到對全球50多種語言的文字識別率做到95%以上,對于一些主要語言,如中文,英文,法文,德文等,文字識別率可以做到98%以上。
隨著全球化的不斷深入,出國旅游和接觸外文文檔已經越來越普遍,因此對文本翻譯的需求也越來越強烈。目前的文本翻譯系統主要是基于兩種方式,一種是需要用戶手動輸入文字進行翻譯,另外一種就是通過利用智能手機,平板電腦等帶攝像頭的設備對文字進行拍照形成文本圖像,然后再對文本圖像進行識別和翻譯。顯然,依賴用戶手動輸入文本的方式由于其繁瑣的輸入方式已經越來越不能滿足用戶的需求了。另外一方面,目前的基于文本圖像的文字識別和翻譯系統有一個非常明顯的缺點就是需要用戶手動的選擇文本圖像本身的源語言。如果用戶需要翻譯不同語言的文本圖像,就需要不斷的對文本圖像源語言進行切換,這種操作會是非常繁瑣和不便的。更甚至于,如果用戶不知道文本圖像本身的源語言,那么翻譯系統就沒法工作了。
發明內容
本發明所要解決的技術問題是提供一種圖像翻譯系統,以及采用這種圖像翻譯系統實現的圖像翻譯方法,使得用戶可以以一種更加便捷自然的交互方式獲取文本圖像的翻譯結果,避免頻繁的切換文本圖像源語言的繁瑣操作,同時也避免當無法獲知文本圖像源語言時,無法進行翻譯的情況,大大提升基于文本圖像的翻譯系統的用戶體驗。
為解決上述技術問題,本發明圖像翻譯系統的技術方案是,包括:
圖像獲取模塊,獲取包含待翻譯內容的圖像;
文字識別模塊,對待翻譯內容進行文字識別;
定位模塊,確定圖像翻譯系統所在的位置;
語言識別模塊,根據所述定位模塊所確定的圖像翻譯系統所在的位置信息,對待翻譯內容的源語言進行識別;
翻譯模塊,將待翻譯的內容由源語言翻譯成目標語言。
本發明還公開了一種采用上述圖像翻譯系統實現的圖像翻譯方法,其技術方案是,包括以下步驟:
第一步,獲取包含待翻譯內容的圖像;
第二步,對待翻譯內容的源語言以及待翻譯內容的文字進行識別,根據所述圖像翻譯系統所在的位置信息,以該位置的常用語言作為待翻譯內容的源語言或者源語言的優先選擇語言;
第三步,將待翻譯的內容由源語言翻譯成目標語言。
本發明通過將文字識別技術與自動語言檢測技術相結合,對文本圖像的語言類型進行自動檢測,從而實現了一種無需設定源語言的文本圖像的自動翻譯系統,一方面簡化了操作流程,使得操作更加便捷和自然,另一方面在需要對多種不同語言的文本圖像進行翻譯時候,可以避免繁瑣的不斷切換文本圖像的源語言就是的操作。與此同時也解決了如果用戶錯誤的選擇了文本圖像的源語言或者根本不清楚文本圖像的源語言就會造成翻譯錯誤或者無法翻譯的問題,極大的方便了用戶。
附圖說明
下面結合附圖和實施例對本發明作進一步詳細的說明:
圖1為本發明圖像翻譯系統的示意圖;
圖2為本發明一個實施例的流程圖。
具體實施方式
本發明公開了一種圖像翻譯系統,包括:
圖像獲取模塊,獲取包含待翻譯內容的圖像;
文字識別模塊,對待翻譯內容進行文字識別;
定位模塊,確定圖像翻譯系統所在的位置;
語言識別模塊,根據所述定位模塊所確定的圖像翻譯系統所在的位置信息,對待翻譯內容的源語言進行識別;
翻譯模塊,將待翻譯的內容由源語言翻譯成目標語言。
所述圖像翻譯系統基于移動數據通信終端平臺,如圖1所示,例如基于計算機系統的手機,尤其是智能手機,還有平板電腦等。
所述圖像獲取模塊包括攝像頭或者掃描設備,對包含待翻譯內容進行拍照或掃描以獲取包含翻譯內容的圖像。
本發明還公開了一種采用上述圖像翻譯系統實現的圖像翻譯方法,包括以下步驟:
第一步,獲取包含待翻譯內容的圖像;
第二步,對待翻譯內容的源語言以及待翻譯內容的文字進行識別,根據所述圖像翻譯系統所在的位置信息,以該位置的常用語言作為待翻譯內容的源語言或者源語言的優先選擇語言;用戶可以對包括源語言的優先選擇語言的多個語言進行選擇,以確認最終選定的源語言;所述常用語言可以是該地方的官方語言,也可以是該地方被普遍使用的其它語言。
第三步,將待翻譯的內容由源語言翻譯成目標語言。
所述第一步中采用對待翻譯內容進行拍攝的方式獲取包含待翻譯內容的圖像。
所述第一步之后,對待翻譯內容在所獲取的圖像中進行選定,之后第二步中對圖像中選中部分內容進行文字識別。
所述第二步中,所述第二步中,先對待翻譯內容的文字進行識別,根據文字識別結果識別待翻譯內容的源語言,如果源語言的識別結果為多個,再根據所述圖像翻譯系統所在的位置信息,如果該位置的常用語言在多個識別結果之中,則將該常用語言作為待翻譯內容的源語言或者源語言的優先選擇語言。例如,對于不同語言的相同單詞,僅僅是文字識別無法判定其具體是哪個語言。而本實施例中根據圖像翻譯系統所在的位置信息,就可以判定或優先判定該單詞更可能是哪個語言,畢竟用戶在某地接觸該地的常用語言的概率更大。
或者,所述第二步中,根據所述圖像翻譯系統所在的位置信息,確定該位置的常用語言,如果該位置的常用語言為多個,再根據對待翻譯內容的文字識別的結果在該多個常用語言中識別待翻譯內容的源語言或者源語言的優先選擇語言。有的地方會有多種常用語言,因此僅憑地理位置判斷語言可能會有多個結果。在采用地理位置判斷該地的常用語言之后,還可根據文字識別結果在多個常用語言的范圍之內做出選擇。例如,在香港,中文和英文都是當地的常用語言,在本實施例中的圖像翻譯系統識別到地理位置信息顯示香港之后,確定語言的選擇范圍可能在中文和英文之中而可能不包括日文、韓文、法文、德文等語言,再根據文字識別的結果具體是中文字符還是英文字符,來確定待翻譯內容的源語言或者源語言的優先選擇語言,從而大大提高了語言識別的準確率。
如果所述源語言或者源語言的優先選擇語言為多個,在多個源語言或者源語言的優先選擇語言之中包含有用戶在以前選擇過的源語言,則將該選擇過的源語言作為待翻譯內容的源語言或者源語言的優先選擇語言。
如果存在多個以前選擇過的源語言,則將以前選擇次數最多的源語言作為待翻譯內容的源語言或者源語言的優先選擇語言。
或者,如果存在多個以前選擇過的源語言,則將以前翻譯內容最多的源語言作為待翻譯內容的源語言或者源語言的優先選擇語言。
如果是作為待翻譯內容的源語言,則系統可直接對這些內容進行翻譯;如果是作為源語言的優先選擇語言,還需要經過用戶的選擇進行最終的確認。在用戶的選擇過程中,會提示用戶該優先選擇源語言的內容,以便于用戶的選擇。
全球化的浪潮正在席卷世界的每一個角落,幾乎所有的國家的人民都獲得了比以前多得多的出國的機會,而接觸到外國人和外文文檔幾乎是一件非常稀松平常的事情。然而由于語言和文字的隔閡,對很多人來說完全無障礙的閱讀外文文字還是一件比較困難的事情。因此一種基于文本圖像的翻譯系統有著非常廣泛的應用前景。
但是,目前商用的基于文本圖像的翻譯系統均不夠智能化,需要人手動的選擇文本圖像的源語言。當需要對多種不同語言的文本圖像進行翻譯時,不斷切換文本圖像的源語言是一種非常繁瑣的操作。更有甚者,如果用戶錯誤的選擇了文本圖像的源語言或者根本不清楚文本圖像的源語言,就會造成翻譯錯誤或者無法翻譯的情況。
因此,通過本發明提供的技術方案,省去了用戶手動輸入文本圖像源語言的步驟,使得整個系統更加智能,用戶的操作也更加便捷和自然。與此同時,也可以解決用戶誤輸入或者不知道文本圖像源語言的情況下,導致翻譯錯誤或者無法翻譯的問題。
本發明可以有效的提升用戶獲取外文信息的效率,有利于與其他國家的人進行更便捷的交流,從而進一步對多個國民經濟行業以及加快融入全球化帶來顯著的信息流動和價值提升,具有巨大的潛在價值和影響。
圖2所示為本發明的一個實施例,如圖2所示:
步驟101:用戶選擇需要翻譯的目標語言。
步驟102:用戶利用手機攝像頭拍攝文本,獲取文本圖像
步驟103:用戶手動選擇需要翻譯的文本在文本圖像中的區域。該文本可以是整幅文本圖像中的某一個或幾個特定的單詞,也可以是特定的一句話,或者是一個文本塊乃至整個文本圖像。
所述步驟101至步驟103只是一個常用的獲取所需的文本圖像的人機交互技術,已經廣泛的應用于各種手機軟件中,在此不作贅述。
步驟201:接受來自用戶輸入模塊中用戶選定的需要翻譯的文本區域圖像。
步驟202:利用文字識別技術對文本區域內的文字圖像進行識別,獲取識別后的文字。
步驟203:根據文字識別技術得到的識別結果,判斷識別結果是否可信。如可信,進入步驟204。如果不可信,返回“無法識別,請重新拍攝”的信息。
步驟204:利用語言自動檢測技術對識別出來的文字的語言進行自動檢測,獲取該文字可能的語言類型列表,以及每種語言對應的置信度。如果自動語言檢測的結果只有一種確定的語言,則進入文本翻譯模塊中的步驟401。如果語言自動檢測的結果存在多種可能的語言候選,則進入輔助信息獲取及語言檢測優化模塊中的步驟301。
所述步驟202和步驟203均涉及到文字識別相關的技術。步驟202是利用文字識別技術對文本區域內的文字圖像進行識別,獲取識別后的文字和識別結果的置信度。而步驟203則是根據步驟202得到的識別后的文字及置信度來判斷識別結果是否可信。如果識別結果很可信,進入步驟204。如果不可信,返回“無法識別,請重新拍攝”的信息。一般而言,這文本圖像中的文字識別對整個系統至關重要,需要非常高的識別率。另外,由于并不清楚文本的語言,因此,該文字識別技術需要在不知道文字語言的情況下,將文字正確的識別出來,并且給出識別結果的置信度。這兩個步驟涉及到的文字識別相關的技術均已經比較成熟,已經在很多產品和解決方案中商用。
所述步驟204是利用語言自動檢測技術對通過步驟202和步驟203得到的識別出來的文字進行語言自動檢測,獲取該文字可能的語言類型。由于用戶選擇的文字區域中的文字的形式是多樣的,可能是僅僅是一個或者若干個單詞,也可能是一個句子,甚至有可能是一個文本塊或者整個文本圖像。因此語言檢測的結果可能會出現如下兩種情況:
情況1:語言自動檢測技術的輸出結果僅僅有一種確定的語言。這種情況一般出現在用戶選擇的是一個文本塊或者整個文本圖像的情況。在這種情況下,由于文字信息較多,可以很準確的檢測出文本圖像的語言。當確定了文本圖像的源語言后,轉到步驟401。
情況2:語言自動檢測技術按照置信度的大小輸出了若干個可能的語言候選。這種情況一般出現在用戶選擇的僅僅是一個或者若干個單詞的情況。由于在西文中,存在很多單詞在多種不同的語言中均是合法的現象,例如單詞devoir既屬于英語也屬于法語。另外一方面,在日文和韓文文本中也會有中文字符的出現。因此僅僅只有一個或者若干個單詞信息,語言檢測技術很可能會得到若干個可能的語言候選。在這種情況下,則轉入步驟301,利用其他輔助信息對語言檢測的結果進行優化。
步驟301:通過智能手機系統中與地理位置相關的API(如GPS,蜂窩網信號,WIFI等)獲取用戶所在的位置信息,精確到國家和城市即可。
步驟302:檢查是否可以獲得步驟406中用戶反饋數據庫中的數據,如果用戶反饋數據庫尚未創建或者無法獲取信息,則轉到步驟303。否則記錄用戶的反饋信息。
步驟303:根據步驟204中獲取的文字的源語言類型極其置信度信息,并結合步驟301和步驟302中的信息,對檢測到的文字語言類型的結果進行優化,輸出最終檢測到的文本圖像的源語言類型。
所述步驟301是指通過只能手機系統中的一些獲取地理位置的API,來獲取用戶的當前位置, 只需要精確到國家和省(州)即可。在目前常見的智能手機系統中,獲取位置信息已經是一項非常成熟的技術,廣泛的應用于各種不同的軟件中。因此,在這里就不詳述其技術原理。另外,由于位置信息僅僅需要精確到國家和省(州)即可,因此也不存在侵犯和泄露用戶隱私的問題。另外,如果用戶有特別需要,例如在歐洲的一些袖珍國家,整個國家的面積可能也不及其它國家的一個省(州)大,因此也可以使得手機定位更加精確,從而獲取準確的當地語言。
所述步驟302是獲取步驟406生成的用戶反饋數據庫中的數據。步驟406中生成的用戶反饋數據庫中主要記錄了用戶在之前使用該系統的的操作過程。通過該數據庫,系統可以獲取用戶之前使用該系統時,每一次翻譯的時間,內容以及文本的源語言。
所述步驟303是利用步驟204,301和302中所獲得的信息,對文本圖像的語言檢測的結果進行優化。步驟204可以獲得文本圖像可能的源語言以及每種可能語言對應的置信度。而步驟301可以獲取用戶當前的位置,步驟302可以獲取用戶之前的翻譯內容。利用這些信息,可以對檢測到的當前文本圖像的語言進行優化。具體方法如下:
假設,用戶所在國家和省(州)使用的語言集為A,從用戶反饋數據庫中獲知的用戶在某一個時間段(例如當前時間之前6小時)內翻譯的文本圖像的語言集為B。注意,由于某一個地方的常用語言可能有多重,因此語言集A中可能包含了多種語言。同樣的道理,用戶可能之前翻譯了多種語言的文本, 也可能在該時間段內沒有使用系統做任何翻譯,因此語言集B可能存在多種語言,也可能不存在任何語言。同時步驟204通過自動語言檢測技術獲得的當前文本圖像可能的語言類型集C。注意,語言C中至少包含一種語言,也可能包含多種語言。假設語言集d為語言集A,B,C的交集,注意如果不存在任何一種語言同時存在于語言集A,B,C中,那么語言集d為空集。后面的定義類似。假設語言集e為語言集A與語言集C的交集,假設語言集f為語言集B與C的交集,語言集g為語言集A與B的交集,則文本圖像的語言優化策略如下:
規則1)如果語言集d不為空集,且僅有一種語言,那么將該語言確定為當前文本圖像的語言類型,轉到步驟401。
規則2)如果語言集d不為空集,且存在多種語言,那么將語言集d中的語言作為候選語言。由于語言集d中的語言必然存在于語言集C中,因此接著查找這些候選語言在語言集C中對應的置信度,取置信度最高的語言確定為當前文本圖像的語言類型,轉到步驟401。
規則3)如果語言集d為空集,且語言集e不為空集。如果語言集e中僅有一種語言,則將該語言確定為當前文本圖像的語言類型,轉到步驟401。
規則4)如果語言集d為空集,且語言集e不為空集。如果語言集e中存在多種語言,那么將語言集e中的語言作為候選語言。由于語言集e中的語言必然存在于語言集C中,因此接著查找這些候選語言在語言集C中對應的置信度,取置信度最高的語言確定為當前文本圖像的語言類型,轉到步驟401。
規則5)如果語言集d與語言集e均為空集,語言集f不為空集,且語言集f中僅有一種語言,則將該語言確定為當前文本圖像的語言類型,轉到步驟401。
規則6)如果語言集d與語言集e均為空集,語言集f不為空集,且語言集f中存在多種語言,那么將語言集f中的語言作為候選語言。由于語言集f中的語言必然存在于語言集C中,因此接著查找這些候選語言在語言集C中對應的置信度,取置信度最高的語言確定為當前文本圖像的語言類型,轉到步驟401。
規則7)如果語言集d,e,f均為空集,語言集g不為空集,且語言集g中僅有一種語言,則將該語言確定為當前文本圖像的語言類型,轉到步驟401。
規則8)如果語言集d,e,f均為空集,語言集g不為空集,且語言集g中存在多種語言,那么將語言集g中的語言作為候選語言。接著利用用戶之前的翻譯記錄,查找候選語言中,翻譯內容最多的語言確定為當前文本圖像的語言類型,轉到步驟401。
規則9)如果語言集d,e,f,g均為空集,則直接將步驟204檢測到的多種可能的語言以及每種語言的置信度均記錄下來,轉入步驟401。
步驟401:接收來自前面兩個模塊中獲取的文本圖像的文字信息和檢測到的語言類型信息
步驟402:根據機器翻譯技術和自動檢測出來的語言類型將文本圖像中的文字信息翻譯成目標語言。
步驟403: 針對檢測出多種可能的源語言類型,對相同的翻譯結果進行整合。
步驟404:在手機界面上展示翻譯結果和自動檢測到的文本圖像的語言類型
步驟405:用戶對展示的翻譯結果進行確認和修改
步驟406:記錄用戶的確認和修改操作的時間和操作內容,創建和更新用戶反饋數據庫。
步驟407:結束
所述步驟401和步驟402是利用機器翻譯技術對識別得到的文字和檢測到的文本圖像的語言信息進行處理,得到最終的翻譯文本。由于自動語言檢測和輔助信息優化后得到的文本圖像的語言類型可能只有一種,也可能存在多種可能的語言。因此這一步需要分以下兩種情況來處理:
情況1: 當自動檢測出來的源語言類型僅有一種,則可以直接通過機器學習技術將識別出的文字從源語言翻譯成需要的目標語言,然后進入步驟404;
情況2: 如果自動檢測出文本圖像的源語言類型存在多種,則根據不同的源語言類型,進行識別出來的文本進行多次翻譯,并記錄每一種翻譯及其對應的源語言的類型,進入步驟403。
所述步驟403是指當由于檢測出多種可能的源語言類型而導致的翻譯結果存在多種時,對相同的翻譯結果進行整合。雖然有些單詞或者文字可能在多種語言中均合法,但是將其翻譯成某種特定的目標語言后,其含義是一樣的。例如西文中的“social”一詞,它既是英語單詞,同時也是西班牙語單詞,但是無論將其當作哪種語言,其翻譯成中文后的意思是一樣的,都是“社會的”的意思。因此會出現多種翻譯結果中,語言類型不同,但是其翻譯內容是一致的情況。對于這種情況,系統將相同的翻譯結果進行整合,即根據檢測到的語言類型的置信度,選擇置信度最高的檢測語言作為檢測到的語言類型,同時將多種相同的翻譯結果整合成一種。
所述步驟404是系統將翻譯的結果和檢測出來的文本圖像的語言類型展示到手機屏幕上。如果翻譯結果只有一個,則直接在手機屏幕上展示翻譯結果和檢測到的文本圖像的語言類型。如果翻譯結果含有多個,則將多種翻譯結果均顯示到手機屏幕上供用戶選擇,顯示的順序是根據翻譯結果的置信度進行降序排序得到的。
所述步驟405是用戶對展示的結果進行確認和修改。從而獲得最終確定的翻譯結果。根據文字識別、源語言檢測和翻譯的結果的不同形式,這一步驟需要分成如下幾種情況進行處理:
情況1: 文字識別結果、源語言檢測結果僅有一種,且是正確的,用戶只需對翻譯結果進行確認。
情況2: 文字識別結果錯誤,則對文字識別結果進行手動修改,同時系統自動返回步驟204, 針對新的文字內容自動進行重新的語言檢測和翻譯。
情況3: 文字識別正確,源語言類型存在多種,且正確的源語言類型在候選列表中,則用戶選擇正確的源語言類型并對翻譯結果進行確認即可。
情況4:文字識別正確,源語言類型判斷錯誤,則修改源語言類型,系統自動根據用戶選擇的源語言類型,自動返回步驟402重新進行翻譯,以獲得正確的翻譯結果,然后用戶再對新的正確的翻譯結果進行確認。
所述步驟406記錄用戶的確認和修改操作的時間和操作內容,創建和更新用戶反饋數據庫。當用戶在步驟405對翻譯結果進行確認和修改時,系統會記錄用戶的操作時間和操作內容。當用戶反饋數據庫不存在時,則創建一個新的用戶反饋數據庫存儲用戶當前確認操作的內容和時間。如果用戶反饋數據庫已經存在,則對該數據庫進行更新。
綜上所述,本發明提出了一種無需設定源語言的文本圖像自動翻譯系統。首先通過文字識別技術對文本圖像中的文字進行識別,然后再利用語言檢測技術對識別出的文字進行語言檢測,緊接著再利用其他輔助信息進一步優化語言檢測的結果從而確定文本圖像的源語言。最后再通過機器翻譯技術將文本翻譯成目標語言。而整個過程中,用戶僅僅需要將文本圖像輸入到系統中,即可以得到最終的翻譯結果和文本圖像本身的源語言信息。
以上所述僅為本發明的較佳實施例而已,并非用以限定本發明的實質技術內容范圍,本發明的實質技術內容是廣義的定義于申請的權利要求范圍中,任何他人完成的技術實體或方法,若是與申請的權利要求范圍所定義的完全相同,也或是一種等效的變更,均將被視為涵蓋于該權利要求范圍之中。

關于本文
本文標題:圖像翻譯系統及圖像翻譯方法.pdf
鏈接地址:http://www.pqsozv.live/p-6180862.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
钻石光影