• / 8
  • 下載費用:30 金幣  

用于稿件中的職務信息的檢查方法和裝置.pdf

關 鍵 詞:
用于 稿件 中的 職務 信息 檢查 方法 裝置
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
摘要
申請專利號:

CN201210335592.3

申請日:

2012.09.11

公開號:

CN103678353A

公開日:

2014.03.26

當前法律狀態:

授權

有效性:

有權

法律詳情: 授權|||實質審查的生效IPC(主分類):G06F 17/30申請日:20120911|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 北京大學; 北大方正集團有限公司; 北京北大方正電子有限公司
發明人: 周志揚; 朱建波
地址: 100871 北京市海淀區頤和園路5號
優先權:
專利代理機構: 北京英賽嘉華知識產權代理有限責任公司 11204 代理人: 王達佐
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201210335592.3

授權公告號:

103678353B||||||

法律狀態公告日:

2017.06.20|||2014.05.14|||2014.03.26

法律狀態類型:

授權|||實質審查的生效|||公開

摘要

本發明提供了一種用于稿件中的職務信息的檢查方法,包括:利用人名數據庫對稿件進行全文檢索,以確定稿件中的人名;以確定的人名檢索職務數據庫,以確定人名所關聯的職務;利用確定的職務判斷人名在稿件中的相關信息是否正確。本發明還提供了一種用于稿件中的職務信息的檢查裝置,包括:人名模塊,用于利用人名數據庫對稿件進行全文檢索,以確定稿件中的人名;職務模塊,用于以確定的人名檢索職務數據庫,以確定人名所關聯的職務;判斷模塊,用于利用確定的職務判斷人名在稿件中的相關信息是否正確。本發明提高了稿件質量。

權利要求書

權利要求書
1.  一種用于稿件中的職務信息的檢查方法,其特征在于,包括:
利用人名數據庫對稿件進行全文檢索,以確定所述稿件中的人名;
以確定的所述人名檢索職務數據庫,以確定所述人名所關聯的職務;
利用確定的所述職務判斷所述人名在所述稿件中的相關信息是否正確。

2.  根據權利要求1所述的方法,其特征在于,還包括:預先創建所述人名數據庫,其中包括多條記錄,所述各條記錄包括用于記載人名的字段;其中,利用人名數據庫對稿件進行全文檢索包括:
將所述各條記錄中記載的人名與所述稿件的全文進行匹配;
如果在所述稿件中匹配到與所述記錄中記載的人名相同的詞,則將所述匹配到的詞確定為所述稿件中的人名。

3.  根據權利要求1所述的方法,其特征在于,還包括:預先創建所述職務數據庫,其中包括多條記錄,所述各條記錄包括用于記載人名的第一字段和用于記載職務的第二字段;其中,以確定的所述人名檢索職務數據庫包括:
將確定的所述人名匹配所述各條記錄;
如果在所述記錄的所述第一字段中匹配到所述人名,則提取當前所述記錄中的第二字段中的職務;
將所述提取的職務確定為所述人名所關聯的職務。

4.  根據權利要求1所述的方法,其特征在于,利用確定的所述職務判斷所述人名在所述稿件中的相關信息是否正確包括:
提取所述人名在所述稿件中相鄰的詞;
判斷所述相鄰的詞是否為職務;
如果所述相鄰的詞是職務,則確定所述相鄰的詞是否匹配以所述職務數據庫確定的職務;
如果不匹配,則標注所述相鄰的詞。

5.  根據權利要求1所述的方法,其特征在于,預先創建所述職務數據庫,其中包括多條記錄,所述各條記錄包括:用于記載人名的第一字段、用于記載職務的第二字段;以及用于記載所述職務的索引的第三字段,所述索引的大小與所述職務的級別線性相關;其中,以確定的所述人名檢索職務數據庫,在確定所述人名所關聯的職務的同時,還確定所述所關聯的職務的索引。

6.  根據權利要求5所述的方法,其特征在于,利用確定的所述職務判斷所述人名在所述稿件中的相關信息是否正確包括:
確定所述稿件中為并列關系的所述人名;
判斷所述并列的人名的所述索引在所述并列關系中的先后排序是否符合所述人名所關聯的職級為從高到低;
如果不符合,則標注所述并列的人名。

7.  根據權利要求6所述的方法,其特征在于,所述并列關系為以下模式:
職務1、職務2......職務m1人名1、職務1、職務2......職務m2人名2、......、職務1、職務2......職務mn人名n,
其中,n為大于等于2的自然數;m1、m2、......、mn均為非負整數,職務可有可無。

8.  根據權利要求7所述的方法,其特征在于,確定所述稿件中為并列關系的所述人名包括:
A)判斷當前的所述人名在所述稿件中上文相鄰的詞;
B)如果無詞或者詞不是職務,則確定所述當前人名之前無并列的人名,結束所述當前人名的并列關系的判斷;
C)如果詞是標點符號或詞是職務,則對在上文相鄰的字符循環執行步驟B和C;
D)如果詞是人名,則將所述判斷得到的人名加入所述并列關系,并以所述判斷得到的人名作為當前的所述人名循環執行上述判斷并列關系的步驟。

9.  一種用于稿件中的職務信息的檢查裝置,其特征在于,包括:人名模塊,用于利用人名數據庫對稿件進行全文檢索,以確定所述稿件中的人名;
職務模塊,用于以確定的所述人名檢索職務數據庫,以確定所述人名所關聯的職務;
判斷模塊,用于利用確定的所述職務判斷所述人名在所述稿件中的相關信息是否正確。

10.  根據權利要求9所述的裝置,其特征在于,所述判斷模塊包括:提取模塊,用于提取所述人名在所述稿件中相鄰的詞;
職務判斷模塊,用于判斷所述相鄰的詞是否為職務;
匹配模塊,用于如果所述相鄰的詞是職務,則確定所述相鄰的詞是否匹配以所述職務數據庫確定的職務;
標注模塊,用于如果不匹配,則標注所述相鄰的詞。

11.  根據權利要求9所述的裝置,其特征在于,預先創建所述職務數據庫,其中包括多條記錄,所述各條記錄包括:用于記載人名的第一字段、用于記載職務的第二字段;以及用于記載所述職務的索引的第三字段,所述索引的大小與所述職務的級別線性相關;其中,所述職務在確定所述人名所關聯的職務的同時,還確定所述所關聯的職務的索引,所述判斷模塊包括:
并列模塊,用于確定所述稿件中為并列關系的所述人名;
排序模塊,用于判斷所述并列的人名的所述索引在所述并列關系中的先后排序是否符合所述人名所關聯的職級為從高到低;
標注模塊,用于如果不符合,則標注所述并列的人名。

說明書

說明書用于稿件中的職務信息的檢查方法和裝置
技術領域
本發明涉及信息處理領域,具體而言,涉及一種用于稿件中的職務信息的檢查方法和裝置。
背景技術
稿件中經常出現人名及其職務信息,在稿件的編輯過程中要求該人名的職務信息,并且當多個人名并列出現時,應當按照其職務的排序將這些人名進行排序。
目前稿件職務校對的工作可以采取人工校對方法,一般包括以下步驟:
(1)從采編系統中打印需要校對的稿件。
(2)人工閱讀該紙面稿件,遇到有疑問的領導人職務,手動去查找相關的職務信息,或者咨詢經驗豐富的校對人員。
(3)對錯誤的職務進行手工批注修改。
(4)手動把修改的內容錄入到采編系統中。
人工校對的校對過程過多地依賴校對人員的知識經驗,容易出現失誤,導致報紙出現錯誤的職務信息,影響出版物的質量。
發明內容
本發明旨在提供一種用于稿件中的職務信息的檢查方法和裝置,以取代人工校對稿件中的人名信息。
根據本發明的一個方面,提供了一種用于稿件中的職務信息的檢查方法,包括:利用人名數據庫對稿件進行全文檢索,以確定稿件中的人名;以確定的人名檢索職務數據庫,以確定人名所關聯的職務;利用確定的職務判斷人名在稿件中的相關信息是否正確。
根據本發明的另一方面,提供了一種用于稿件中的職務信息的檢查裝置,包括:人名模塊,用于利用人名數據庫對稿件進行全文檢索,以確定稿件中的人名;職務模塊,用于以確定的人名檢索職務數據庫,以確定人名所關聯的職務;判斷模塊,用于利用確定的職務判斷人名在稿件中的相關信息是否正確。
本發明的用于稿件中的職務信息的檢查方法和裝置因為采用數據庫來檢查人名信息,所以克服了人工校對的失誤問題,進而提高了稿件質量。
附圖說明
此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中:
圖1示出了根據本發明實施例的用于稿件中的職務信息的檢查方法的流程圖;
圖2示出了根據本發明實施例的用于稿件中的職務信息的檢查裝置的示意圖。
具體實施方式
下面將參考附圖并結合實施例,來詳細說明本發明。
圖1示出了根據本發明實施例的用于稿件中的職務信息的檢查方法的流程圖,包括:
步驟S10,利用人名數據庫對稿件進行全文檢索,以確定稿件中的人名;
步驟S20,以確定的人名檢索職務數據庫,以確定人名所關聯的職務;
步驟S30,利用確定的職務判斷人名在稿件中的相關信息是否正確。
現有技術中通過人工校對來檢查稿件中的人名職務信息,而本實施例中,利用人名數據庫和職務數據庫來分析稿件中的人名職務信息,從而整個過程實現了軟件自動化,所以克服了人工校對的失誤問題,進而提高了稿件質量。
優選地,本檢查方法還包括:預先創建人名數據庫,其中包括多條記錄,各條記錄包括用于記載人名的字段;其中,利用人名數據庫對稿件進行全文檢索包括:將各條記錄中記載的人名與稿件的全文進行匹配;如果在稿件中匹配到與記錄中記載的人名相同的詞,則將匹配到的詞確定為稿件中的人名。本實施例的人名數據庫方案比較簡單,容易實現。通過對人名數據庫的維護,還可以實現人名數據庫的動態更新。需要說明的是,本文中的詞是指一個語言單位,可以是構成單詞的一個字符,也可以是構成單詞的多個字符,而且字符可以是標點,也可以是文字。
優選地,本檢查方法還包括:預先創建職務數據庫,其中包括多條記錄,各條記錄包括用于記載人名的第一字段和用于記載職務的第二字段;其中,以確定的人名檢索職務數據庫包括:將確定的人名匹配各條記錄;如果在記錄的第一字段中匹配到人名,則提取當前記錄中的第二字段中的職務;將提取的職務確定為人名所關聯的職務。本實施例的職務數據庫方案比較簡單,容易實現。通過對職務數據庫的維護,還可以實現職務數據庫的動態更新。例如,校對人員如果發現職務數據庫中的職務信息有誤,可以手動修改職務數據庫中的相關字段。
優選地,步驟S30包括:
提取人名在稿件中相鄰的詞;判斷相鄰的詞是否為職務;
如果相鄰的詞是職務,則確定相鄰的詞是否匹配以職務數據庫確定的職務;
如果不匹配,則標注相鄰的詞。
本實施例通過簡單的匹配操作,即可自動地判斷職務信息是否準確,顯著地節省了校對人員的工作量。例如稿件中的文字為“部長張三”,將“部長”與職務數據庫進行匹配,發現職務數據庫中的“張三”記錄的第二字段是“副部長”,即可自動地標注“部長張三”,例如顯示為紅字,從而提醒校對人員判斷稿件是否有誤。
優選地,預先創建職務數據庫,其中包括多條記錄,各條記錄包括:用于記載人名的第一字段、用于記載職務的第二字段;以及用于記載職務的索引的第三字段,索引的大小與職務的級別線性相關;其中,以確定的人名檢索職務數據庫,在確定人名所關聯的職務的同時,還確定所關聯的職務的索引。本優選實施例將職務的級別在職務數據庫中予以數字化,從而可以對職務自動檢查級別信息。
優選地,步驟S30包括:確定稿件中為并列關系的人名;判斷并列的人名的索引在并列關系中的先后排序是否符合人名所關聯的職級為從高到低;如果不符合,則標注并列的人名。因為職務的級別在職務數據庫中已經數字化,所以通過對索引的排序,即可確定稿件中的人名是否按照職務級別予以排序。例如稿件中的文字為“局長李四、部長張三、科長王五”,在職務數據庫中如果部長的索引是1、局長的索引是2、科長的索引是3,則上述文字得到的索引順序是“2、1、3”,不符合“1、2、3”的順序,本優選實施例可以自動地藍字標注“局長李四、部長張三、科長王五”,從而提醒校對人員這段文字的人名是否排序有誤。
優選地,并列關系為以下模式:職務1、職務2......職務ml人名1、職務1、職務2......職務m2人名2、......、職務1、職務2......職務mn人名n,其中,n為大于等于2的自然數;m1、m2、......、mn均為非負整數,職務可有可無。例如,可以有以下幾種:
1)領導人1
2)領導人1,領導人2
3)職務1領導人1
4)職務1,職務2領導人1
5)職務1,職務2領導人1,領導人2。
這包括了稿件中常見的人名次序。
優選地,確定稿件中為并列關系的人名包括:
A)判斷當前的人名在稿件中上文相鄰的詞;
B)如果無詞或者詞不是職務,則確定當前人名之前無并列的人名,結束當前人名的并列關系的判斷;
C)如果詞是標點符號或詞是職務,則對在上文相鄰的字符循環執行步驟B和C;
D)如果詞是人名,則將判斷得到的人名加入并列關系,并以判斷得到的人名作為當前的人名循環執行上述判斷并列關系的步驟。
上述過程是簡單的循環過程,很容易通過計算機變成來實現。
圖2示出了根據本發明實施例的用于稿件中的職務信息的檢查裝置的示意圖,包括:
人名模塊10,用于利用人名數據庫對稿件進行全文檢索,以確定稿件中的人名;
職務模塊20,用于以確定的人名檢索職務數據庫,以確定人名所關聯的職務;
判斷模塊30,用于利用確定的職務判斷人名在稿件中的相關信息是否正確。
本裝置克服了人名職務人工校對的失誤問題,進而提高了稿件質量。
優選地,判斷模塊30包括:提取模塊,用于提取人名在稿件中相鄰的詞;職務判斷模塊,用于判斷相鄰的詞是否為職務;匹配模塊,用于如果相鄰的詞是職務,則確定相鄰的詞是否匹配以職務數據庫確定的職務;標注模塊,用于如果不匹配,則標注相鄰的詞。
本實施例中,利用人名數據庫和職務數據庫來分析稿件中的人名職務信息,從而整個過程實現了軟件自動化,所以克服了人工校對的失誤問題,進而提高了稿件質量。
優選地,預先創建職務數據庫,其中包括多條記錄,各條記錄包括:用于記載人名的第一字段、用于記載職務的第二字段;以及用于記載職務的索引的第三字段,索引的大小與職務的級別線性相關;其中,職務在確定人名所關聯的職務的同時,還確定所關聯的職務的索引,判斷模塊30包括:并列模塊,用于確定稿件中為并列關系的人名;排序模塊,用于判斷并列的人名的索引在并列關系中的先后排序是否符合人名所關聯的職級為從高到低;標注模塊,用于如果不符合,則標注并列的人名。
網站、出版物等各種稿件中往往會涉及領導人,通常領導人名字前面會帶上領導人的職務。稿件中,領導人的職務錯誤或者排序混亂,會嚴重影響稿件的質量。從以上的描述中,可以看出,本發明實現了對稿件的人名職務信息的自動校對,從而提高了稿件質量。
顯然,本領域的技術人員應該明白,上述的本發明的各模塊或各步驟可以用通用的計算裝置來實現,它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網絡上,可選地,它們可以用計算裝置可執行的程序代碼來實現,從而,可以將它們存儲在存儲裝置中由計算裝置來執行,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現。這樣,本發明不限制于任何特定的硬件和軟件結合。
以上所述僅為本發明的優選實施例而已,并不用于限制本發明,對于本領域的技術人員來說,本發明可以有各種更改和變化。凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。

關于本文
本文標題:用于稿件中的職務信息的檢查方法和裝置.pdf
鏈接地址:http://www.pqsozv.live/p-6180797.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
钻石光影