• / 14
  • 下載費用:30 金幣  

一種范文檢索請求的處理方法和裝置.pdf

關 鍵 詞:
一種 范文 檢索 請求 處理 方法 裝置
  專利查詢網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
摘要
申請專利號:

CN201310685293.7

申請日:

2013.12.13

公開號:

CN103678601A

公開日:

2014.03.26

當前法律狀態:

駁回

有效性:

無權

法律詳情: 發明專利申請公布后的駁回IPC(主分類):G06F 17/30申請公布日:20140326|||實質審查的生效IPC(主分類):G06F 17/30申請日:20131213|||公開
IPC分類號: G06F17/30 主分類號: G06F17/30
申請人: 北京奇虎科技有限公司; 奇智軟件(北京)有限公司
發明人: 侯小虎
地址: 100088 北京市西城區新街口外大街28號D座112室(德勝園區)
優先權:
專利代理機構: 北京智匯東方知識產權代理事務所(普通合伙) 11391 代理人: 康正德;薛峰
PDF完整版下載: PDF下載
法律狀態
申請(專利)號:

CN201310685293.7

授權公告號:

||||||

法律狀態公告日:

2018.12.07|||2014.04.23|||2014.03.26

法律狀態類型:

發明專利申請公布后的駁回|||實質審查的生效|||公開

摘要

本發明提供了一種范文檢索請求的處理方法,包括:獲取用戶的檢索請求;根據請求內容的關鍵詞,判斷所述檢索請求是否是范文檢索請求;如果是,根據請求內容的關鍵詞,在范文網頁數據庫進行檢索;提取檢索到的與所述關鍵詞匹配的范文網頁數據項的關鍵項信息;將所述關鍵項信息以應用框結構嵌入檢索結果頁中。根據本發明提供的方法,使得真正與用戶所要求的范文字數相同、相近的范文網頁出現在搜索結果頁中,并且在搜索結果排序時排在搜索結果頁的前面,提高了范文搜索的質量。本發明提供了一種相應的處理裝置。

權利要求書

權利要求書
1.  一種范文檢索請求的處理方法,包括:
獲取用戶的檢索請求;
根據請求內容的關鍵詞,判斷所述檢索請求是否是范文檢索請求;
如果是,根據請求內容的關鍵詞,在范文網頁數據庫進行檢索;
提取檢索到的與所述關鍵詞匹配的范文網頁數據項的關鍵項信息;
將所述關鍵項信息以應用框結構嵌入檢索結果頁中。

2.  根據權利要求1所述的方法,其中所述范文網頁數據庫包括多個范文網頁數據項,一范文網頁數據項包括一范文網頁的范文類型、范文數據和URL,且所述范文數據包括范文標題,范文正文和范文字數;所述請求內容包括主題關鍵詞和字數關鍵詞;其中,
檢索步驟包括,在范文類型和/或范文標題和/或范文正文中匹配主題關鍵詞,并將字數關鍵詞與范文字數進行匹配;且
所述提取的關鍵項信息至少包括范文標題和范文字數。

3.  根據權利要求1或2所述的方法,其中一范文網頁數據項包括多個范文數據;其中,
檢索步驟包括,在該范文網頁數據項的多個范文數據中分別進行關鍵詞匹配;且
提取步驟包括,對于檢索到的與所述關鍵詞匹配的多個范文數據,提取匹配的多個范文數據中的范文標題和范文字數。

4.  根據權利要求1-3任一項所述的方法,其中所述范文網頁數據庫包括多個范文網頁數據項,一范文網頁數據項包括一范文網頁的范文類型、范文數據和URL;且所述范文數據包括范文標題,和范文文檔或范文文檔的下載鏈接;所述請求內容包括主題關鍵詞和字數關鍵詞;其中,
檢索步驟包括,在范文類型和/或范文標題中匹配主題關鍵詞;且
所述提取的關鍵項信息至少包括范文標題。

5.  根據權利要求1-4之任一所述的方法,其中
檢索步驟還包括,根據請求內容的關鍵詞,在基礎網頁庫進行檢索;其中所述基礎網頁庫包括由網絡爬蟲下載存儲到服務器側的網頁;并且
所述方法還包括,在檢索結果頁中合并在范文網頁數據庫檢索到的范文網頁和在基礎網頁庫檢索到的范文網頁,且前者在檢索結果頁的排序高于后者。

6.  根據權利要求1-5任一項所述的方法,其中對于檢索結果頁中在范文網頁數據庫檢索到的范文網頁,根據其范文字數與字數關鍵詞的匹配度由高到低進行排序。

7.  一種范文檢索請求的處理裝置,包括:
請求獲取單元,適于獲取用戶的檢索請求;
請求判斷單元,適于根據請求內容的關鍵詞,判斷所述檢索請求是否是范文檢索請求;
檢索單元,適于根據請求內容的關鍵詞,在范文網頁數據庫進行檢索;
關鍵項提取單元,適于提取檢索到的與所述關鍵詞匹配的范文網頁數據項的關鍵項信息;
信息嵌入單元,適于將所述關鍵項信息以應用框結構嵌入檢索結果頁中。

8.  根據權利要求7所述的裝置,其中所述范文網頁數據庫包括多個范文網頁數據項,一范文網頁數據項包括一范文網頁的范文類型、范文數據和URL,且所述范文數據包括范文標題,范文正文和范文字數;所述請求內容包括主題關鍵詞和字數關鍵詞;其中,
檢索單元適于,在范文類型和/或范文標題和/或范文正文中匹配主題關鍵詞,并將字數關鍵詞與范文字數進行匹配;且
所述提取的關鍵項信息至少包括范文標題和范文字數。

9.  根據權利要求7或8所述的裝置,其中一范文網頁數據項包括多個范文數據;其中
檢索單元適于,在該范文網頁數據項的多個范文數據中分別進行關鍵詞匹配;且
關鍵項提取單元適于,對于檢索到的與所述關鍵詞匹配的多個范文數據,提取匹配的多個范文數據中的范文標題和范文字數。

10.  根據權利要求7-9任一項所述的裝置,其中所述范文網頁數據庫包括多個范文網頁數據項,一范文網頁數據項包括一范文網頁的范文類型、范文數據和URL;且所述范文數據包括范文標題,和范文文檔或范文文檔的下載鏈接;所述請求內容包括主題關鍵詞和字數關鍵詞;其中,
檢索單元適于,在范文類型和/或范文標題中匹配主題關鍵詞;且
所述提取的關鍵項信息至少包括范文標題。

說明書

說明書一種范文檢索請求的處理方法和裝置
技術領域
本發明涉及互聯網搜索領域,特別是涉及一種范文檢索請求的處理方法和裝置。
背景技術
范文搜索是網頁搜索中一種很重要的需求,被搜索的范文類型眾多,包括但不限于各類公文、文秘書信、工作計劃、總結報告、心得體會、演講致辭、作文作業、各種論文等等。在例如學生非放假期間、年底工作總結期間的高峰期,每天可以占到總網頁搜索量的1%左右。實際中,大多數范文需求對于字數都有固定要求,因而很多用戶都會在進行范文搜索時輸入字數,如“讀后感400字”、“獎學金申請書800字”等。即使在搜索時沒有明確將字數輸入,也會存在有對于該范文字數的潛在要求;例如,論文類的范文一般不低于8000字;入黨申請書類的范文一般要求有3000~5000字,等等。
對于范文搜索,目前存在的問題主要有兩個:一是當前檢索機制只能通過標題、網頁內容匹配來命中字數的需求,對于沒有相關字數的網頁排序不公平;由于找不到相應的字數的字段,也使得召回率不足;二是在目前檢索結果的標題摘要下,用戶只能通過相應字段飄紅來判定是否是自己想要的信息,對于很多有欺騙性質的頁面、字數是否滿足要求等都是沒有預期的。
圖1示出了當前范文搜索的搜索結果頁示意圖,用戶輸入的范文搜索請求是“以家為題的作文350字”;在搜索結果頁中,除了第一條結果的標題摘要直接命中350字外,其它結果都不知道有多少字數,只能將“350字”這個關鍵詞丟棄來進行排序,對于一些潛在與350字非常接近的結果來說就顯得非常不公平;用戶也不知道什么結果是好結果,只能逐個點擊查看,效率比較低下。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的范文檢索請求的處理方法和相應的裝置。
依據本發明的一個方面,提供了一種范文檢索請求的處理方法,包括:
獲取用戶的檢索請求;
根據請求內容的關鍵詞,判斷所述檢索請求是否是范文檢索請求;
如果是,根據請求內容的關鍵詞,在范文網頁數據庫進行檢索;
提取檢索到的與所述關鍵詞匹配的范文網頁數據項的關鍵項信息;
將所述關鍵項信息以應用框結構嵌入檢索結果頁中。
可選地,所述范文網頁數據庫包括多個范文網頁數據項,一范文網頁數據項包括一范文網頁的范文類型、范文數據和URL,且所述范文數據包括范文標題,范文正文和范文字數;所述請求內容包括主題關鍵詞和字數關鍵詞;其中,檢索步驟包括,在范文類型和/或范文標題和/或范文正文中匹配主題關鍵詞,并將字數關鍵詞與范文字數進行匹配;且所述提取的關鍵項信息至少包括范文標題和范文字數。
可選地,一范文網頁數據項包括多個范文數據;其中,檢索步驟包括,在該范文網頁數據項的多個范文數據中分別進行關鍵詞匹配;且提取步驟包括,對于檢索到的與所述關鍵詞匹配的多個范文數據,提取匹配的多個范文數據中的范文標題和范文字數。
可選地,所述范文網頁數據庫包括多個范文網頁數據項,一范文網頁數據項包括一范文網頁的范文類型、范文數據和URL;且所述范文數據包括范文標題,和范文文檔或范文文檔的下載鏈接;所述請求內容包括主題關鍵詞和字數關鍵詞;其中,檢索步驟包括,在范文類型和/或范文標題中匹配主題關鍵詞;且所述提取的關鍵項信息至少包括范文標題。
可選地,檢索步驟還包括,根據請求內容的關鍵詞,在基礎網頁庫進行檢索;其中所述基礎網頁庫包括由網絡爬蟲下載存儲到服務器側的網頁;并且所述方法還包括,在檢索結果頁中合并在范文網頁數據庫檢索到的范文網頁和在基礎網頁庫檢索到的范文網頁,且前者在檢索結果頁的排序高于后者。
可選地,對于檢索結果頁中在范文網頁數據庫檢索到的范文網頁,根據其范文字數與字數關鍵詞的匹配度由高到低進行排序。
依據本發明的另一方面,還提供一種范文檢索請求的處理裝置,包括:
請求獲取單元,適于獲取用戶的檢索請求;
請求判斷單元,適于根據請求內容的關鍵詞,判斷所述檢索請求是否是范文檢索請求;
檢索單元,適于根據請求內容的關鍵詞,在范文網頁數據庫進行檢索;
關鍵項提取單元,適于提取檢索到的與所述關鍵詞匹配的范文網頁數據項 的關鍵項信息;
信息嵌入單元,適于將所述關鍵項信息以應用框結構嵌入檢索結果頁中。
可選地,所述范文網頁數據庫包括多個范文網頁數據項,一范文網頁數據項包括一范文網頁的范文類型、范文數據和URL,且所述范文數據包括范文標題,范文正文和范文字數;所述請求內容包括主題關鍵詞和字數關鍵詞;其中,檢索單元適于,在范文類型和/或范文標題和/或范文正文中匹配主題關鍵詞,并將字數關鍵詞與范文字數進行匹配;且所述提取的關鍵項信息至少包括范文標題和范文字數。
可選地,一范文網頁數據項包括多個范文數據;其中檢索單元適于,在該范文網頁數據項的多個范文數據中分別進行關鍵詞匹配;且關鍵項提取單元適于,對于檢索到的與所述關鍵詞匹配的多個范文數據,提取匹配的多個范文數據中的范文標題和范文字數。
可選地,所述范文網頁數據庫包括多個范文網頁數據項,一范文網頁數據項包括一范文網頁的范文類型、范文數據和URL;且所述范文數據包括范文標題,和范文文檔或范文文檔的下載鏈接;所述請求內容包括主題關鍵詞和字數關鍵詞;其中,檢索單元適于,在范文類型和/或范文標題中匹配主題關鍵詞;且所述提取的關鍵項信息至少包括范文標題。
可選地,檢索單元還適于,根據請求內容的關鍵詞,在基礎網頁庫進行檢索;其中所述基礎網頁庫包括由網絡爬蟲下載存儲到服務器側的網頁;并且所述裝置還包括合并排序單元,其適于在檢索結果頁中合并在范文網頁數據庫檢索到的范文網頁和在基礎網頁庫檢索到的范文網頁,且前者在檢索結果頁的排序高于后者。
可選地,所述合并排序單元還適于對于檢索結果頁中在范文網頁數據庫檢索到的范文網頁,根據其范文字數與字數關鍵詞的匹配度由高到低進行排序。
根據本發明的范文檢索請求的處理方法和裝置,用戶發出范文搜索請求時,在網頁爬蟲抓取的基礎網頁庫進行常規搜索的同時,還在范文網頁數據庫中進行搜索。由于范文網頁數據庫中包含了各種范文網頁的范文標題、正文以及字數,使得真正與用戶所要求的范文字數相同、相近的范文網頁出現在搜索結果頁中,并且能在搜索結果排序時能排在前面,提高了范文搜索的質量;進一步還能在搜索結果頁中將范文標題和范文字數顯示給用戶,以使得用戶在不點擊查看檢索結果內容的情況下就能知道檢索到的范文網頁的字數,能更快速地決定哪些結果需要查看,提高了整體效率和用戶體驗。
上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發明的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本發明的具體實施方式。
附圖說明
通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優選實施方式的目的,而并不認為是對本發明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
圖1是現有技術的范文搜索的搜索結果頁示意圖;
圖2是根據本發明一實施例的范文檢索請求的處理方法的流程圖;
圖3是根據本發明一實施例中使用的范文網頁數據庫的數據結構示意圖;
圖4是根據本發明一實施例中使用的范文網頁數據庫的一范文網頁數據項的示意圖;
圖5是根據本發明一實施例的范文搜索的搜索結果頁示意圖;
圖6是根據本發明另一實施例的范文搜索請求的處理裝置的結構示意圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。
實施例一
本實施例提供一種范文檢索請求的處理方法。當用戶向搜索引擎發起范文搜索請求時,所述處理方法在搜索引擎的服務器側執行。
圖2示出了根據本實施例的范文檢索請求的處理方法,包括步驟S201-S207,其中:
步驟S201:獲取用戶的檢索請求;
步驟S202:判斷所述檢索請求是否是范文檢索請求;
步驟S203:在范文網頁數據庫進行檢索;
步驟S204:提取檢索到的范文網頁數據項的關鍵項信息;
步驟S205:將關鍵項信息嵌入檢索結果頁中。
本實施例方法從步驟S201開始,搜索引擎的服務器獲取用戶的檢索請求,例如“入黨申請書2000字”,此請求表示用戶希望搜索到字數在2000字左右的入黨申請書范文;“以家為主題的作文350字”,表示用戶希望搜索以家主題的作文范文,并且字數應該在350字左右;等等。
服務器接收到檢索請求后,會對檢索請求的內容進行分析,獲取其中的檢索項,即此時進入步驟S202。對于檢索請求“入黨申請書2000字”,其檢索項為“入黨申請書”和“2000字”;對于檢索請求“以家為主題的作文350字”,其檢索項為“家”、“作文”和“350字”。根據檢索項“入黨申請書”或“作文”,步驟S202判斷其為范文檢索請求。關于對檢索請求進行分析獲取檢索項,有多種成熟的技術能夠實現,在此不再贅述。
當步驟S202判斷用戶的檢索請求是范文檢索請求時,進入步驟S203,根據檢索請求攜帶的關鍵詞,在范文數據庫中進行檢索。
對于檢索請求攜帶的關鍵詞,對應于步驟S202中確定的檢索項,包括主題關鍵詞和字數關鍵詞。例如,檢索請求“入黨申請書2000字”,其主題關鍵詞為“入黨申請書”,字數關鍵詞為“2000”;檢索請求“以家為主題的作文350字”,主題關鍵詞為“家”和“作文”,字數關鍵詞為“350”。
對于范文網頁數據庫,其包括多個范文網頁數據項,每一范文網頁數據項對應一范文網頁,具體包括該范文網頁的范文類型、范文網頁的范文數據和范文網頁對應的URL。典型地,范文網頁的范文數據包括范文標題、范文正文和范文字數。圖3示意性地示出了本發明所述范文網頁數據庫的數據結構示意圖。
范文網頁數據庫應在范文檢索前在搜索引擎的服務器端建立。首先,通過網絡爬蟲對互聯網上范文資源網站的范文網頁進行抓取;網絡爬蟲是一個技術成熟的、能自動提取互聯網上網頁的程序,它根據既定的規則為搜索引擎從互聯網上下載網頁,是搜索引擎的重要組成。所有被網絡爬蟲抓取的網頁將會被存貯在服務器側;同時可進行一定的分析、過濾,建立索引,生成供用戶檢索使用的基礎檢索庫(或索引數據庫);網絡爬蟲可以在全網絡范圍內進行范文網頁的抓取,也可以在指定的多個范文資源網站的范圍內進行網頁抓取,所述指定的范文資源網站可以由搜索服務提供商和/或用戶不斷進行添加和更新。然后,針對存儲在服務器側的、已被抓取到的范文網頁,根據與所要提取的范文類型相對應的關鍵詞,提取該類型范文網頁的范文數據。具體地,首先需要將關鍵詞與范文網頁的內容進行匹配;如匹配,則從范文網頁的內容中提取范文 數據。發明人發現,互聯網上的范文資源網站主要包括三大類:問答社區網站,文字網站和文庫資源網站。優選地,針對不同類型的范文資源網站,使用相應的范文數據提取規則,能夠更準確地提供范文數據。特別地,對于某些范文網頁,例如問答社區網站的一個范文網頁,其有可能包括了多篇范文,相應地該范文網頁對應的范文網頁數據項將包括多條范文數據,如圖4所示,其中每條范文數據與范文網頁中的一篇范文內容對應。最后,基于已提取的范文網頁的范文數據,建立范文網頁數據庫。
在步驟S203的檢索過程中,可先將主題關鍵詞與范文類型進行匹配,然后根據二者匹配情況,進一步將主題關鍵詞在相應的范文標題和/或范文正文中進行匹配。示例性地,對于檢索請求“入黨申請書2000字”,步驟S203先在范文類型中對主題關鍵詞“入黨申請書”進行匹配,若匹配成功,即判斷主題關鍵詞檢索命中;對于檢索請求“以家為主題的作文350字”,先在范文類型中對主題關鍵詞“作文”進行匹配;若匹配成功,進一步將主題關鍵詞“家”在相應的范文標題和/或范文正文中進行匹配;若繼續匹配成功,則判斷主題關鍵詞檢索命中。
在主題關鍵詞檢索命中之后,在命中的范文網頁數據項中,進一步將字數關鍵詞與范文網頁數據項的范文字數進行匹配,并建立二者的匹配度。示例性地,對于檢索請求“以家為主題的作文350字”,若一范文網頁數據項的范文字數為350字,則匹配度為100%;另一數據項的范文字數為385字,則匹配度為91%。優選地,若字數匹配度低于某一閾值,例如匹配度低于30%,可在檢索結果中舍棄此范文網頁數據項對應的范文網頁。
特別地,對于一條范文網頁數據項包括多條范文數據的情況,在主題關鍵詞與范文類型匹配成功后,應對每條范文數據進行主題關鍵詞和/或字數關鍵詞匹配。
在檢索步驟S203之后,進入步驟S204,提取檢索到的與所述關鍵詞匹配的范文網頁數據項的關鍵項信息;和步驟S205,將所述關鍵項信息以應用框結構嵌入檢索結果頁中,從而提供給用戶。根據本實施例,被提取的關鍵項信息包括范文標題和范文字數,范文標題可以讓用戶初步了解范文的具體主題,范文字數則能夠讓用戶直觀了解該范文字數是否滿足自己的需求。優選地,被提取的關鍵項信息還可包括部分范文正文,以使得用戶能夠在不點擊打開范文網頁的情況下就知曉范文的部分內容。
對于檢索請求“以家為主題的作文350字”,圖5示出了根據本實施例在 范文網頁數據庫中進行范文搜索的搜索結果頁示意圖。在搜索結果頁中,根據范文字數與字數關鍵詞的匹配度由高到低對在范文網頁數據庫中檢索到的范文網頁進行排序;如圖5所示,字數完全匹配的作為“我的家鄉”排在第一位,排在第二位的范文網頁包括了兩篇范文,367字的“我的爸爸媽媽”和385字的“我的家鄉”。與圖1所示的現有技術中的范文搜索,搜索結果更加在準確,呈現內容更加豐富,極大程度上提高了用戶體驗。
另一方面,優選地,在步驟S202之后,本實施例所述方法還進入步驟S206,根據請求內容的關鍵詞,在基礎網頁庫進行檢索。如上所述,基礎網頁庫,即搜索引擎的索引數據庫,包括由網絡爬蟲下載存儲到服務器側的網頁;在基礎網頁庫的檢索是互聯網搜索領域的一項成熟技術,在此不再贅述。
最后,進入步驟S207,在檢索結果頁中合并在范文網頁數據庫檢索到的范文網頁和在基礎網頁庫檢索到的范文網頁。具體地,在檢索結果頁中,在范文網頁數據庫檢索到的范文網頁排在基礎網頁庫檢索到的范文網頁的前面;一方面,優先向用戶提供在范文網頁數據庫中檢索到的、更準確的檢索結果,另一方面將普通搜索的搜索結果同時呈現給用戶,使得檢索結果更全面。
實施例二
在本實施例中,對于互聯網中為用戶提供各種文章、論文的下載服務的文庫資源網站(例如萬方數據網等等),其網頁中包括范文文檔的URL資源鏈接和描述該范文文檔的文字內容;范文網頁數據庫中這類文庫資源網頁的范文網頁數據項,其范文數據包括:范文標題,其對應于描述該范文文檔的文字內容;和范文正文,其對應于已下載的范文文檔或范文文檔的下載鏈接;
相對于實施例一所述方法,本實施例所述方法具有如下區別:在關鍵詞檢索步驟中,僅在范文類型和/或范文標題中匹配主題關鍵詞;而且,在提取步驟中,所提取的關鍵項信息包括范文標題。
實施例三
在本實施例中,提供了一種范文搜索請求的處理裝置,其設置在搜索引擎的服務器側。圖6示出了所述處理裝置的結構示意圖,所述處理裝置至少包括單元601-單元605。
當用戶向搜索引擎發出檢索請求時,請求獲取單元601獲取用戶的檢索請求;然后請求判斷單元602根據請求內容的關鍵詞,判斷所述檢索請求是否是 范文檢索請求。例如,對于檢索請求“以家為主題的作文350字”,其包含了檢索項“家”、“作文”和“350字”,請求判斷單元602根據其中檢索項“作文”判斷其為范文檢索請求。
接下來,檢索單元603根據請求內容中與上述檢索項相對應的主題關鍵詞“家”和“作文”以及字數關鍵詞“350”,在范文網頁數據庫進行檢索,其中范文網頁數據庫參見實施例一和二中的描述。在檢索過程中,可先將主題關鍵詞與范文類型進行匹配,然后根據二者匹配情況,再進一步將主題關鍵詞在相應的范文標題和/或范文正文中進行匹配。在主題關鍵詞檢索命中之后,在命中的范文網頁數據項中,進一步將字數關鍵詞與范文網頁數據項中的范文字數進行匹配,并建立二者的匹配度。特別地,對于一條范文網頁數據項包括多條范文數據的情況,在主題關鍵詞與范文類型匹配成功后,應對每條范文數據進行主題關鍵詞和/或字數關鍵詞匹配。
檢索到范文網頁數據項后,關鍵項提取單元604提取所述范文網頁數據項的關鍵項信息,然后由信息嵌入單元605將所述關鍵項信息以應用框結構嵌入檢索結果頁中。根據本實施例,被提取的關鍵項信息包括范文標題和范文字數,范文標題可以讓用戶初步了解范文的具體主題,范文字數則能夠讓用戶直觀了解該范文字數是否滿足自己的需求。優選地,被提取的關鍵項信息還可包括部分范文正文,以使得用戶能夠在不點擊打開范文網頁的情況下就知曉范文的部分內容。
進一步地,本實施例所述裝置的檢索單元603還同時根據請求內容的關鍵詞在基礎網頁庫進行檢索;其中所述基礎網頁庫包括由網絡爬蟲下載存儲到服務器側的網頁。并且,本實施例所述裝置還包括合并排序單元,其適于在檢索結果頁中合并在范文網頁數據庫檢索到的范文網頁和在基礎網頁庫檢索到的范文網頁,且前者在檢索結果頁的排序高于后者。一方面,優先向用戶提供在范文網頁數據庫中檢索到的、更準確的檢索結果,另一方面將普通搜索的搜索結果同時呈現給用戶,使得檢索結果更全面。
在此提供的算法和顯示不與任何特定計算機、虛擬系統或者其它設備固有相關。各種通用系統也可以與基于在此的示教一起使用。根據上面的描述,構造這類系統所要求的結構是顯而易見的。此外,本發明也不針對任何特定編程語言。應當明白,可以利用各種編程語言實現在此描述的本發明的內容,并且上面對特定語言所做的描述是為了披露本發明的最佳實施方式。
在此處所提供的說明書中,說明了大量具體細節。然而,能夠理解,本發 明的實施例可以在沒有這些具體細節的情況下實踐。在一些實例中,并未詳細示出公知的方法、結構和技術,以便不模糊對本說明書的理解。
類似地,應當理解,為了精簡本公開并幫助理解各個發明方面中的一個或多個,在上面對本發明的示例性實施例的描述中,本發明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖:即所要求保護的本發明要求比在每個權利要求中所明確記載的特征更多的特征。更確切地說,如下面的權利要求書所反映的那樣,發明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式的權利要求書由此明確地并入該具體實施方式,其中每個權利要求本身都作為本發明的單獨實施例。
本領域那些技術人員可以理解,可以對實施例中的設備中的模塊進行自適應性地改變并且把它們設置在與該實施例不同的一個或多個設備中。可以把實施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
此外,本領域的技術人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發明的范圍之內并且形成不同的實施例。例如,在下面的權利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
本發明的各個部件實施例可以以硬件實現,或者以在一個或者多個處理器上運行的軟件模塊實現,或者以它們的組合實現。本領域的技術人員應當理解,可以在實踐中使用微處理器或者數字信號處理器(DSP)來實現根據本發明實施例的處理裝置中的一些或者全部部件的一些或者全部功能。本發明還可以實現為用于執行這里所描述的方法的一部分或者全部的設備或者裝置程序(例如,計算機程序和計算機程序產品)。這樣的實現本發明的程序可以存儲在計算機可讀介質上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網網站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
應該注意的是上述實施例對本發明進行說明而不是對本發明進行限制,并 且本領域技術人員在不脫離所附權利要求的范圍的情況下可設計出替換實施例。在權利要求中,不應將位于括號之間的任何參考符號構造成對權利要求的限制。單詞“包含”不排除存在未列在權利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現。在列舉了若干裝置的單元權利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現。單詞第一、第二、以及第三等的使用不表示任何順序。可將這些單詞解釋為名稱。

關于本文
本文標題:一種范文檢索請求的處理方法和裝置.pdf
鏈接地址:http://www.pqsozv.live/p-6180789.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

[email protected] 2017-2018 zhuanlichaxun.net網站版權所有
經營許可證編號:粵ICP備17046363號-1 
 


收起
展開
钻石光影