搜索引擎的工作原理(四)

2016年2月21日14:07:21 發表評論

阿里云服務器

查詢服務主要工作

查詢服務是搜索引擎和用戶離得最近的一個模塊。在這個模塊中主要完成了以下3個工作:

5、 查詢匹配

搜索引擎會將用戶輸入的語句進行分詞,并且提取出有意義的查詢關鍵詞,然后返回網頁中包含有這些關鍵詞的網頁。

例如下圖,雖然用戶查詢的是“搜索引擎的原理”,但是搜索引擎會對這個查詢進行分詞,分成“搜索引擎”、“的”、“原理”三個詞,然后刪除沒有意義的“的”,接著找出和“搜索引擎”、“原理”匹配的網頁進行組合生成結果頁面。

搜索引擎的工作原理(四)

6、排序結果

預處理中為每個網頁形成了一個獨立二查詢詞的重要性指標,將這個指標和查詢過程中的相關性指標結合形成最終排序結果,是搜索引擎給出查詢排序結果的主要方法。

搜索引擎的工作原理(四)

7、 文檔摘要

一般的搜索引擎采用“動態摘要”的方式生成摘要,即在相應查詢的時候根據查詢詞在文檔中的位置,提取出周圍的文字,在顯示時將查詢詞標亮。

搜索引擎的工作原理(四)

以上就是搜索引擎查詢服務的簡介,不難看出查詢服務還需要一些細節的支持,例如中文自動摘要、搜索結果頁的生成等等技術。

maolai

發表評論

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: