搜索引擎的工作過程是引擎蜘蛛爬行和抓取、索引和排名。排名,即用戶輸入關鍵詞后,排名程序調用索引數(shù)據(jù)庫,計算相關性,然后按一定格式生成搜索結果頁面。

排名過程是與用戶直接互動的
01-搜索詞處理:中文分詞處理,去除用戶搜索中的停止詞,指令處理,糾正拼寫錯誤,整合索引出發(fā)。
02文件匹配:找出含有所有關鍵詞的文件。
03-初始子集的選擇:文件匹配得出的子集還不能直接計算,因為匹配到的文件通常會幾十幾百上千萬,對這么多文件實時計算相關性需要很長時間,根據(jù)權重和相關性,百度提供76頁大約760個搜索結果,故會先選出權重較高的一個子集。
04-相關性計算:關鍵詞常用程度、詞頻及密度,關鍵詞位置及型式,關鍵詞距離、鏈接分析及頁面權重。
05-排名過濾及調整:主要過濾是施加懲罰,減少垃圾內容、作弊嫌疑頁面,如百度11位,算法。
06-排名顯示:經排名程序調用原始頁面的標題、描述標簽、快照日期等。
07-搜索緩存:用戶搜索的關鍵詞有很大一部分是重復的,將最常見的搜索詞存入緩存,縮短搜索反應時間。
08-查詢及點擊日志:記錄用戶的IP地址、搜索的關聯(lián)詞、搜索時間及點擊了哪些頁面并存入搜索庫。
網站優(yōu)化技術配合一些搜索引擎高級指令將使得優(yōu)化工作變得簡單,以下是baidu、google支持的高級指令。
SEO高級指令
01-雙引號(“”):完全匹配搜索。
02-減號(-):搜索時排除減號后面的內容。如:搜“花 -牡丹”,返回只出現(xiàn)含“花”但不含“牡丹”頁面。
04-inurl:搜索結果中內容及其下面的網址含inurl括號里面的內容。如:搜“inurl:騰訊”,返回頁面標題、內容及網址至少都含有“騰訊”。
05-intitle:返回的是頁面title中包含關鍵詞的頁面。如“intitle:魅族”。
06-filetype:找出當前收錄在搜索引擎中的文件。如:搜“filetype:pdf”,返回含有pdf文件頁面。(百度僅支持搜索ppt、xls、doc、rtf、pdf、txt)
07-domian:后跟完整域名,查詢網站被百度收錄的反向鏈接數(shù)目。
排名過程是將搜索結果反饋給用戶,網站優(yōu)化配合搜索引擎高級指令將使得優(yōu)化工作變得簡單。



皖公網安備 34010202600669



