SEO關鍵解密:為什麼搜尋結果一直沒有我的網頁(下)
今天要來讓大家瞭解一下,在搜尋引擎蜘蛛讓你的網頁被收錄之前,有三大很重要的工作邏輯,
這很有可能就是搜尋結果裡面老是沒有收錄到你的網頁的幾個卡關區。
首先,我們馬上先破題,SEO的蜘蛛工作邏輯中凡是講到「檢索」、「汲取」、「建立索引」都是對搜尋引擎(機器)而言;若是講「收錄」的話,是以前台使用者(人類)的角度而言。
檢索主要是以搜尋引擎蜘蛛的角度,從已存在的網頁,解析出連結指向的網址,然後沿著連結,發掘新頁面的過程。
蜘蛛(以下都簡稱spider)並非只要一發現網址,就馬上就去檢索新頁面,而是先將網址存放到待抓區,搜尋引擎蜘蛛按照一定順序,從網址庫中提取要汲取的網址。蜘蛛爬行的順序為何,不在今天的重點之中,這裡先不做詳述。
汲取是以搜尋引擎蜘蛛的角度,指的是「spider→從待抓區中→提取要汲取的網址,訪問這個網址,把讀取的HTML代碼存到系統資料庫」的過程。
搜尋引擎蜘蛛的抓取,並且會在伺服器日誌中,留下記錄。
建立索引也是以搜尋引擎蜘蛛的角度,將一個網址的data進行整理後,存入資料庫,也就是被索引區,使用者在網路上進行搜索時,搜尋引擎從被索引區中提取網址內的資訊,再依循排序邏輯展示出來。
「索引」的英文是"index",在英文詞彙裡,索引和收錄指的都是同樣是這個字"index"。「被索引區」是用於被搜索的資料庫,所以被索引的網址是可以被前端使用者搜尋到的;那些沒被索引的網頁(網址),用戶在搜尋結果頁面裡是找不到的。而「汲取」和「建立索引」,從頭到尾一直都是兩件事。可以想像成是:透過spider 汲取後被建立索引成資料庫中的某種資料(之後再供前台的使用者搜尋查找)。
不過,一個網址內的資訊並不限於蜘蛛從網址上抓來的內容,還可能會有錨文字、外部連結等其它訊息。有一種狀況就是,存在於索引庫中關於這個網址內的資訊,事實上根本沒有從這個網址上汲取,但搜尋引擎知道這個網址,並有著其它資訊的存在。
總的來說,搜尋引擎的蜘蛛喜歡原生、原創、網站分層結構完整的頁面,而人類喜歡資訊豐富,實用,使用者體驗良好的網頁,所以講回來「收錄」其實是以「前台使用者」角度下的定義。當我們在前台搜索時,能找到這個網址,就代表的意思就是「這個網址已經被收錄了」。能夠兼具以上兩種面向的網頁,相對的能夠提升被收錄率。說起來簡單易懂,做起來相當考驗營運的腳步是否扎實,因為這兩種層面,都並非短期內就可以馬上看見成效的操作。
台灣經貿網會員行動方案:
1.定期整理商品目錄頁,減少不必要的分層,以利被搜尋引擎蜘蛛建立索引
2.定期增生新內容或更新原有網頁的資訊。
※ 本文由愛點科技編撰