什麼是抓取預算以及為什麼它在 SEO 中很重要?

已發表: 2020-07-29

抓取預算是 SEO 行業中最受破壞的部分之一,並且通常被世界各地的品牌認為是一個古老的、休眠的功能。 相反,抓取預算已根據現代行業標準和 Google 算法演變,使其隨著時間的推移變得更加重要。

根據 Google,抓取預算是您網站的抓取速度限制的總和(確保 Googlebot 或其他機器人不會過多地抓取您的網頁,造成任何損害); 和抓取需求(它定義了谷歌想要抓取多少頁面)。

但是,抓取預算有助於了解搜索引擎為您的網站提供的關注度或權重。 已經編寫了幾個計算機程序來從網頁中收集信息,稱為機器人、爬蟲、網絡蜘蛛等。它可以幫助確定 Google 在一天內將在您的網站上抓取的頁面數量,並且沒有固定限制,因為這些一天可以爬取 1 到 40,00,000 個頁面或更多。

因此,優化您的抓取預算以幫助收集有關網站更新頁面的更好信息、分析其內容質量並將數據發送到其他搜索引擎至關重要。 因此,抓取預算越好,搜索引擎索引中反映的信息就越快,從而可以對您的網站進行更改。 要獲得有關技術 SEO 的更多知識,請查看我們的數字營銷課程。

為了更好地了解爬取預算,讓我們首先深入了解爬取過程

閱讀更多:技術 SEO:您現在應該實施的 7 個最佳實踐

目錄

搜索引擎優化方面的抓取預算

它是 SEO 行業中廣泛使用的相對術語,表示機器人爬行所需的各種方法和概念。 這些技術可能取決於機器人爬取的頁面的數量和類型。 搜索引擎將抓取預算分配給網站,因為有無限的在線網站,但從搜索引擎頁面的角度來看,用於覆蓋和收集數據的資源有限。

預算可以幫助他們將注意力分散到眾多網站上,並優先考慮他們的抓取事件 搜索引擎頁面分配抓取預算取決於以下因素:

  • 抓取限制網站可以處理的抓取頻率及其所有者的偏好。
  • 抓取需求根據受歡迎程度和相關性,哪些網站 URL 值得抓取

由於抓取預算存在很多混淆,許多品牌經常在不知不覺中未充分利用或忽視分配給您網站的抓取預算,從而對其在線 SEO 策略和 SERP 結果造成更大的損害。

每天,爬蟲都會被分配到一個 URL 列表,它需要係統地覆蓋每個 URL。 為此,爬蟲需要及時獲取robots.txt文件,以了解它是否仍然可以爬取每個給定的URL並開始一個接一個地爬取。 Google 認為一個網站值得抓取並沒有預先確定的理由,但更新 XML 站點地圖和新反向鏈接等因素會影響抓取並充分利用它。

那麼,抓取預算中的“預算”一詞指的是什麼? 是不是跟財務有關?

爬行“預算”一詞是一個不確定的術語,用於描述機器人訪問網站的頻率,以及它首先訪問的頁面。 如上所述,預算可以是爬網需求、爬網率等許多因素的綜合影響

爬網對於擁有較大網站和許多著陸頁的品牌來說非常重要,例如亞馬遜這樣的電子商務網站,當它向其網站添加新的部分/類別時,該網站本身包含數千個頁面。 當您需要爬網預算以快速將所有這些頁面編入索引時,這是理想的情況。 但是,擁有過多的重定向鏈也會影響您的抓取預算。

為什麼抓取預算很重要?

這非常重要,因為您希望搜索引擎快速索引您的頁面,更新現有頁面,並很快讓這些頁面上的訪問者開始轉換。 如果沒有主動抓取,您的訪問者可能永遠無法知道或在您的網站上購買更新、更新的產品、未被發現並不必要地浪費您的抓取預算。 如果在 Google Search Console 上得到驗證,還有一些方法可以查看您網站抓取預算這是如何做:

  • 首先,登錄 Google Search Console 並選擇您想了解抓取預算的網站
  • 其次,轉到 Crawl > Crawl Stats,在這裡您可以看到Google每天抓取的頁面數量。

例如,如果您看到平均抓取預算為 70 頁/天,並且保持不變,則每月抓取預算將為(70 頁)x(30 天)= 2100 頁在一個月內。

谷歌表示,每天有數百萬個網站被抓取,抓取預算較高的頁面會受到爬蟲的更多關注,並會吸引機器人檢查這些頁面,而不會直接增加 SEO 活動,但主要是讓企業主從中受益。

閱讀:數字營銷教程

優化抓取預算

通過遵循行業最佳實踐,您可以通過多種方式確保不再浪費抓取預算以下是檢查和優化抓取預算的一些最常見原因

  • 可訪問的 URL:確保沒有 URL 保存任何參數,以便在產品過濾器中進行更廣泛的選擇。
  • 良好的網站速度:頁面加載速度更快,爬取率提高的機會更高,並保持用戶體驗最大化
  • 內部鏈接:谷歌喜歡與網站內許多頁面相互鏈接的網站,指針分散在各處。 此外,由於內部鏈接,Googlebot 會訪問您網站上需要索引的所有頁面。
  • 沒有內容質量差:質量差或內容少的頁面不會為網站增加任何價值,並且可能會影響您網站的整體抓取率
  • 扁平化網站架構:您的網站越受歡迎,您擁有的鏈接權限就越多。 因此,扁平化網站架構有助於利用所有網站頁面的鏈接權限,並獲得網站爬蟲的更多關注。
  • 限制重複內容: Google 反對複製或重複的內容頁面,因此,在您的網站上放置此類頁面可能會影響整體抓取預算和費率。
  • 沒有孤立頁面:對於您的網站來說,在其所有登錄頁面上擁有大量內部和外部鏈接是非常重要的。 如果沒有此類鏈接,頁面被稱為“孤兒頁面”,通常會被取消索引或需要 Google 大量時間才能在搜索引擎結果中發現此類頁面。

另請閱讀:必讀 73 個谷歌分析面試問題和答案

結論

隨著時間的推移,爬網預算是、過去和將來可能是讓網站被索引並在搜索引擎結果頁面中更加可見的最關鍵因素之一。 每個 SEO 專業人士都需要找到方法並密切關注爬網預算優化,從而間接導致任何品牌更好的 SEO 存在。

如果您想親自動手進行數字營銷,請查看數字營銷高級證書和

什麼是抓取預算?

抓取預算是谷歌在任何一天在網站上抓取的頁面數。 谷歌並不總是立即監視您網站上的每個頁面。 實際上,有時可能需要數週時間,這可能會妨礙您的 SEO 工作。 此時,是時候優化您的抓取預算了。

Google“抓取”的頁數是您的“預算”。 這通常由您網站的大小和健康狀況以及指向您網站的鏈接數量來確定。

如何確定您的網站是否存在抓取預算問題?

要確定您的網站是否存在抓取預算問題,首先,計算您網站上的頁面數。 您可以參考 XML 站點地圖以鳥瞰這一點。 其次,轉到 Google Search Console,前往舊版工具,然後點擊“抓取狀態”。 然後記下每天抓取的平均頁面數。 最後,將頁面數除以每天的平均抓取次數。

大於 10 的數字表示您網站的網頁數量是 Google 能夠抓取的網頁數量的 10 倍。 因此,需要優化您的抓取預算。

如何優化您的抓取預算?

優化您的抓取預算歸結為確保不浪費抓取預算。 從本質上講,它包括修復浪費抓取預算的原因。 為了幫助您優化抓取預算,您必須避免一些標準頁面,以防止浪費您的抓取預算。 使用帶有參數的可訪問 URL。