造成Baiduspider抓取異常的原因


造成Baiduspider抓取異常的原因

文章插圖

下面向站長介紹一些常見的抓取異常原因:
? ? ? ? 1 , 服務器連接異常
服務器連接異常會有兩種情況:一種是站點不穩定 , Baiduspider嘗試連接您網站的服務器時出現暫時無法連接的情況;一種是Baiduspider一直無法連接上您網站的服務器 。
造成服務器連接異常的原因通常是您的網站服務器過大 , 超負荷運轉 。 也有可能是您的網站運行不正常 , 請檢查網站的web服務器(如apache、iis)是否安裝且正常運行 , 并使用瀏覽器檢查主要頁面能否正常訪問 。 您的網站和主機還可能阻止了Baiduspider的訪問 , 您需要檢查網站和主機的防火墻 。
2 , 網絡運營商異常:網絡運營商分電信和聯通兩種 , Baiduspider通過電信或網通無法訪問您的網站 。 如果出現這種情況 , 您需要與網絡服務運營商進行聯系 , 或者購買擁有雙線服務的空間或者購買cdn服務 。
3 , DNS異常:當Baiduspider無法解析您網站的IP時 , 會出現DNS異常 。 可能是您的網站IP地址錯誤 , 或者域名服務商把Baiduspider封禁 。 請使用WHOIS或者host查詢自己網站IP地址是否正確且可解析 , 如果不正確或無法解析 , 請與域名注冊商聯系 , 更新您的IP地址 。
4 , IP封禁:IP封禁為:限制網絡的出口IP地址 , 禁止該IP段的使用者進行內容訪問 , 在這里特指封禁了BaiduspiderIP 。 當您的網站不希望Baiduspider訪問時 , 才需要該設置 , 如果您希望Baiduspider訪問您的網站 , 請檢查相關設置中是否誤添加了BaiduspiderIP 。 也有可能是您網站所在的空間服務商把百度IP進行了封禁 , 這時您需要聯系服務商更改設置 。
5 , UA封禁:UA即為用戶代理(User-Agent) , 服務器通過UA識別訪問者的身份 。 當網站針對指定UA的訪問 , 返回異常頁面(如403 , 500)或跳轉到其他頁面的情況 , 即為UA封禁 。 當您的網站不希望Baiduspider訪問時 , 才需要該設置 , 如果您希望Baiduspider訪問您的網站 , useragent相關的設置中是否有Baiduspider UA , 并及時修改 。
6 , 死鏈:頁面已經無效 , 無法對用戶提供任何有價值信息的頁面就是死鏈接 , 包括協議死鏈和內容死鏈兩種形式:
協議死鏈:頁面的TCP協議狀態/HTTP協議狀態明確表示的死鏈 , 常見的如404、403、503狀態等 。
內容死鏈:服務器返回狀態是正常的 , 但內容已經變更為不存在、已刪除或需要權限等與原內容無關的信息頁面 。
【造成Baiduspider抓取異常的原因】 對于死鏈 , 我們建議站點使用協議死鏈 , 并通過百度站長平臺--死鏈工具向百度提交 , 以便百度更快地發現死鏈 , 減少死鏈對用戶以及搜索引擎造成的負面影響 。
7 , 異常跳轉:將網絡請求重新指向其他位置即為跳轉 。 異常跳轉指的是以下幾種情況:
? ? ? ? 1)當前該頁面為無效頁面(內容已刪除、死鏈等) , 直接跳轉到前一目錄或者首頁 , 百度建議站長將該無效頁面的入口超鏈接刪除掉
? ? ? ? 2)跳轉到出錯或者無效頁面
注意:對于長時間跳轉到其他域名的情況 , 如網站更換域名 , 百度建議使用301跳轉協議進行設置 。

相關經驗推薦