百度相關(guān)的各個(gè)蜘蛛Bot
圖片搜索:Baiduspider-image
視頻搜索:Baiduspider-video
新聞搜索:Baiduspider-news
百度搜藏:Baiduspider-favo
百度聯(lián)盟:Baiduspider-cpro
商務(wù)搜索:Baiduspider-ads
網(wǎng)頁(yè)以及其他搜索:Baiduspider
百度蜘蛛,是百度搜索引擎的一個(gè)自動(dòng)程序。它的作用是訪問(wèn)收集整理互聯(lián)網(wǎng)上的網(wǎng)頁(yè)、圖片、視頻等內(nèi)容,然后分門(mén)別類建立索引數(shù)據(jù)庫(kù),使用戶能在百度搜索引擎中搜索到您網(wǎng)站的網(wǎng)頁(yè)、圖片、視頻等內(nèi)容。
Baiduspider對(duì)一個(gè)網(wǎng)站服務(wù)器造成的訪問(wèn)壓力如何?
答:Baiduspider會(huì)自動(dòng)根據(jù)服務(wù)器的負(fù)載能力調(diào)節(jié)訪問(wèn)密度。在連續(xù)訪問(wèn)一段時(shí)間后,Baiduspider會(huì)暫停一會(huì),以防止增大服務(wù)器的訪問(wèn)壓力。所以在一般情況下,Baiduspider對(duì)您網(wǎng)站的服務(wù)器不會(huì)造成過(guò)大的壓力。
為什么Baiduspider不停的抓取我的網(wǎng)站?
答:或許您的網(wǎng)站權(quán)重高或者對(duì)于您網(wǎng)站上新產(chǎn)生的或者持續(xù)、有規(guī)律更新的頁(yè)面,Baiduspider會(huì)持續(xù)抓取。此外,您也可以檢查網(wǎng)站訪問(wèn)日志中Baiduspider的訪問(wèn)是否正常,以防止有人惡意冒充Baiduspider來(lái)頻繁抓取您的網(wǎng)站。 如果您發(fā)現(xiàn)Baiduspider非正常抓取您的網(wǎng)站,請(qǐng)反饋至,并請(qǐng)盡量給出Baiduspider對(duì)貴站的訪問(wèn)日志,以便于我們跟蹤處理。
我不想我的網(wǎng)站被Baiduspider訪問(wèn),我該怎么做?
答:Baiduspider遵守互聯(lián)網(wǎng)robots協(xié)議。您可以利用robots.txt文件完全禁止Baiduspider訪問(wèn)您的網(wǎng)站,或者禁止Baiduspider訪問(wèn)您網(wǎng)站上的部分文件。 注意:禁止Baiduspider訪問(wèn)您的網(wǎng)站,將使您的網(wǎng)站上的網(wǎng)頁(yè),在百度搜索引擎以及所有百度提供搜索引擎服務(wù)的搜索引擎中無(wú)法被搜索到。
為什么我的網(wǎng)站已經(jīng)加了robots.txt,還能在百度搜索出來(lái)?
答:因?yàn)樗阉饕嫠饕龜?shù)據(jù)庫(kù)的更新需要時(shí)間。雖然Baiduspider已經(jīng)停止訪問(wèn)您網(wǎng)站上的網(wǎng)頁(yè),但百度搜索引擎數(shù)據(jù)庫(kù)中已經(jīng)建立的網(wǎng)頁(yè)索引信息,可能需要二至四周才會(huì)清除。 另外也請(qǐng)檢查您的robots配置是否正確。
我希望我的網(wǎng)站內(nèi)容被百度索引但不被保存快照,我該怎么做?
答:Baiduspider遵守互聯(lián)網(wǎng)metarobots協(xié)議。您可以利用網(wǎng)頁(yè)meta的設(shè)置,使百度顯示只對(duì)該網(wǎng)頁(yè)建索引,但并不在搜索結(jié)果中顯示該網(wǎng)頁(yè)的快照。
和robots的更新一樣,因?yàn)樗阉饕嫠饕龜?shù)據(jù)庫(kù)的更新需要時(shí)間,所以雖然您已經(jīng)在網(wǎng)頁(yè)中通過(guò)meta禁止了百度在搜索結(jié)果中顯示該網(wǎng)頁(yè)的快照,但百度搜索引擎數(shù)據(jù)庫(kù)中如果已經(jīng)建立了網(wǎng)頁(yè)索引信息,可能需要二至四周才會(huì)在線上生效。
百度蜘蛛在robots.txt中的名字是什么?
答:“Baiduspider” 首字母B大寫(xiě),其余為小寫(xiě)。
Baiduspider多長(zhǎng)時(shí)間之后會(huì)重新抓取我的網(wǎng)頁(yè)?
答:百度搜索引擎每周更新,網(wǎng)頁(yè)視重要性有不同的更新率,頻率在幾天至一月之間,Baiduspider會(huì)重新訪問(wèn)和更新一個(gè)網(wǎng)頁(yè)。
Baiduspider抓取造成的帶寬堵塞?
答:Baiduspider的正常抓取并不會(huì)造成您網(wǎng)站的帶寬堵塞,造成此現(xiàn)象可能是由于有人冒充baidu的spider惡意抓取。如果您發(fā)現(xiàn)有名為Baiduspider的agent抓取并且造成帶寬堵塞,請(qǐng)盡快和我們聯(lián)系。您可以將信息反饋至百度網(wǎng)頁(yè)投訴中心,如果能夠提供您網(wǎng)站該時(shí)段的訪問(wèn)日志將更加有利于我們的分析。
不想讓百度抓取,可以選擇robots.txt協(xié)議禁止。
User-agent: Baiduspider
Disallow: /
如果還是禁止不了,可以選擇nginx規(guī)則禁止訪問(wèn),如下:
if ($http_user_agent ~* "Baiduspider") {
return 403;
}