MauiBot 不同于其他爬蟲,這個(gè)爬蟲連網(wǎng)站都沒有,UA只顯示一個(gè)郵箱:”MauiBot (crawler.feedback+wc@gm ail.com)“。神奇的是這個(gè)看起來(lái)是個(gè)人爬蟲,竟然遵循robots協(xié)議,算得上垃圾爬蟲的一股清流。
好在遵循robots協(xié)議,可以用robots.txt協(xié)議進(jìn)行禁止。
協(xié)議如下:
User-agent: MauiBot
Disallow: /
MauiBot 不同于其他爬蟲,這個(gè)爬蟲連網(wǎng)站都沒有,UA只顯示一個(gè)郵箱:”MauiBot (crawler.feedback+wc@gm ail.com)“。神奇的是這個(gè)看起來(lái)是個(gè)人爬蟲,竟然遵循robots協(xié)議,算得上垃圾爬蟲的一股清流。
好在遵循robots協(xié)議,可以用robots.txt協(xié)議進(jìn)行禁止。
協(xié)議如下:
User-agent: MauiBot
Disallow: /
百度蜘蛛
必應(yīng)蜘蛛
一淘蜘蛛
英國(guó)MJ12蜘蛛
亞馬遜蜘蛛
Ads蜘蛛
Aray蜘蛛
搜狗蜘蛛
Ask蜘蛛
sp蜘蛛
Mail.RU蜘蛛
俄羅斯蜘蛛