Teoma是一個(gè)曾經(jīng)存在的網(wǎng)絡(luò)搜索引擎,后來被Ask Jeeves(現(xiàn)在的Ask.com)收購(gòu)。Teoma搜索引擎使用了一種叫做“主題目錄”(Subject-Specific Popularity)的算法,該算法通過分析網(wǎng)頁(yè)之間的相關(guān)性來提供搜索結(jié)果。
Teoma的網(wǎng)絡(luò)爬蟲程序會(huì)抓取互聯(lián)網(wǎng)上的網(wǎng)頁(yè)內(nèi)容,并根據(jù)其主題和相關(guān)性進(jìn)行索引。這種算法的特點(diǎn)是更加注重網(wǎng)頁(yè)的內(nèi)容和主題之間的關(guān)聯(lián)性,而不僅僅是頁(yè)面的鏈接結(jié)構(gòu)。
不過對(duì)于國(guó)內(nèi)網(wǎng)站來說不會(huì)帶來什么流量,可以選擇robots.txt協(xié)議禁止。
User-agent: Teoma
Disallow: /
如果還是禁止不了,可以選擇nginx規(guī)則禁止訪問,如下:
if ($http_user_agent ~* "Teoma") {
return 403;
}