谷歌最近發(fā)現(xiàn),互聯(lián)網(wǎng)上的獨(dú)立URL數(shù)量超過了1萬億個(gè)。
谷歌高管本周五在該公司博客上表示,這應(yīng)當(dāng)歸功于谷歌的工程師。谷歌工程師發(fā)現(xiàn),互聯(lián)網(wǎng)上每天新增加數(shù)十億個(gè)網(wǎng)頁。
在公布這一數(shù)字的同時(shí),谷歌還趁機(jī)炫耀了自己的索引數(shù)據(jù)庫規(guī)模。谷歌互聯(lián)網(wǎng)搜索基礎(chǔ)架構(gòu)團(tuán)隊(duì)的軟件工程師杰西·阿爾帕特(Jesse Alpert)和尼?!すZ吉(Nissan Hajaj)在博客中寫道,“我們沒有對(duì)這1萬億個(gè)網(wǎng)頁中的每個(gè)網(wǎng)頁進(jìn)行索引——許多網(wǎng)頁彼此相似,或者是自動(dòng)生成的內(nèi)容,這些網(wǎng)頁對(duì)搜索用戶沒有什么用處。但我們對(duì)擁有最完整的索引數(shù)據(jù)庫感到自豪,我們的目標(biāo)是索引世界上的所有數(shù)據(jù)?!?nbsp;
過去谷歌一直公開宣揚(yáng)其索引數(shù)據(jù)庫的規(guī)模,各大搜索引擎廠商經(jīng)常為此爭得不可開交。后來它們發(fā)現(xiàn),大多數(shù)搜索用戶通常只會(huì)翻看兩頁搜索結(jié)果,有關(guān)索引數(shù)據(jù)庫規(guī)模的口水仗也因此而結(jié)束。換句話說,最重要的是向用戶提供10-20個(gè)相關(guān)度較高的鏈接,或者是直接回答用戶的問題,因?yàn)闆]有用戶會(huì)從5000個(gè)搜索結(jié)果中查找自己想要的信息。谷歌公布的這一信息是否會(huì)導(dǎo)致雅虎、微軟和Ask.com的激烈反應(yīng)還不得而知。
阿爾帕特和哈賈吉在博客中還寫道,目前,谷歌不停地下載整個(gè)web,收集更新網(wǎng)頁的信息,并每天對(duì)所有web鏈接進(jìn)行數(shù)次處理。
