2005年Hadoop項(xiàng)目誕生。Hadoop其最初只是雅虎公司用來(lái)解決網(wǎng)頁(yè)搜索問題的一個(gè)項(xiàng)目,后來(lái)因其技術(shù)的高效性,被ApacheSoftwareFoundation公司引入并成為開源應(yīng)用。Hadoop本身不是一個(gè)產(chǎn)品,而是由多個(gè)軟件產(chǎn)品組成的一個(gè)生態(tài)系統(tǒng),這些軟件產(chǎn)品共同實(shí)現(xiàn)全面功能和靈活的大數(shù)據(jù)分析。從技術(shù)上看,Hadoop由兩項(xiàng)關(guān)鍵服務(wù)構(gòu)成:采用Hadoop分布式文件系統(tǒng)(HDFS)的可靠數(shù)據(jù)存儲(chǔ)服務(wù),以及利用一種叫做MapReduce技術(shù)的高性能并行數(shù)據(jù)處理服務(wù)。這兩項(xiàng)服務(wù)的共同目標(biāo)是,提供一個(gè)使對(duì)結(jié)構(gòu)化和復(fù)雜數(shù)據(jù)的快速、可靠分析變?yōu)楝F(xiàn)實(shí)的基礎(chǔ)。
 
  2008年末,“大數(shù)據(jù)”得到部分美國(guó)知名計(jì)算機(jī)科學(xué)研究人員的認(rèn)可,業(yè)界組織計(jì)算社區(qū)聯(lián)盟(ComputingCommunityConsortium),發(fā)表了一份有影響力的白皮書《大數(shù)據(jù)計(jì)算:在商務(wù)、科學(xué)和社會(huì)領(lǐng)域創(chuàng)建革命性突破》。它使人們的思維不僅局限于數(shù)據(jù)處理的機(jī)器,并提出:大數(shù)據(jù)真正重要的是新用途和新見解,而非數(shù)據(jù)本身。此組織可以說(shuō)是最早提出大數(shù)據(jù)概念的機(jī)構(gòu)。
 
  2009年印度政府建立了用于身份識(shí)別管理的生物識(shí)別數(shù)據(jù)庫(kù),聯(lián)合國(guó)全球脈沖項(xiàng)目已研究了對(duì)如何利用手機(jī)和社交網(wǎng)站的數(shù)據(jù)源來(lái)分析預(yù)測(cè)從螺旋價(jià)格到疾病爆發(fā)之類的問題。
 
  2009年中,美國(guó)政府通過(guò)啟動(dòng)Data.gov網(wǎng)站的方式進(jìn)一步開放了數(shù)據(jù)的大門,這個(gè)網(wǎng)站向公眾提供各種各樣的政府?dāng)?shù)據(jù)。該網(wǎng)站的超過(guò)4.45萬(wàn)量數(shù)據(jù)集被用于保證一些網(wǎng)站和智能手機(jī)應(yīng)用程序來(lái)跟蹤從航班到產(chǎn)品召回再到特定區(qū)域內(nèi)失業(yè)率的信息,這一行動(dòng)激發(fā)了從肯尼亞到英國(guó)范圍內(nèi)的政府們相繼推出類似舉措。
 
  2009年,歐洲一些領(lǐng)先的研究型圖書館和科技信息研究機(jī)構(gòu)建立了伙伴關(guān)系致力于改善在互聯(lián)網(wǎng)上獲取科學(xué)數(shù)據(jù)的簡(jiǎn)易性。
 
  2010年2月,肯尼斯?庫(kù)克爾在《經(jīng)濟(jì)學(xué)人》上發(fā)表了長(zhǎng)達(dá)14頁(yè)的大數(shù)據(jù)專題報(bào)告《數(shù)據(jù),無(wú)所不在的數(shù)據(jù)》。庫(kù)克爾在報(bào)告中提到:“世界上有著無(wú)法想象的巨量數(shù)字信息,并以極快的速度增長(zhǎng)。從經(jīng)濟(jì)界到科學(xué)界,從政府部門到藝術(shù)領(lǐng)域,很多方面都已經(jīng)感受到了這種巨量信息的影響??茖W(xué)家和計(jì)算機(jī)工程師已經(jīng)為這個(gè)現(xiàn)象創(chuàng)造了一個(gè)新詞匯:“大數(shù)據(jù)”。庫(kù)克爾也因此成為最早洞見大數(shù)據(jù)時(shí)代趨勢(shì)的數(shù)據(jù)科學(xué)家之一。
 
  2011年2月,IBM的沃森超級(jí)計(jì)算機(jī)每秒可掃描并分析4TB(約2億頁(yè)文字量)的數(shù)據(jù)量,并在美國(guó)著名智力競(jìng)賽電視節(jié)目《危險(xiǎn)邊緣》“Jeopardy”上擊敗兩名人類選手而奪冠。后來(lái)紐約時(shí)報(bào)認(rèn)為這一刻為一個(gè)“大數(shù)據(jù)計(jì)算的勝利。”
 
  2011年5月,全球知名咨詢公司麥肯錫(McKinsey&Company)肯錫全球研究院(MGI)發(fā)布了一份報(bào)告——《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)新領(lǐng)域》,大數(shù)據(jù)開始備受關(guān)注,這也是專業(yè)機(jī)構(gòu)第一次全方面的介紹和展望大數(shù)據(jù)。報(bào)告指出,大數(shù)據(jù)已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)。報(bào)告還提到,“大數(shù)據(jù)”源于數(shù)據(jù)生產(chǎn)和收集的能力和速度的大幅提升——由于越來(lái)越多的人、設(shè)備和傳感器通過(guò)數(shù)字網(wǎng)絡(luò)連接起來(lái),產(chǎn)生、傳送、分享和訪問數(shù)據(jù)的能力也得到徹底變革。
 
  2011年12月,工信部發(fā)布的物聯(lián)網(wǎng)十二五規(guī)劃上,把信息處理技術(shù)作為4項(xiàng)關(guān)鍵技術(shù)創(chuàng)新工程之一被提出來(lái),其中包括了海量數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘、圖像視頻智能分析,這都是大數(shù)據(jù)的重要組成部分。
 
  2012年1月份,瑞士達(dá)沃斯召開的世界經(jīng)濟(jì)論壇上,大數(shù)據(jù)是主題之一,會(huì)上發(fā)布的報(bào)告《大數(shù)據(jù),大影響》(BigData,BigImpact)宣稱,數(shù)據(jù)已經(jīng)成為一種新的經(jīng)濟(jì)資產(chǎn)類別,就像貨幣或黃金一樣。[page]
  2012年3月,美國(guó)奧巴馬政府在白宮網(wǎng)站發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》,這一倡議標(biāo)志著大數(shù)據(jù)已經(jīng)成為重要的時(shí)代特征。2012年3月22日,奧巴馬政府宣布2億美元投資大數(shù)據(jù)領(lǐng)域,是大數(shù)據(jù)技術(shù)從商業(yè)行為上升到國(guó)家科技戰(zhàn)略的分水嶺,在次日的電話會(huì)議中,政府對(duì)數(shù)據(jù)的定義“未來(lái)的新石油”,大數(shù)據(jù)技術(shù)領(lǐng)域的競(jìng)爭(zhēng),事關(guān)國(guó)家安全和未來(lái)。并表示,國(guó)家層面的競(jìng)爭(zhēng)力將部分體現(xiàn)為一國(guó)擁有數(shù)據(jù)的規(guī)模、活性以及解釋、運(yùn)用的能力;國(guó)家數(shù)字主權(quán)體現(xiàn)對(duì)數(shù)據(jù)的占有和控制。數(shù)字主權(quán)將是繼邊防、海防、空防之后,另一個(gè)大國(guó)博弈的空間。
 
  2012年4月,美國(guó)軟件公司Splunk于19日在納斯達(dá)克成功上市,成為第一家上市的大數(shù)據(jù)處理公司。鑒于美國(guó)經(jīng)濟(jì)持續(xù)低靡、股市持續(xù)震蕩的大背景,Splunk首日的突出交易表現(xiàn)尤其令人們印象深刻,首日即暴漲了一倍多。Splunk是一家領(lǐng)先的提供大數(shù)據(jù)監(jiān)測(cè)和分析服務(wù)的軟件提供商,成立于2003年。Splunk成功上市促進(jìn)了資本市場(chǎng)對(duì)大數(shù)據(jù)的關(guān)注,同時(shí)也促使IT廠商加快大數(shù)據(jù)布局。
 
  2012年7月,聯(lián)合國(guó)在紐約發(fā)布了一份關(guān)于大數(shù)據(jù)政務(wù)的白皮書,總結(jié)了各國(guó)政府如何利用大數(shù)據(jù)更好地服務(wù)和保護(hù)人民。這份白皮書舉例說(shuō)明在一個(gè)數(shù)據(jù)生態(tài)系統(tǒng)中,個(gè)人、公共部門和私人部門各自的角色、動(dòng)機(jī)和需求:例如通過(guò)對(duì)價(jià)格關(guān)注和更好服務(wù)的渴望,個(gè)人提供數(shù)據(jù)和眾包信息,并對(duì)隱私和退出權(quán)力提出需求;公共部門出于改善服務(wù),提升效益的目的,提供了諸如統(tǒng)計(jì)數(shù)據(jù)、設(shè)備信息,健康指標(biāo),及稅務(wù)和消費(fèi)信息等,并對(duì)隱私和退出權(quán)力提出需求;私人部門出于提升客戶認(rèn)知和預(yù)測(cè)趨勢(shì)目的,提供匯總數(shù)據(jù)、消費(fèi)和使用信息,并對(duì)敏感數(shù)據(jù)所有權(quán)和商業(yè)模式更加關(guān)注。白皮書還指出,人們?nèi)缃窨梢允褂玫臉O大豐富的數(shù)據(jù)資源,包括舊數(shù)據(jù)和新數(shù)據(jù),來(lái)對(duì)社會(huì)人口進(jìn)行前所未有的實(shí)時(shí)分析。聯(lián)合國(guó)還以愛爾蘭和美國(guó)的社交網(wǎng)絡(luò)活躍度增長(zhǎng)可以作為失業(yè)率上升的早期征兆為例,表明政府如果能合理分析所掌握的數(shù)據(jù)資源,將能“與數(shù)俱進(jìn)”,快速應(yīng)變。
 
  2012年7月,為挖掘大數(shù)據(jù)的價(jià)值,阿里巴巴集團(tuán)在管理層設(shè)立“首席數(shù)據(jù)官”一職,負(fù)責(zé)全面推進(jìn)“數(shù)據(jù)分享平臺(tái)”戰(zhàn)略,并推出大型的數(shù)據(jù)分享平臺(tái)——“聚石塔”,為天貓、淘寶平臺(tái)上的電商及電商服務(wù)商等提供數(shù)據(jù)云服務(wù)。隨后,阿里巴巴董事局主席馬云在2012年網(wǎng)商大會(huì)上發(fā)表演講,稱從2013年1月1日起將轉(zhuǎn)型重塑平臺(tái)、金融和數(shù)據(jù)三大業(yè)務(wù)。馬云強(qiáng)調(diào):“假如我們有一個(gè)數(shù)據(jù)預(yù)報(bào)臺(tái),就像為企業(yè)裝上了一個(gè)GPS和雷達(dá),你們出海將會(huì)更有把握。”因此,阿里巴巴集團(tuán)希望通過(guò)分享和挖掘海量數(shù)據(jù),為國(guó)家和中小企業(yè)提供價(jià)值。此舉是國(guó)內(nèi)企業(yè)最早把大數(shù)據(jù)提升到企業(yè)管理層高度的一次重大里程碑。阿里巴巴也是最早提出通過(guò)數(shù)據(jù)進(jìn)行企業(yè)數(shù)據(jù)化運(yùn)營(yíng)的企業(yè)。
 
  2014年4月,世界經(jīng)濟(jì)論壇以“大數(shù)據(jù)的回報(bào)與風(fēng)險(xiǎn)”主題發(fā)布了《全球信息技術(shù)報(bào)告(第13版)》。報(bào)告認(rèn)為,在未來(lái)幾年中針對(duì)各種信息通信技術(shù)的政策甚至?xí)@得更加重要。在接下來(lái)將對(duì)數(shù)據(jù)保密和網(wǎng)絡(luò)管制等議題展開積極討論。全球大數(shù)據(jù)產(chǎn)業(yè)的日趨活躍,技術(shù)演進(jìn)和應(yīng)用創(chuàng)新的加速發(fā)展,使各國(guó)政府逐漸認(rèn)識(shí)到大數(shù)據(jù)在推動(dòng)經(jīng)濟(jì)發(fā)展、改善公共服務(wù),增進(jìn)人民福祉,乃至保障國(guó)家安全方面的重大意義。
 
  2014年5月,美國(guó)白宮發(fā)布了2014年全球“大數(shù)據(jù)”白皮書的研究報(bào)告《大數(shù)據(jù):抓住機(jī)遇、守護(hù)價(jià)值》。報(bào)告鼓勵(lì)使用數(shù)據(jù)以推動(dòng)社會(huì)進(jìn)步,特別是在市場(chǎng)與現(xiàn)有的機(jī)構(gòu)并未以其他方式來(lái)支持這種進(jìn)步的領(lǐng)域;同時(shí),也需要相應(yīng)的框架、結(jié)構(gòu)與研究,來(lái)幫助保護(hù)美國(guó)人對(duì)于保護(hù)個(gè)人隱私、確保公平或是防止歧視的堅(jiān)定信仰。

責(zé)任編輯:admin