在德國隊7:1大勝巴西之前,德國足球俱樂部在日常訓練中引入大數(shù)據的例子是涂子沛在演講時常講的內容。在德國隊捧得大力神杯之后,這個例子還會在涂子沛的講座中更多地出現(xiàn)。
涂子沛,是數(shù)據工作者,也是暢銷書《大數(shù)據》的作者。今年5月,他的新書《數(shù)據之巔》上市?!按髷?shù)據不只是科技問題,已經涉及社會管理等各個方面,這本新書的初衷是想把大數(shù)據這個現(xiàn)象放在歷史的縱軸上、通過國際對比,把它分析透?!蓖孔优鎸χ袊萍季W說,他希望能夠通過歷史的比對,找出中國的優(yōu)勢在哪里、差距在哪里,以及下一步該怎么做。
美國的數(shù)據文化是如何形成的
美國的數(shù)據文化對歷史發(fā)展?jié)撘颇挠绊懽饔檬恰稊?shù)據之巔》的一條主線。從美國建國之初,人口普查就在美國的制度建設上起到了重要作用;在南北戰(zhàn)爭時期,人口普查的結果也直接影響了戰(zhàn)爭的發(fā)展;《紙牌屋》之前,1930年代好萊塢就在用統(tǒng)計結果來決定劇本及主角人選……
“人口普查一直都是驅動美國社會大數(shù)據發(fā)展的一條主線,世界上第一臺商業(yè)計算機也是為美國人口普查服務的。但這些歷史從來沒有很系統(tǒng)地分析和介紹到中國來?!蓖孔优嬲f。為了完成寫作,涂子沛把美國的人口統(tǒng)計史、農業(yè)統(tǒng)計史、工業(yè)統(tǒng)計史全看了一遍。有人評價說,涂子沛是從用數(shù)據重寫了美國歷史。
利用網絡、書籍和檔案3個渠道,涂子沛在美國找所需的材料并不困難?!肮矆D書館是免費開放,需要的小眾圖書在亞馬遜上也能夠買到,它有二手書的交易平臺?!痹谒鸭牧系倪^程中也這位大數(shù)據專家感受到了中美在數(shù)據文化方面的差距,“我們的歷史資料數(shù)字化和美國相比存在差距,而大數(shù)據需要的是電子化的數(shù)據?!?/p>
日本可以,中國為什么不可以
《數(shù)據之巔》雖是以美國為主體,但全書中最讓涂子沛感動的卻是書中日本如何在二戰(zhàn)后快速崛起的部分——日本企業(yè)在戰(zhàn)后在美國“質量管理之父”愛德華茲·戴明的幫助下應用統(tǒng)計方法改善全面提升了產品質量,并在短時間內創(chuàng)造了經濟奇跡。
豆瓣上有讀者評論說,看到這章時“眼淚嘩嘩的”,而這個部分涂子沛是也留著眼淚寫完的。為了把這章寫完,涂子沛查閱了幾乎所有關于戴明的傳記,他聯(lián)系了每個傳記作者,甚至電話聯(lián)系了戴明的女兒,向她查證一些歷史舊事。
“我寫這個故事的時候,我想了很多,我想我們應該想一想,問一問,日本行,中國為什么不行?!蓖孔优嬲J為,日本15年崛起,有兩個答案,一是用好數(shù)據,二是他們的學習的精神,這也是最關鍵的?!耙姓J自己不行,正心誠意的想西方學。中國近代史的幾百年,一直拒絕西方文明,普世價值具有普世性,不能拒絕。”
書中第五章開頭,涂子沛引用了陳獨秀的話,“吾敢斷言曰:倫理的覺悟,為吾民最后覺悟之最后覺悟?!标惖囊馑际? 中國不僅要學科技、還要學制度、最后要學倫理?!?/p>
希望影響政策決策者和企業(yè)管理者
第一本書《大數(shù)據》,涂子沛兼職寫了8個月,而《數(shù)據之巔》,辭去工作的涂子沛用了整整8個月的時間。“大數(shù)據很新、很熱、很重要,我感覺有義務、有一種使命感要把這個話題在中國社會說清楚?!稊?shù)據之巔》在戰(zhàn)略和頂層設計的層面上為大數(shù)據的建設提供了思路、指出了我們的差距?!蓖孔优嫦M@本書能夠影響政策的決策者和企業(yè)管理者。
涂子沛為“之巔”設計了三層含義。第一層含義是政策維度,大數(shù)據是人為的現(xiàn)象,因此建設好需要頂層設計。第二個含義是技術維度,使用數(shù)據的巔峰的形式是什么?是讓機器自動的處理數(shù)據使用數(shù)據,邁向智能社會。第三層是文化維度,是站在數(shù)據的巔峰,看數(shù)據是如何興起的。
“科技符號轉化為文化符號是這本書的使命,科技符號是精英的符號,是小眾的符號,文化符號是大眾的符號,要讓數(shù)據這個小眾的符號變成大眾的符號,要讓數(shù)據的文化的意識,要根植到大眾的意識中,讓大家都來使用數(shù)據,用數(shù)據說話,用數(shù)據決策、用數(shù)據管理。”涂子沛說。
問答精選
問:搜集數(shù)據和分析數(shù)據哪一更困難?
答:兩個都難,只是難點在不同的地方,搜集數(shù)據需要的是廣度、分析數(shù)據需要的是深度、精度。搜集數(shù)據更花時間。好比寫作,要用一桶水,就要有10桶水,很多時候,海量的材料中,真正有用的只有一句話。
問:下一本書寫什么?
答:下一本書要承接《數(shù)據之巔》的話題,大數(shù)據未來會推動我們的社會邁向智能社會,我會寫中國和美國在邁進智能社會中的種種挑戰(zhàn),以及如何應對,將從政策、經濟、文化這3個維度上來分析這個問題。
問:國內的大數(shù)據還有哪些比較欠缺的地方?
答:使用數(shù)據的意識、分析數(shù)據的工具、開放數(shù)據的理念,這些都是比較欠缺的。我們還沒有用數(shù)據說話的習慣,我的第一本書,說我們是“差不多民族”,我們的民族講究含蓄,不求精確,我們的邏輯性、精確性、理性思考的水平都偏低,這都是缺乏數(shù)據文化的表現(xiàn)。數(shù)據文化首先是尊重事實,其次是追求精確。數(shù)據是事實中最尖銳、最精確的事實,你用文字描寫的事實,就是沒有用數(shù)據描寫的精確,再次是推崇邏輯和理性。
問:影響中國大數(shù)據應該的問題有哪些,如何化解
答:企業(yè)基于數(shù)據的投資有幾個特點,首先,這種投資有不確定性,回報的不確定性。我們經常講啤酒和尿布的例子,但我們在投資的時候不確定能獲得這樣的結論,想大海尋寶一樣,讓管理者猶豫要不要投資。第二,就是基于數(shù)據的回報是分散的,分散在企業(yè)的各個環(huán)節(jié),很難計算他的回報。分散性和不確定性導致了企業(yè)在投資時猶豫。此外,數(shù)據化的管理是基于精細化管理,我們缺乏數(shù)據文化,一個原因是我們的社會還比較粗放,還沒到精細化競爭的階段,但我們在逐漸邁入這個階段,西方已經進入了這個階段。
問:對于大數(shù)據的發(fā)展有沒有擔憂
答:會有擔心,第一個是隱私。第二,常常越精確的東西就越脆弱,我們的數(shù)據都存儲在云中,一旦計算機停止運行了,那我們的城市也會停止運行。人犯錯是個錯誤,計算機犯錯那就是個災難。人對機器的依賴越來越嚴重、人機共生的關系越來越明顯、人對手機的使用到底是提高了效率,還是降低里效率?這些問題,會引導我們去向哪里,我們還說不清楚,需要更多的研究。
問:對美聯(lián)社利用機器自動寫稿怎么看
答:這是人工智能在新聞媒體的應用,也是我下一本書探討的問題,因為人工智能的應該越來越多的崗位要被機器取代。但以后還是一定需要記者的,人工智能完成的是一個最基本的工作,到時候會更需要優(yōu)秀的記者。它替代的是最平庸的,最簡單的,重復性最多的工作,這意味著記者的總群體將會收縮。