《大資料時代》之後

NO IMAGE
現在想想也不記得當時是怎麼找到《大資料時代》這本書的,好像是在查詢資料庫方面的書,看到亞馬遜推薦的書裡有這本,發現最近才出版的就買一本回來看看。

然而這個過程中,其實自己已經得到了大資料帶來的影響。
我的瀏覽記錄被亞馬遜監視著,根據這些記錄它們尋找和我瀏覽記錄相關(同類)的書籍,預測我會看它們的可能性比較大,於是在亞馬遜給我的推薦書目裡,就多了一本大資料時代。而我買了這本書,亞馬遜就會認為我看這方面的書的可能性會更大,於是會更多的給我推薦這方面的書。以此迴圈,構成了一個資料的閉環反饋系統。如果對於要尋找某一方面的書,亞馬遜的會幫我們找到我們想要的書,即使在一開始我們不知道我們想看什麼。這可能也幫我們在挑選書籍中,減少了很多工作量。如果看書的分類不清晰,可能亞馬遜也會比較頭疼。但它還是會根據我們最近的瀏覽記錄,來給我們推薦相關的書。
確實,在亞馬遜的這套推薦系統中,讓我找到了很多以前自己不知道的感興趣的書,如果說畢業後看書多了,亞馬遜在這裡應該也有不少貢獻。而這,僅僅是大資料時代下,預測開始的一部分。而這已經在“潤物細無聲”的情況下,影響了我們的生活。亞馬遜也因這套系統,多賣了很多書。噹噹、京東和亞馬遜比起來,前兩者是我們在一個巨大的書店裡找自己書(噹噹最近沒怎麼用過不清楚,京東是這個樣子,百度的推薦有些像亞馬遜的推薦系統),最後一個則是像有一個管理員根據我們看過的書,然後給我們推薦一些相關的他(她)認為我們可能會看的書。一個是我們找書,一個是書找我們。拿風老前輩的話說就是“料敵機先,出手無招”。
由此,大資料時代,我們的消費記錄被電商監視著,我們的瀏覽記錄被百度(google)監視著,我們的社交網路被QQ、人人、監視著,我們的心情被QQ狀態監視著,我們使用的軟體被360監視著,我們的位置被聯通移動監視著,根據這些預測我們自己的一些事情,有些已經成為現實,有些將成為現實。這勢必會像以前的網際網路改變溝通方式一樣,改變我們的生活方式。
而這,還只是我們現在能直接看到的影響。
在《大資料時代》中指出,大資料必將影響我們的生活,工作和思維方式。
這裡邊引發這些的根本是,關係的變革,從因果到相關(即從一種的必然聯絡,轉變到可能聯絡)。
當少量資料的時候大腦處理因果比較方便,因此選擇了因果。當大量資料出現的時候,大腦已經不可能在如此多的資料中尋找因果,只能以相關取代。如果有些問題,必須找出因果,也是先確定了相關關係,在此之下,繼續探尋。即,找到資料中的聯絡,至於引發聯絡的背後的原因,在很多時候已經不會像以前那麼重要了。
而現在,一些公司所做的也就是這些。亞馬遜的薦書系統,google的翻譯和預測,IBM的預測,百度的推薦網站,QQ的好友推薦,Farecast的機票預訂,它們是根據它們獲得的資料,預測出結果,然後應用;它們並不會去花時間去探究裡邊的深層次原因,因為它們已經得到了它們想要的東西,而且那將是十分困難甚至沒有因果關係的。
前兩天在《第一財經週刊》上看到的《TED上的少年們》他們的學習方式以及由此做出的成果。他們沒有專業背景,只是因為對哪裡感興趣就到Google上,搜尋自己想要的資料,然後動手做實驗。就是在這樣的情況下,完成了可以和專業人員相提並論的成果。甚至於有些方面,在成年人想不到的地方,找到解決之道。究其原因,在於成年人尤其是有專業背景更傾向於從因果中找答案;而那些TED少年們則是從網際網路上找到相關的資料,進行分析與試驗。縱然很多對於成年人來說很幼稚,但是卻不會落下可能的答案。好似演化過程中,成年人更多的是正常演化,TED少年們則屬於突變型的。縱然突變型很多會消亡,但是能但來變革性影響的,也是來自突變型。現在,大量的知識在網際網路上都能輕易找到答案,對於知識的儲存已經不是最關鍵的,最關鍵的是如何去找到這些知識。即,記憶在當下已經近於過時,因為知識的增長量每年將會翻好幾翻,相比於記住那些知識,如何去找到這些知識就顯得更為重要。由此,保持一個學習力,隨著時代的發展不斷獲取新的知識,遺忘舊的知識,在需要的時候學習需要的知識,保持創造力,保持思考力。這是大資料時代的必然要求。
當然在這個過程中,也並非都是積極的影響。大資料本身帶來的影響沒有好壞,只在於使用它的人。
注:
1、這裡指因果是一種必要條件,相關指相關程度。
2、學習力:自學能力;創造力:從不相關的資料中,找到相關,找到需求;思考力:對外的思考,對內的思考,處於這個系統中的反饋部分,指導以後的行動。
參考:
1、《大資料時代》
2、《TED上的少年們》http://www.cbnweek.com/yuedu/ydpage/?raid=2983