大資料的崛起帶來的機遇和挑戰

NO IMAGE

      圍繞大資料的激烈爭論主要圍繞在它是否如預期的一樣好抑或它是否最終只是歸於落寞。自2011年8月開始的被大肆宣傳的谷歌流感趨勢(GFT),加劇了這種擔憂。在我看來,毫無疑問,資料分析有朝一日會對醫療保健、犯罪的監測、設計更完善的產品、改善交通模式以及農業產量起到有效的作用。但我的憂慮在於,在未來的某天,我們如何使用我們所收集到的所有資料——去揭示真相呢?設想一下DNA技術是如何幫助被錯誤關押了數十年的犯人重見天日的?在未來,超級計算機將會如何處理今天的資料採集者們還尚未學會如何使用的資料呢?

       在過去的幾世紀中,我們收集了諸如氣候、人口、商業和政府事務等相關的資訊。農民們記錄天氣來判斷何時播種;我們有土地記錄,這樣我們就可以擁有土地資產;我們開發了手機通訊錄,這樣我們就可以隨時聯絡。在十五年前,我們開始在網際網路上建立web頁面時,一些團體已經開始收集諸如我們喜歡讀什麼樣的新聞,瀏覽什麼樣的網站,聽什麼樣的音樂,去哪裡旅遊這樣的資料了。隨著LinkedIn,MySpace、Facebook、Twitter和其他社交媒體的出現,我們開始熱衷於釋出自己關於工作、社交、商業往來、美食、娛樂、甚至是性取向和精神價值的資訊。

      今天,資料積累速度成倍增加。每一分鐘就有超過100小時的視訊上傳到YouTube上,在你身邊無處不在的全球監控攝像頭所收集到的視訊更是不計其數。手機應用程式跟蹤著我們的每一個動作:我們無論去哪,以何種速度,幾點醒來,都被記錄下來。很快,我們所佩戴的或者已經內建於智慧手機中的裝置,將監測到身體各項功能的執行;我們的DNA序列將揭示軟體處方對身體所產生的作用。

       國家安全域性已經開始挖掘我們的電話後設資料並且偶爾進行監聽;營銷人員根據我們的性別、年齡、教育、地理位置、社會經濟地位來向我們推銷更多的產品;政客們對於他們的競選活動也做了相應的細微調整。

      與未來發展的趨勢相比,上述這些都只是小兒科而已。我們仍然面對這這些問題:用於分析資料可用的工具仍略顯粗糙;傑出的資料科學家寥寥無幾;像谷歌這樣的大公司仍沒有找出什麼是用於分析的最好的資料。然而隨著人工智慧技術和計算機技術的迅速發展,這些狀況一定會隨之轉變。到時我們將能夠分析所有從原初收集到的資料——宛如進入了一個資料的時間機器。

       我們將回顧過去的犯罪案件,再次稽核納稅申報表,追蹤腐敗,辨別誰是歷史上真正的英雄或惡棍。人工智慧cybercop(網路警察)可以幫助我們掃描到來自城市與鄉村每個角落的資料:相機所收集到的資料,電話記錄,電子郵件,銀行卡賬戶,信用卡記錄,醫療資料,利用這些可以立即破獲一個犯罪案件,其辦案效率要遠遠超越福爾摩斯。我們的子孫將知道我們過去所犯過的罪行;小孩子也許會想知道為什麼爺爺對奶奶不忠呢?

       可怕的是,我們將失去我們自己的隱私,同時也為新型的犯罪和詐騙開啟了大門。政府與僱主們將對我們擁有更多的控制權,當我們把這些資訊天真地拱手給出時,一些機構會由此謀取更大的利潤。愈來愈多的資料和電腦意味著愈來愈多的金錢和權利。看看華爾街的銀行家們,他們早已利用這種優勢在高頻交易中盈利了,他們又是如何從我們的金融體系中攫取上億美元的暴利的呢?
我們迫切需要更加強大的法律和技術保護措施。我們需要意識到危險。我們必須意識到我們任何一個不端行為,將無處可藏——甚至它是發生於我們過去生活的。

       在這個資料時代我們有很多機遇。

       想象一下,如果我們讓以下的這些事情成為可能:當我們把一個人的基因、生活習慣、位置和他的病史、藥史相聯絡起來,我們將理解藥物的真正效果及其副作用,這將改變藥物測試和處方管理的方法。當我們可以看到數百萬人的基因資料時,疾病與DNA之間的聯絡也會隨之被發現,這樣就可以開出針對個人的藥物——根據每個人的DNA獨家定製。這將是一場衛生與醫藥的革命。

       在學校,如果班型過大,老師不可能瞭解每一位學生——尤其是學生所學習的其他類課程,習慣,以及多年的發展軌跡。如果一位數學老師可以跟蹤孩子的每一次進步,瞭解他的喜好,偏愛哪一類教學風格,哪些是他獨特的優勢智慧,哪些是他的弱勢智慧?從他的數碼學習機器、考試成績、出勤率、日常習慣等要素中收集到這些資訊,老師將會瞭解到學生在關注什麼,什麼知識需要被強調,如何教育好每一為個性化、獨立的學生的難題便迎刃而解了。這將是對教育體系自身的變革。

       將一個人的購物習慣與其社交偏好,健康狀況,地理位置的資料結合起來,購物助理和個人設計師將會為這名使用者度身定做全新的產品,正如3D印表機列印出的曼妙服飾般神奇。基於人工智慧的個人數字助理可以預測一個人想穿什麼、想吃什麼,並即可為他準備好!

       所有這些場景將會成為可能,就像其他成千上萬的應用程式在農業、製造業、交通等領域已經正在發揮作用了一樣。唯一的問題是我們將多快到達,而這一過程中,又會伴隨著多少噩夢呢?

      (注:本文由OCCS軟體雲工廠進行編譯,轉載請註明出處。)