【重磅】世界區塊鏈組織首席科學家白碩:區塊鏈技術與資料隱私講座

【重磅】世界區塊鏈組織首席科學家白碩:區塊鏈技術與資料隱私講座
1 Star2 Stars3 Stars4 Stars5 Stars 給文章打分!
Loading...

【重磅】世界區塊鏈組織首席科學家白碩:區塊鏈技術與資料隱私講座

本講座選自世界區塊鏈組織首席科學家白碩於2018年3月29日在清華大資料“應用·創新”系列講座上所做的題為《區塊鏈技術與資料隱私》的演講。

演講全文:

白碩:非常榮幸回到母校,跟大家分享區塊鏈這樣一個非常熱的話題。區塊鏈在前面,隱私在後面,但是大家都知道中國人總是喜歡把修飾語放在前面,把中心語放在後面。隱私應該是資訊發達到一定程度,中國人才把隱私的概念提到日程上。

但是中國高速發展的這些年以後,很快就進入了要講隱私的時候。恰好我們遇到了網際網路,網際網路很快形成了一個資料寡頭壟斷資料的格局。沒幾年,這些大的網際網路公司就非常有名,他們掌握的資料資源非常的雄厚。

美國對這件事有一個很有意思的評論:網際網路的pain,區塊鏈的luck。翻譯成中國網際網路之痛區塊鏈之幸。

1、區域鏈能做什麼?

區塊鏈和密碼學的結合,能給我們提供解決隱私問題,解決資料寡頭問題的希望。

2、什麼是區塊鏈?

區塊鏈是一塊一塊的資料,一個一個的資料塊。具體的資料是打包在一個區塊裡。

雜湊函式的兩個特點:

第一,單向性。單向性指知道這些數會算起來很容易,但是如果不知道這些數會非常難。

第二,抗插分攻擊。自備量取值哪怕差一個位元,結果都面目全非,防止你用一種猜測學習的方式把它猜出來。

正是因為有這樣的特性,區塊和區塊之間邏輯上就連成了鏈。資料之間通過這樣一種方式,邏輯上連成了鏈,這樣的鏈叫做區塊鏈。

3、區塊鏈的本質

區塊鏈的本質,有人說是去中間化,有人說是躲開了央行,自己選擇發行貨幣。這些都不對,從技術上理解根本辦不了。

對於資料的訴求,實際上是技術方面的訴求。我們希望記下來的東西是不可篡改(撤銷),不可仿冒,不可抵賴,不可亂序。這四個是跟價值沒有關係的,而且基礎的非對稱加密都似曾相似,如RSA、ECC。但加入了不可透支和不可雙花,就進入了價值轉移、價值傳輸的領域。而價值是不同於資訊的,價值有守恆性,資訊可以不守恆,

在價值傳遞、價值轉移的領域裡面,訴求可以歸結為兩點:

第一,不可透支,指沒那麼多錢,不能買值那麼多錢的東西,也就是餘額和要支付的額度之間需要有一個不等式的約束,不夠就不能做。

第二,不可雙花,指一分錢不能花兩次。

智慧合約,可以理解為“讓價值飛一會兒”,本質上是價值轉移,轉移到非你非我的程式手裡。

另外,還有業務訴求,一個是隱私保護,一個是可運營性。

一部分人認為不當得利應該不算,但是我們這裡有不可撤銷,不可篡改的東西都已經存在,他們解決這個問題只有一個辦法就是分杈,即找到一個大家有共識的歷史帳本,然後剔除篡改這筆,繼續往前走。

另外一些人有一個口號叫做程式碼即法,寫出來的法,你知我知,你認我認,你信我信。如果這樣的話,程式碼寫錯了也得將錯就錯,甚至說我不承認寫錯了,黑客得就是應該他得。理念的不同導致整個帳本分裂了還不錯,社群也跟著分裂了。

4、資料共享的痛點

普通老百姓的隱私被侵犯的情況很多,一些機構也有很多的資料在進行合作的時候,顧慮最大的就是資料。

特別強調:在資料主權邊界的附近會出現競合兩種關係,所謂的合就是大家有共享的需求,所謂的競就是大家還都要防範對方去偷自己的,不當或者濫用自己的資料。這是一個很大的痛點,這個痛點如果不好好的解決,資訊化社會它的弊就會大於利。

5、資料主權

第一,抗衡資料寡頭的聯盟制。加盟的機構,甚至個人,他們彼此之間一樣有防範。區塊鏈本身的深化應用也在呼喚隱私和資料主權保護的落地。

第二,既要見證又不看穿。只要我們技術再執著一點,即刻思維再執著一點,就會發現這個訴求不是不可能達到。

第三,點對點、背靠背的資料合作。更多的是用在徵信、評級等領域。我的資料是什麼東西,我不告訴你;你想要什麼,你不告訴你,但是要的那個東西我看不懂;我給你的東西我也看不懂,但是那兩個可以自動的匹配,如果匹配了,我沒看見你的資料,你也沒看見我的真實需求,這種叫點對點背靠背的資料合作。

第四,跟人工智慧的結合。這一波之所以火,主要歸功於深度學習。深度學習做的事情是要資料餵它,它才能產生智慧。餵它的資料可能來自四面八方,可能來自不同的機構,匯聚到一處,經過學習訓練產生智慧。

6、加密數字貨幣場景

現在有加密數字貨幣,如素數幣,比特幣,萊特幣。數字貨幣想讓它既能夠記帳,又不透露帳本的真實內容。首先民間有這個需求,有些賬戶到底轉給誰了,留下來的記錄就是查不出來。比如央行想推出法定的數字貨幣,張三給李四轉賬了,轉賬了多少錢,不能讓旁邊的王五看見,也不能做成像比特幣那個樣子,它的帳目不能是公開的,要保證隱私。歐盟體系,包括英國也有同樣的看法。有這個看法的話,一定要引入隱私保護機制

7、從錯誤印象談起

有兩種觀點:第一,區塊鏈是公開透明的,但只是對賬目而言。第二,區塊鏈是匿名的,但只是對地址而言。所以,不能把隱私問題的希望寄託在現在的區塊鏈技術體系上,需要有新東西。

8、賬戶問題

第一,一個地址的身份同一性無法掩蓋

第二,不同地址之間的關聯交易無法掩蓋

第三,不同地址之間的趨同交易無法掩蓋。

9、賬目問題

第一,法律法規。比如證券交易規定交易資訊不得洩露。

第二,個人權利。合法的主張個人權利,別人只能讓你的權利得到滿足。

第三,無關人迴避。張三跟李四交易,王五要看,但是不看憑什麼記帳,這是兩邊的糾結。

10、有效支付見證

第一,UTXO模型。在比特幣裡面叫UTXO模型,它所謂的幣就是一張一張的面額,比如誰給誰,可以去驗證,是不是真實的人。比特幣的資料結構裡面沒有總的餘額的概念,只有一張一張的支票,然後要現場算。只要可花之和大於它,就可以花。

第二,餘額模型。在以太坊裡面叫賬戶餘額模式,餘額已經算好。

11、交易後業務處理場景(假設)

按照目前的法律,中國結算是最終的資料,是有法律效力的。交易所、證券公司也在記這些資料,但是如果遇到不一致的話,以中國結算的為準。如果這三方能夠把賬記在區塊鏈上,在區塊鏈上直接達成共識,到晚上就是一筆賬,非常清楚。但是,存在兩點問題。

第一,生產關係。中國結算的法律定位跟其他兩方不一樣,如果體現這個法律,大家平等記帳,就體現不了法律記帳。

第二,技術問題。中國結算和交易所拿到的是全本的賬,證券公司只拿到自己客戶交易的單邊賬。對賬就會出現很多問題。

12、供應鏈溯源場景

很多都涉及到溯源的問題,比如農產品,食品,藥品。最初的源頭沿著供應鏈經過簽字一步步走下來,但是公開透明的話,有可能出現一種訴求,即上下游合作方不希望透露。

13、穿透式採購供應鏈融資場景

穿透式的採購供應鏈融資場景,是一個龍頭企業,有大量的採購。比如一個汽車公司,它可能有零配件,一級供應商、二級供應商。如果割斷這些連線,光看這樣一個小公司,它的財力不足。因此,貸款就欠缺依據。但是如果通過穿透來看,它是來自龍頭企業有穩定的現金流,就可以給它增信,使得它的信譽一下子得到它的背書。

在有區塊鏈之前,通常增信只能做到一級,而不能多級穿透。有了區塊鏈就可以多級穿透。在你資金不到位的時候,你可以拿著白條給你生產,但是白條最終會兌換出來資金。有龍頭企業的增信,銀行可以接受去做這個事情。

同樣有個訴求,白條分拆明細不希望被透露。

14、倒金字塔迷局

倒金字塔之謎,即少數公司能夠得到散戶的投資,而多數公司連專業公司都不會投資。區別於沒加入龍頭企業的小公司,償還能力比較穩定,但是有了龍頭企業就可以把它們拎起來,利用金融領域裡邊熟知的一些方式來做。

15、資料交易

大資料交易:資料是不守恆的,價值是守恆的。

裸資料交易(偽命題):資料可複製,授權難掌控,賣資料只能是批量賣,很難去按需賣。

“裸”資料交易的痛點:

第一,擴散。賣出去的資料就像潑出去的水,收不回來。

第二,洩密。不是什麼資料都可以賣,資料是有些區別。

第三,權屬。有些資料是誰的說不清。

第四,孤島。資料窩在手裡增值有限。

16、換個思路賣服務

目前大資料交易普遍存在的思路,就是我們不賣資料,而賣依託資料產生的服務。即把資料X、Y分裝在私慾裡面,我們賣的是函式,就是所謂的使用資料的服務。

17、資料API使用權交易

資料使用權是可以交易的,使用了一筆就賣一筆。但存在自身問題,比如服務被使用了多少次,無法算清。

加上區塊鏈就可以變得更好。首先保持不賣資料賣服務的思路,然後服務被使用了多少次,明算帳,忠實記錄,線上支付。

加上大資料交易,我們不交易資料本身,交易資料使用權。

18、資料融合

資料在封閉空間裡面是原始資料,在開放空間裡是經過了變形,經過函式處理過的資料。那麼,在增值空間裡,這兩個函式就產生了所謂的資料融合的威力。

19、背靠背求交集場景

競爭的基礎條件:不能給對方看到全集

雙贏的基礎前提:要能同對方共享交集

20、做法

一,不靠譜的做法:引入第三方。

二,沒面子的做法:砸硬碟。

步驟一,各帶著硬碟,到一箇中立的場合,使用一臺做的比較乾淨的空機器,然後雙方緊盯著源程式;

步驟二,到現場,現場執行;

步驟三,求出交集,砸掉硬碟。

三,高明的辦法:互相加擾。你的資料你加擾,然後我加。只要我們找到這樣的加擾運算元,就成功了。加擾跟先後順序無關,可交換。有了智慧合約,可以有一箇中立的幫你數。

21、控制場景

入向邊界控制場景:保險公司需要醫院的資料,利用聚合特性,邊界內外分段計算。在邊界內的部分是可核查、可監督的。

出向邊界控制場景:滴滴這些平臺公司都有一個相同的特點,是把所有的資料彙集起來在大平臺上做一些全域性性的匹配、排程、結算。利用無人運維的區塊鏈有可能來做這件事情,但是會有一些風險。資料寡頭的剋星就是這個聯盟,但這個聯盟需要滿足資料背靠背,平臺是無人運營這兩點。但是確實需要一些技術。這和跨境的運營商之間的合作很像。

人們並不介意把資料給一個程式,只要人拿不走就行。

22、匿名評價場景:不刷單

很多大家都在網上購過物,甚至自己都打過好評差評,但是我們知道很多好評差評是刷出來的。評論機制也可以用在信用評分,信用評級,針對單位360度的考核上,但是徹底地不記名。

23、CCP(中央對手方)方案

一,轉出方檢查餘額,維護餘額;二,無關第三方支背書交易,不背書餘額;三,轉入方維護餘額;四,監管方交易/餘額看穿式管理。

24、隱私保護方案

基於CCP的隱私保護方案

缺點是把決策權交給了中央對手方或者是公正人。隱私性是強的,但是中心化也強了。犧牲了去中心化的屬性,去保障了隱私化的屬性。

基於tear-off的隱私保護方案

tear—off是留痕的不同於密碼學上的盲簽名是簽過以後不留根的。稍微有點區別。

基於state channel的隱私保護方案

state channel,是狀態通報。它啟動和結算的賬是明的,但是中間的明細是加密的。

25、密碼學等相關知識

零知識互動與證明。在互動的過程當中,不透露任何實體的資訊,但是讓你相信這些實體的某種關係成立,而且確實成立,有理性的依據成立。

在同態對映下,先運算後加密和先加密後運算結果相同。在無法知曉實體內容的情況下,對實體間關係進行背書。

神經網路是機器學習的基礎,深度學習無非就是多層的神經網路,甚至加上一些迴路的。神經網路經過同態對映之後,是可以在加密的狀態下進行學習。同態之後拿出來,就可以把大家的資料,在密文的情況下進行學習,學習完了再對映回去,這叫同態神經網路。人工智慧黑白雙殺,黑盒子看不見的神經網路,能看見的是知識圖譜。

美中不足的是,它們的工程實現效率還不理想。state channel照顧了中心化的訴求,但是隱私性很差。CCP照顧了隱私性的訴求,但是去中心化差。所以這叫尺有所長,寸有所短。

26、這個領域其實有三種人

一種人在做演算法,資料上純粹【求索】;一種人在做協議,邏輯上清晰【掌控】;一種人在做系統,工程上可行【落地】。

27、開放討論:被遺忘權

被遺忘權指的是我們現在有很多關於我們的資訊出現在網路,想讓它們不出現,做不到。區塊鏈只能證明有,不能證明無。證明無,應該舉證權倒置。

28、總結

第一,隱私和資料主權的保護確實意義重大;

第二,區塊鏈 多方安全計算登場;

第三,落地場景多樣化。

我今天的分享就到這裡,謝謝大家!

 

文:杜佳豪

相關文章

程式語言 最新文章