7月5日,杭州區塊鏈國際周分論壇順利開幕。此次論壇由算力智庫聯合巴比特、海南省大數據管理局、上海人工智能發展聯盟、長三角大數據產業合作聯席會議、新財富等共同舉辦,論壇匯聚了國內外近幾年來在隱私數據與安全計算領域專注耕耘的大廠、金融機構與科技企業重磅嘉賓與專家首次云集,共享數據應用思辯饕餮盛宴,同時,還頒發了2020隱私計算產業30強榜單。
在分論壇中,來自清華大學交叉信息研究院助理院長、副教授,華控清交CTO徐葳發表了題為《隱私計算助力數據成為生產要素》的主題演講,徐葳教授結合自身經歷,從技術角度分享了隱私計算技術如何能夠讓數據成為生產要素,讓生產要素的市場成為閉環的觀點。
以下為巴比特整理的演講全文:
數據是數字經濟的核心生產要素
數據是數字經濟的核心生產要素,這句話我在其它地方得花一些時間來解釋,講一講生產要素是什么,但是我相信在這個論壇上我沒有必要解釋。我想解釋的是數據從科學上來講有什么用,因為有用的東西才是一個生產要素。大家認為數據就是各種信息,實際上是
數據蘊含了信息,數據和信息不太一樣:你能夠看得懂的東西才是信息,看不懂的東西肯定不是信息,而數據有的時候你可以看懂,有的時候卻看不懂。
杭州在元宵節當晚舉辦元宇宙煙花大會:2月6日消息,時隔 11 年,杭州再次舉辦元宵節煙花大會。杭州今年將推出亞運迎新主題煙花秀,燃放地點位于錢塘江南岸奧體中心區域,以“政府放、群眾看”的方式,傳遞新春祝福。煙花秀燃放時間約 30 分鐘,含前后暖場、散場燈光秀時間約 50 分鐘。與此同時,由杭州第 19 屆亞運會組委會、浙江省文化和旅游廳指導,中國電信浙江公司、浙江省文化和旅游宣傳推廣信息中心主辦的“浙里煙火”?杭州亞運 - 元宇宙煙花大會在 2 月 5 日(元宵節)上演。[2023/2/6 11:48:55]
十多年前大家上網都會留下訪問日志,大家并沒有有覺得這些訪問日志有多少價值,因為那個時候分析手段不夠高明,直到Google這些企業分析了這些日志,廣告收入突然提升了,點擊率提升了,單次點擊費用也提升了,大家發現這個東西還可以這么做,所以才有了大數據這么一個行業,大數據和人工智能的算法幫助你挖掘數據、看懂數據,然后把數據轉化成為信息,所以數據的信息是靠加工來的。
加工完成以后大家覺得數據可以挖掘出信息了。信息還有一個特色,它是從理論上衡量企業的一個重要指標。比如說雖然我們沒有見過面,但是你到看我的照片,我說我是一個男的,這個不是廢話么,因為這句話的信息量非常小,并沒有讓你驚訝。那什么會讓你驚訝呢,就是造一個謠,雖然是虛假的信息,但是它讓你驚訝,讓你覺得信息量特別大,所以你就去點了,所以信息是讓你感覺到驚訝的,當然如果是真實的信息讓你驚訝,這個東西就有價值了。
杭州亞運會將利用區塊鏈技術助力門票保真驗真:10月14日,杭州2022年第19屆亞運會、第4屆亞殘運會票務主運營商簽約發布會在杭州舉行。杭州亞運會官方票務網站將于2021年上線公開發售門票。票務官網將結合區塊鏈技術實現所有門票上鏈,讓票務運營數字化有效解決假票問題,實現保真驗真。(中國新聞網)[2020/10/14]
大數據和人工智能能夠幫助你把數據轉化成為信息,但是這個信息你越不知道越好,比如別人的數據藏了什么你不知道的價值和信息,你就會認為它更加有價值,因為它隱藏了更多的信息。
因此,我們認為數據的價值會在流通中增加。數據的流通和信息流通是一樣的,是在流通中體現越來越多的價值。數據是有使用價值的,因此數據流通也不是一個零和游戲。數據在流通當中才能夠體現生產要素的真正價值,我們說到健全數據的生產要素由市場決定貢獻,由貢獻決定報酬的機制,什么叫做市場決定貢獻,你得有供需,有供需才能夠決定價格。但是大家也提到這么久了,數據怎樣流通,數據怎樣確權,但是數據本身和別的生產要素不一樣:第一,它可以復制,復制的成本特別低,所以可以無線的復制。第二,可以重復使用,可以多方使用,勞動力還是土地還是錢都沒有這個特性,第三個特性就是越用越多。所以,從這個角度來說,數據的物理性質和一般的生產要素不一樣,我們沒有辦法從一般的生產要素考慮數據流通的問題。
數據的隱私問題
從最簡單和最樸素的層面來講,這個數據對我的成本是多少錢,高于這個成本才可以賣給你,這個東西成本怎么定價,如說你說你想買我所有的銀行交易記錄,我可以賣給你,但是問題是我肯定不賣,因為我賣給你以后,你和我說你只不過想幫助我申請一張信用卡而已,但是誰知道你拿去干什么用了,因為你幫我申請了信用卡,這個數據可以無限的復制,我哪知道你把我的數據又復制給誰了?以及你把這個復制給其他人以后會怎樣傷害我。所以,對我來說我把數據給了你,我的成本就是所有可能看到數據的人所能夠做出來的所有傷害到我的事情之和,這就是我把數據給你的成本,這個成本聽起來就不可估量了,其實就相當于我就把命交給你了。但是買方可能不是這么想的,一個善意的買方覺得就是給你申請一個信用卡,你哪這么多的事兒,你怎么這么不放心,但是我就是不放心,因為數據的特性導致了你就是可以把它復制給無窮的人傷害我。所以,這個角度來說這筆買賣是沒有希望談成的,因為我的成本比你原本要付的高得多得多,從這個角度來說沒有辦法從市場供需進行定價,所以很難市場流通,這就是問題。
全國40余家企業推出“抗疫”區塊鏈應用 杭州、北京兩地企業最多:區塊鏈技術雖尚未成熟,但在抗疫期間,部分區塊鏈應用已經運用到疫情防控之中。6月29日,《2020中國區塊鏈戰“疫”活動》應用方案征集活動落幕,來自于金融機構、上市公司、學術機構、區塊鏈企業等40余位家單位的應用方案入選優秀案例,區塊鏈應用場景則遍及醫療、慈善、疫情預警與檢測、保險等各個領域。整體來看,全國共有16家省市均有企業推出“抗疫”區塊鏈應用,而在企業數量上,杭州以12家企業居首,北京以9家次之,上海與武漢均為4家。(證券日報)[2020/6/29]
這就直接導致了對社會產生的一些非常不好的副作用,社會上數據的生產者和數據的消費者往往不是同一個人,你得有一個ToC的東西,比如有一個網站、一個博客等等,這樣就有流量,有流量就有數據,但是這些人變不了現,但是數據的消費者肯定沒有數據,因為它不是ToC的,而且中間還有現在數據加工越來越復雜,數據加工的才有信息,你中間還有一堆人去替你整理數據、加工數據。
數據有一個社會化大生產的需求,但是現在因為對于數據交易價值和數據的泄露的擔憂,就影響了它形成這么一個閉環,所以影響了整個社會對數據的效率。當然,一些公司就很牛,比如說阿里、騰訊,他們自己打通了閉環,內部就有這個閉環,也有算法的人,也可以變現,也可以放貸,也有ToC的東西,但是不是社會化生產,是一家公司的壟斷。
所以大家問,如何交易數據,這是本次論壇非常重要的主題,也是大家都在討論的一個事兒,但是從我的角度來說,我認為如何交易數據這個問題本身就是一個偽命題,它無解,所以我們想到的是一個解決方案,就是我們能不能把數據具體承載的信息和計算價值區分開來,因為我拿到的數據真的不是為了拿眼睛看的,因為你看也看不出什么東西來,一定是用于計算的,用于一些算法來加工的。從大量的數據里提煉出來一點點信息,我們可能做到一個事情,就是數據可用不可見,我可以生成我想要的事情,但是我不讓你看到我具體的每一筆銀行交易的記錄,這樣可以避免因為被看見我的具體信息導致了各種各樣的恐慌,把所有成本加在你的頭上。
動態 | 杭州市發布首條政務區塊鏈底層系統“政務服務鏈”:金色財經報道,近日,杭州市數據資源管理局完成了杭州市首條政務區塊鏈底層系統——“政務服務鏈”的搭建和試運行。該區塊鏈系統基本滿足政務對于系統的安全和效率需求,采用了“一主多側”的技術架構,初步布設4個區塊鏈節點,從今年5月開始試運行,6個月來總計出塊300多萬個,并且實際支撐了可信應用場景。目前,該區塊鏈系統已經初步應用于杭州市“最多跑一次”的可信身份認證場景中。[2019/11/20]
如果你沒就看到原來的數據,只是提取了計算價值,我們可以說這是一個數據的特定的用法和用量,我把這個數據用于這個計算,用一次是允許的,但是因為你不能拷貝我的數據,所以你下次用別的計算的時候還得求我,所以數據還是我的,這樣數據的責權利是分開的,我可以把數據的使用權給你,所有權不能給你,因為你不能復制。
我們認為數據交易如果你討論我怎樣把原始數據交易給別人,這個是來回糾纏,無解的,但是數據交易特定使用權,如果這個事情可以實現,那么它也許是解決了絕大多數的數據交易的需求,但是數據特定的使用權怎樣實現,隱私計算我們認為是現在階段看到的最現實的一些方案。
從目的上來看,數據保密技術為了讓除了我想給誰用,這是特定的使用目標,除了這個人之外,其他人都沒有看到,采取的手段就是把數據加密了,一定要藏起來,藏的好好的,用各種各樣奇怪的技術把秘鑰傳遞給數據的使用方,只有使用房能夠把這個數據解開看見,其他人不能,這個解開和明文數據一樣,但是確保別人有看見,目的是把數據藏起來,別給別人看見。但是隱私計算不一樣,隱私計算的核心是不信目標使用者,重點防的是我想把數據給誰和我要數據的那個人,重點防的不是第三方,重點防的是我那個數據使用方,為了實現這個目標,從這個技術實現上,隱私計算需要把數據加密的狀態下讓它能夠計算,不能用數據使用方解開,所以要加密計算,但是得出來的結果要和明文計算是一樣的,最終實現的價值是把數據用起來,而不是把數據藏起來,這是隱私計算和數據保密的區別,數據保密更像是一個保險項,隱私計算更像是一個通風櫥。
因未披露區塊鏈相關消息 杭州高新被深交所關注:據中證報報道,因未披露區塊鏈相關消息,杭州高新被深交所關注。深交所在關注函中要求公司對以下事項進行補充說明: 第一、請公司自查并說明未以公告形式發布上述內容的行為是否違反本所《創業板股票上市規則》第2.1、7.3和7.4條規定。第二、公司關于區塊鏈技術的研究情況,包括人員儲備、研發投入、形成技術、研究計劃等。 第三、公司對區塊鏈技術的實際應用規劃、目標,對公司現階段及未來經營業績產生的影響。 第四、結合目前區塊鏈技術在新能源領域的運用情況以及公司關于區塊鏈技術的研究情況等,補充說明公司在新能源領域運用區塊鏈技術的競爭優勢、市場前景以及相關風險等。[2018/6/1]
隱私計算一定是一個多技術的融合體
接下來給大家講一講技術上的事情,我是一個技術人員,最開始我們做隱私計算始于我在清華的一個研究項目,我是做大數據的,我認為大數據這個東西最難的是怎樣別人把數據給我,密碼學有非常巧妙和非常牛逼的理論叫做隱私計算,恰好解決了大數據的問題,但是這個理論早就有,七八十年代就有卻沒有人用,所以我們一定要做出來,我們一下子就跳到這個坑里,做了好幾年,因為太慢了,算法的實現很麻煩,它不是正常實現程序的思路。所以,我們怎樣能夠讓它提升效率,提升到我能夠接受大數據計算這么做的效率,我怎樣能夠把它定義的加法、乘法之類非常簡單的操作能夠綜合成一套完整的指令集和完整的函數庫,這些事情我們嘗試了很多種不同的隱私計算的協議。我們探索出來這樣一條路,我們覺得這種方法可能是可行的,就是我們孵化了一家公司,這家公司希望能夠把這一系列的成果變成可以用的技術。
在做這個平臺的時候,我們有一些新的體會,我們認為我們是從MPC開始考慮這個問題的,實際上隱私計算的種類有很多種,很多種MPC,MPC有不同的協議,隱私計算也有很多不同的技術,一定是融合的技術來解決問題導向的,不是技術驅動的,所以不是說我有這個技術一定要用這個技術解決什么問題,而是你有什么問題,它是一個綜合的解決方案,這個方案就有點像我非常喜歡數據庫的發展歷程。SQL是我從80年代初開始做的,當時覺得它很慢,也沒有太大用,但是SQL這么多年的發展,大家突然覺得發展速度快了,這是因為有用了各種各樣不同的算法和數據結構在一個數據庫中,每一種可以解決特定場景和特定技術的問題。
所以,到現在其實大家也不清晰數據庫到底有多少種數據結構和算法,隱私計算是一樣的,現在我們也開發了多種MPC的協議適合不同的數據,我們也開發了多種隱私計算的技術,包括聯邦學習、MPC、TE等等,我們集成在一個平臺上,我們希望的是一個程序、一個算法、一個接口適應了各種各樣不同的技術,未來我們會自動的優化到底你的場景中適合使用哪種技術,這樣是多種技術的有機結合的平臺,而不是單一的技術,這是我們在開發和部署、落地這些項目的時候一個最大的感悟。
我們有不同的計算引擎、不同的技術,上面有面向客戶的需求,需求是多種多樣的,客戶信任模型也是越來越不一樣的,當然應用場景更加不一樣,所以在不同的應用場景下,我們應該有什么樣的模塊,這些模塊能夠靈活的組合,適應不同的場景和不同的需求和客戶不斷變化的需求,這是我們認為這一類技術走向產品最核心的要點。
比如說給大家舉個例子,我認為所有的東西越快越好,天下武功唯快不破,怎樣能夠算的更快、怎樣算的更加有可擴展性,我們做了可擴展的計算平臺,比如說左邊這些都是不同的數據源,然后我們在上面聯合做一個查詢,這個查詢用了很多的計算服務器,但是也是一個集群,這些集群我們是橫向擴展的,你需要更多的算力,我們只需要添加服務器就可以了,最終暴露出密文數據結果,這些計算平臺從來沒有看到任何的明文數據。但是繼承了大數據平臺中的可擴展性,不光和明文對接,在密文上實現了可擴展的密文計算框架,所以我們可以跑任意吞吐量的計算,我們可以做大數據的共享開放,政府各個部門之間的數據不打通了,主要是責權利不明,當然政府數據開放肯定是好事情,我們通過這樣的平臺,大家可以在數據用法用量安全可靠的情況下進行這樣的計算,類似的場景在金融、在醫療、在教育、在電子政務、在能源都有很多類似應用,我們認為平臺是最重要的,一個可擴展、可模塊化、可以定制化的平臺是非常重要的,這個平臺里可以集成多種技術。
總結來講,沒有一種單一的技術能解決了一切的問題,在現實中來看,隱私計算一定是一個多技術的融合體,它是一個完整的平臺,這個平臺可以丁志偉各種各樣的事情,通過這樣的平臺,最大的價值是我們八通了數據這種生產要素,在社會化大生產中的閉環,能夠讓不同方消除對數據隱私的不必要的擔憂,讓數據真正的流通起來,讓數據的定價變得更加明確,不是給原始的數據定價,而是給數據的使用權定價,因此我們認為隱私計算技術這一類的技術是能夠讓數據成為生產要素,讓生產要素的市場成為閉環的目前最現實的道路。
今天我的匯報到這里,謝謝大家!
據TheBlock6月30日報道,區塊鏈數據索引項目TheGraph已經籌集了500萬美元,用于建立和啟動索引和查詢區塊鏈數據的去中心化網絡.
1900/1/1 0:00:00作者:Loong 翻譯&校對:閔敏&阿劍 來源:以太坊愛好者 究竟什么是RenVM?在實現鏈間互操作性的時候,為何它能不引入中心化和信任要求?本文將深入探究RenVM.
1900/1/1 0:00:00編者按:2019年9月5日,全球最大的專業技術組織、有著130余年歷史的IEEE設立IEEE計算機協會區塊鏈和分布式記賬委員會,旨在推動區塊鏈與分布式記賬技術的標準化及其應用實踐.
1900/1/1 0:00:00作者:WilliamM.Peaster 譯者:La 校對:Typto 翻譯機構:DAOSquare2014春季,我從西佛羅里達大學的創意寫作學位畢業.
1900/1/1 0:00:00作者|問道 編輯|文刀 6月26日,麥佳知道的受騙者已經達到了21人,“統計下來的被騙金額已經到了1500萬。”2個月前,麥佳落入了一個以談戀愛為名的數字貨幣“殺豬盤”騙局.
1900/1/1 0:00:00礦機第二股億邦國際在6月17日更新了招股書,更新了什么?更新后的招股書公布了2020年一季度的營收狀況,以及將最高募資額度從1億美金提高到1.25億美金。此前嘉楠上市時募資額為9000萬美金.
1900/1/1 0:00:00