背景介紹
我叫小明,是一個每天喜歡胡思亂想的打工人。
隨著年輕人的創業熱潮的到來,我有一種創業的沖動。經過長時間的探索,我現在萌生出了一個極具創造性的點子,如果以此為依據進行創業的話一定會引起熱潮。
首先,為了確定我的想法是不是獨一無二的,我必須先通過搜索引擎進行查詢。這里有一個我很在意的問題——我在搜索引擎里搜索了我的創意,瀏覽器會將我的創意直接發送給搜索引擎的服務器,如果我的創意確實是獨一無二的,那這樣直白的搜索方式一定會把我的創業完全暴露出來,這對我來說非常致命,我絕對不能讓任何人有竊取我創意的可能。
如何才能保證在不讓搜索引擎知道我具體要查詢什么東西的情況下獲得我想要的數據是我亟待解決的難題。
美國與“創作者經濟”相關的初創公司今年內共籌集超 37 億美元資金:11月1日消息,據 The Information 創作者經濟數據庫的數據,截至 10 月中旬,今年約有 101 家專注于創作者的美國初創公司籌集了超過 37 億美元的資金。雖然第三季度的資金比第二季度有所下降,但連續兩個季度超過 10 億美元的投資使該行業有望在年底前籌集超過 50 億美元的新資金。[2021/11/1 6:24:21]
簡單做法
我的第一個主意是將搜索引擎中所有的數據全部下載下來,將原來的在線查詢轉換成為本地查詢。這就意味著我不用將我的點子發送給服務器端,我就可以充分地保護好自己的隱私了。
不過我還得考慮到另外一個問題,搜索引擎的服務器可是有pb級別的數據量,我下載下來就得花費我幾天的時間,另外我還得專門再去買幾塊大容量的硬盤,這對我來說實在是太過于昂貴。
大連“創新特區”:重點引進區塊鏈等項目:8月18日消息,大連自貿片區今日發布并實施《中國(遼寧)自由貿易試驗區大連片區(大連保稅區)產業創新特區建設方案》,用高水平制度創新推動“產業創新特區”建設。《方案》指出,大連自貿片區將圍繞4個產業園區,重點培育創新創業型企業,促進創新成果產業化,提高創新鏈整體效能,其中數字信息產業園將重點引進云計算、大數據、區塊鏈等項目。(大連發布官方微信公眾號)[2021/8/18 22:22:36]
分?桶
我換了一個想法,既然沒機會直接把搜索引擎的數據庫都給扒下來,我就試著扒下來一部分數據,然后我再本地查詢,這樣對我來說,準備的硬盤也可以少一點。
比如說,我本來想要查詢的數據是“小明是大帥哥”,這樣無疑就向搜索引擎公司暴露我是帥哥的隱私了,那我就可以換一種方式,我就查詢“大帥哥”,這樣我收到的數據雖然有很多都是我不想要的,但是里面卻會包含“小明是大帥哥”的搜索內容。這樣,我就將全部的數據庫下載換成了部分數據庫的下載。獲取部分數據庫內容以后我就可以本地再去查詢了。
Coinbase承諾將10%的資源用于“創新押注”:Coinbase首席產品官Surojit Chatterjee在一份聲明中表示,Coinbase正在采取一種新的創新方法。Chatterjee表示,該交易所將投入10%的資源支持“顛覆性創新押注”。(The Block)[2021/4/22 20:45:27]
這里用到了數據“分桶”的預處理技術,用于減少次要觀察誤差的影響,是一種將多個連續值分組為較少數量的“桶”的方法。
隱私性保護
分桶的做法雖然很好,但是無疑向數據庫泄露了部分隱私,比如“大帥哥”這個信息,雖然服務器沒有獲知“小明是大帥哥”這個隱私,但是無疑泄露了我對“大帥哥”相關信息比較感興趣,我不想為了保護我的具體隱私讓服務器產生其他的誤解。
我只能換一種方式,傳統的隱私查詢技術給了我一點提示。
▲?背景說明
聲音 | 新華網:深圳打造區塊鏈“創新高地”:新華網今日發布題為《深圳打造區塊鏈“創新高地”》的文章稱,推出區塊鏈電子發票,上線“深圳四部門信息情報交換平臺”,中國人民銀行貿易金融區塊鏈平臺項目平穩運行……在區塊鏈的“新賽道”上,改革開放的前沿陣地深圳正不斷深化布局、推動應用,致力成為區塊鏈全球產業鏈技術鏈的高地。[2019/11/23]
傳統的隱私查詢技術對于數據保存結構有特殊的要求:首先數據庫得是公開的,即我可以隨時調取查看服務器里的任何數據;其次,在很多個服務器上都得部署完全相同的數據庫;再者,這些部署了數據庫的服務器互相之間不能溝通;最后,假設數據庫擁有n個數據X?、X?…?Xn,那么在數據庫中其存儲形式為一個n維向量。
▲?簡單技術方案
如果我現在需要的是數據Xi,那么其實我應該做的事情很簡單,就是自己生成一個n維向量,只在第i個位置放1,其余的所有位置都放0,很明顯的,這個時候我生成的這個向量和數據庫里的向量內積就可以獲得結果Xi。
人物 | 迅雷CEO陳磊憑“迅雷鏈“獲中國雙創領袖峰會“創業貢獻獎”:近日,“2018年首屆中國雙創領袖峰會”在福建廈門舉行,迅雷集團CEO、網心科技CEO陳磊憑借其個人、迅雷及網心科技對于創新企業的扶持和貢獻,榮獲“創業貢獻獎”。據了解,陳磊于2014年加入迅雷,并創立專注共享計算和區塊鏈的團隊網心科技,網心科技將主要發展方向轉移至區塊鏈底層技術,并于2018年4月,推出了擁有百萬TPS,秒級出塊能力的區塊鏈主鏈“迅雷鏈”。 此前陳磊有關區塊鏈發出“不要把區塊鏈放在實驗室里,而是應用到實際當中”、“區塊鏈給了中國一個超越美國的機會”等的思考,他表示,每一位踏踏實實做事的區塊鏈人,都不應該被辜負。[2018/10/15]
但是這樣會存在一個問題,我如果直接將我的向量發送給服務器,他們明顯就知道我需要的是什么數據了,那我只能通過另外一種方式來保護我的隱私,將我的向量拆分。如果我把我生成的向量記為r,假設有k個服務器,注意這里k≥2,那么我只用將r拆分成為k個向量即可。更具體的,我可以拆分為:
然后將每個分量ri發送給一個服務器。然后服務器自己本地求內積,將結果發送給我,我收到k個結果后求異或就可以復原出Xi的值了。
通過算法描述,相信大家也能理解為什么服務器一定需要大于兩個,而且這些服務器之間還不能互相溝通。如果服務器之間互相可以溝通的話就可以復原出我的查詢r了。
這個算法有一個很致命的問題,就是我生成的查詢r其實是和服務器的數據大小一樣大的,如果服務器有幾千億的數據,我的r就得有幾千億維,并沒有降低網絡消耗,而且更糟糕是,我得生成很多份分量,而每個分量的大小都和數據庫一樣大,這種方式無疑比直接下載數據更加龐大。
▲?優化技術方案
因為巨大的傳輸量,我們現在可以對服務器的數據保存方式進行改進,原先的保存方式為向量,現在可以改進為矩陣,假設數據庫有25個數據,那么數據將會變成如下形式
我們此時生成的向量就可以從原來的25維縮減到5維,例如我們需要的數據是,在矩陣的第一行,那我們就可以生成查詢,此時服務器內積后會將第一行返回給我們。
同之前的方案,我們不能直接將查詢r發送給服務器,還是需要進行拆分,然后發送給服務器。同樣的流程過后我們就能第一行元素。這樣對每個服務器我們上傳的數據量為一個5維向量,下載量也同樣是一個五維向量,同時,對于每個服務器來說,他們并不知道我們最后拿到的是哪一行。
這個方案的數據總傳輸量為2k√n,這里的n為服務器擁有的總數據量,k為服務器個數,通常,只需要兩個服務器就能達到安全性的要求,故總傳輸量4√n。
在數據量大于16的情況下,這個策略的數據傳輸量已經小于直接傳輸整個數據庫的數據量了。
▲?再進階做法
我按照之前的想法在搜索引擎里查詢了一下我的創意,發現里面并沒有相關內容。我正準備慶幸沒有別人做了和我相同的事情的時候,我的朋友張三麻子和我說我用的搜索引擎查詢的結果可能不會很準,推薦了一個相關的收費網站給我,這個網站可以查詢到全球所有公司以及其具體業務模式。不過他們是按照查詢條數收費的,故不可能像搜索引擎那樣隨便讓我下載資源了。這個時候我的查詢數據需要隱私,同時他們的數據庫內容也需要隱私。
這個時候可以對之前的算法進行進一步升級,將服務器從2個擴展為4個,我同時發起行查詢和列查詢。比如我需要的數據,在矩陣里的第一行第三列,那么我就會進行第一行與第三列的查詢。行列查詢都分別拆分兩個分片,這樣總共有4種組合可能,四個服務器分別選取其中一種組合本地進行計算。這樣服務器便只會發送混淆后的一個元素回來,不會暴露自己的任何額外信息。
討論及總結
以上的算法有一個很關鍵的問題,即我知道我需要的數據是數據庫中的第幾個元素,但是通常情況下,這樣的查詢方式是不現實的。更為普遍的查詢方式為k-v查詢,即我依據某個k去數據庫查詢其對應的v。
例如,我去搜索引擎里搜索“我是大帥哥”,此時k就是“我是大帥哥”,百度返回的搜索結果就是其對應的v。如何將傳統的隱私查詢技術進行升級以配適現實生活中的實際場景仍需要進一步的探索。
數據安全是現在從個人到國家都非常重視的領域,如何將我們的隱私數據安全的使用起來也是我們一直以來努力的方向。
作者簡介
劉毅恒
來自趣鏈科技數據網格實驗室BitXMesh團隊,一個鮮為人知的程序員
導讀: 大衛·喬姆是一位在40多年里不斷推動網絡隱私保護和價值互聯網的全球頂尖的密碼學家,公認的“加密貨幣之父”和區塊鏈奠基人。以他至今已取得的成就和傳奇經歷,一大厚本傳記來講述都不夠.
1900/1/1 0:00:00來源:澎湃新聞 作者:崔珠珠 北京時間5月13日,特斯拉CEO埃隆·馬斯克在推特上表示,由于擔心比特幣開采需要大量耗能會給環境帶來負擔,特斯拉已經暫停使用比特幣購買汽車.
1900/1/1 0:00:00基礎介紹 最近,關于以太坊上的Layer2為應用程序和用戶提供的安全等級引起了很多爭論。這給側鏈和匯總帶來了一些問題,以及不同的擴展解決方案如何與以太坊主鏈交互.
1900/1/1 0:00:00來源:鏈得得 作者:宋宋 1月,比特幣機構投資公司紐約數字投資集團就“比特幣回報的地理驅動因素”發布了一篇研究文章.
1900/1/1 0:00:005月7日消息,去中心化計算平臺DFINITY啟動互聯網計算機,將公共互聯網轉變為去中心化的全球計算機.
1900/1/1 0:00:00灰度的比特幣信托作為衡量機構對比特幣興趣的基準,是有原因的。灰度不再是投資者的唯一選擇灰度的數字貨幣投資產品是唯一為對沖基金、捐贈基金、養老基金和家庭辦公室提供的一種接觸到比特幣,而不需要他們自.
1900/1/1 0:00:00