比特幣行情 比特幣行情
Ctrl+D 比特幣行情
ads
首頁 > SHIB > Info

區塊鏈:a16z:如何通過零知識證明驗證鏈上機器學習算法?

Author:

Time:1900/1/1 0:00:00

原文:a16z

在過去的幾年里,區塊鏈上的零知識證明主要用于兩個關鍵目的:

(1) 通過在鏈下處理交易并在主網上驗證結果來擴展計算受限網絡的規模;

(2) 通過實現屏蔽交易來保護用戶隱私,只有擁有解密密鑰的人才能查看。

在區塊鏈背景下,這些特性顯然是可取的:去中心化網絡(如以太坊)不能在不對驗證者處理能力、帶寬和延遲提出無法承受的要求的情況下提高吞吐量或區塊大小(因此需要有效性滾動),所有交易都對任何人可見(因此需要鏈上隱私解決方案)。

但零知識證明對于第三類功能也是有用的:高效地驗證任何類型的計算(而不僅僅是在鏈下實例化的EVM中的計算)已經正確運行。這對區塊鏈之外的領域也有很大影響。

現在,利用零知識證明簡潔地驗證計算能力的系統的進步使用戶能夠從每一個數字產品中要求與區塊鏈所保證的相同程度的無信任和可驗證性,尤其是從機器學習模型中。區塊鏈計算的高需求激勵了零知識證明研究,創造了具有較小內存占用和更快證明和驗證時間的現代證明系統——使得現在可以在鏈上驗證某些小型機器學習算法。

到目前為止,我們都可能已經體驗到了與一個非常強大的機器學習產品互動的潛力。幾天前,我用GPT-4幫助我創建了一個能連續擊敗我下棋的AI。這感覺像是過去幾十年里機器學習取得的所有進步的一個詩意的縮影:IBM的開發人員花了十二年時間制作出Deep Blue,一個運行在32節點IBM RS/6000 SP計算機上、能每秒評估近2億個棋步的模型,該模型在1997年擊敗了國際象棋冠軍加里·卡斯帕羅夫。相比之下,我花了幾個小時——在我這邊只進行了最少的編碼——就創建了一個能戰勝我的程序。

誠然,我懷疑我創建的AI是否能在國際象棋上擊敗加里·卡斯帕羅夫,但這并不是重點。重點是任何玩弄GPT-4的人都可能在獲得超能力方面有類似的經歷:你只需要付出很小的努力,就可以創造出接近或超越你自己能力的東西。我們都是IBM的研究員;我們都是加里·卡斯帕羅夫。

a16z合伙人:將繼續根據市場機會調整加密基金規模:金色財經報道,針對a16z去年推出規模達45億美元的第四只加密基金,a16z合伙人Arianna Simpson評論稱,生態系統已經發展到絕對支持這種規模的基金,這就是其募集這種規模基金的原因。

當被問及a16z是否會有第五只加密基金時,Simpson表示,“我當然希望如此。”她補充說,a16z將繼續根據其看到的市場機會調整基金規模。

據悉,在加入a16z之前,Arianna Simpson曾創立專注于加密貨幣的投資基金Autonomous Partners。她還幫助推出主要投資于YC公司的早期基金Crystal Towers Capital。(TechCrunch)[2023/4/9 13:52:59]

顯然,這讓人興奮又有些畏懼。對于任何在加密貨幣行業工作的人來說,自然的反應(在驚嘆于機器學習能做什么之后)是考慮潛在的集中化途徑以及如何將這些途徑去中心化,形成一個人們可以透明審計和擁有的網絡。現在的模型是通過吞噬大量公開可用的文本和數據制作的,但目前只有少數人控制和擁有這些模型。更具體地說,問題不是“人工智能是否具有巨大價值”,而是“我們如何構建這些系統,使得與之互動的任何人都能獲得其經濟利益,并在他們希望的情況下,確保他們的數據以尊重隱私權的方式使用”。

最近,有人呼吁暫停或減緩類似Chat-GPT這樣的重大人工智能項目的發展。阻止進步可能不是解決方案:更好的方法是推動開源模型,并在模型提供商希望保護其權重或數據私密性的情況下,使用保護隱私的零知識證明對它們進行保護,這些證明在鏈上并且可以完全審計。如今,關于私有模型權重和數據的后一種用例尚無法在鏈上實現,但零知識證明系統的進步將在未來實現這一目標。

我使用Chat-GPT構建的國際象棋AI在目前看來相對無害:輸出相對一致的程序,不使用侵犯有價值知識產權或侵犯隱私的數據。但當我們想確保我們被告知的在API后面運行的模型確實是運行過的模型時會怎么樣?或者,如果我想將認證過的數據輸入到鏈上的模型中,并確保數據確實來自合法方?如果我想確保提交數據的“人”實際上是人而不是試圖對我的網絡發起拜占庭攻擊的機器人呢?零知識證明及其簡潔地表示和驗證任意程序的能力是一種解決方法。

研究:A16z在區塊鏈方面的投資占金融科技領域的22%:金色財經報道,CB Insights的研究顯示,風投公司紅杉資本和Andreessen Horowitz在2022年對金融科技的投資超過了其他任何類別。紅杉去年總體上投資超過100筆。金融科技占該公司交易的近四分之一。在a16z去年參與的206筆交易中,近四分之一的交易對象是金融科技公司——高于其他任何行業。A16z去年在金融科技領域投資了49家公司,其三大金融科技投資目標是支付(28%)、區塊鏈(22%)和數字貸款(12%)。[2023/2/27 12:30:56]

需要注意的是,目前在鏈上機器學習背景下,零知識證明的主要用途是驗證正確的計算。換句話說,在機器學習背景下,零知識證明和更具體的SNARK(簡潔的非交互式知識論證)最有用的地方在于它們的簡潔性特性。這是因為零知識證明保護了證明者(及其處理的數據)免受窺視者的侵犯。完全同態加密(FHE)、功能加密或可信執行環境(TEE)等增強隱私的技術更適用于讓不受信任的證明者在私有輸入數據上運行計算(更深入地探討這些技術超出了本文的范圍)。

讓我們退后一步,從高層次了解可以用零知識表示的機器學習應用類型(要深入了解零知識,請參閱我們關于零知識證明算法和硬件的改進的文章,查看Justin Thaler關于SNARK性能的研究,或者查看我們的零知識教材)。零知識證明通常將程序表示為算術電路:使用這些電路,證明者從公共和私有輸入生成證明,驗證者通過數學計算來確保此語句的輸出是正確的——而不獲取關于私有輸入的任何信息。

我們仍處于使用鏈上零知識證明驗證計算的非常早期階段,但算法的改進正在擴大可行的范圍。以下是五種在機器學習中應用零知識證明的方法。

1.模型真實性:您希望確保某個實體聲稱已經運行的機器學習模型確實是運行過的模型。例如,在某個模型位于API后面的情況下,提供特定模型的實體可能有多個版本,例如一個較便宜、準確度較低的版本,以及一個較貴、性能更高的版本。沒有證明,您無法知道當您實際支付了更昂貴的版本時,提供商是否為您提供了更便宜的模型(例如,提供商希望節省服務器成本并提高利潤率)。

A16z將前美國CFTC委員Quintenz提升為政策主管:金色財經報道,美國商品期貨交易委員會前委員Brian Quintenz被任命為a16z的新政策主管。Brian Quintenz去年離開該機構,該公司周二表示,Quintenz正擴大他在Andreessen Horowitz(a16z)的作用,從提供咨詢到接管政策主管。

這位前監管者表示,考慮到該行業戲劇性的2022年,他理解一些政策制定者會對數字資產產生懷疑。鑒于市場的情況,他認為把重點放在客戶保護上是非常恰當的。(coindesk)[2022/12/6 21:25:55]

為此,您需要為每個模型實例提供單獨的證明。一個實際的方法是通過Dan Boneh、Wilson Nguyen和Alex Ozdemir的功能承諾框架,這是一個基于SNARK的零知識承諾方案,允許模型所有者承諾一個模型,用戶可以將他們的數據輸入到該模型中,并接收到已經運行的承諾模型的驗證。一些基于Risc Zero(一個通用的基于STARK的虛擬機)的應用程序也實現了這一點。Daniel Kang、Tatsunori Hashimoto、Ion Stoica和Yi Sun進行的其他研究表明,可以在ImageNet數據集上驗證有效的推斷,準確率為92%(與最高性能的非零知識驗證ImageNet模型相當)。

但僅僅接收到已提交模型已運行的證明并不一定足夠。一個模型可能無法準確地表示給定的程序,因此您會希望第三方審核已提交的模型。功能承諾允許證明者證明其使用了已承諾的模型,但不能保證已承諾模型的任何信息。如果我們能讓零知識證明在證明訓練方面表現得足夠好(請參見下面的示例#4),我們將來也可能開始獲得這些保證。

2.模型完整性:您希望確保相同的機器學習算法以相同的方式在不同用戶的數據上運行。這在您不希望應用任意偏見的領域非常有用,如信用評分決策和貸款申請。您也可以使用功能承諾來實現這一點。為此,您需要承諾一個模型及其參數,并允許人們提交數據。輸出將驗證該模型是否針對每個用戶的數據運行已承諾的參數。或者,可以公開模型及其參數,并讓用戶自己證明他們將適當的模型和參數應用于自己的(經過認證的)數據。這在醫療領域可能尤其有用,因為法律要求某些關于患者的信息必須保密。將來,這可以實現一個醫學診斷系統,它能夠從完全私密的實時用戶數據中學習和改進。

a16z:加密仍處于早期階段,相當于互聯網的1995年:5月17日消息,a16z發布2022年加密貨幣概括報告。該報告指出,加密貨幣正處于第四個價格創新(price-innovation)周期之中,加密貨幣的價格可能會不穩定,但對于創業者來說,Web3仍然比Web2好。

2021年,Web3為創作者帶來的人均收益達到174,000美元,遠超Web2平臺(例如Spotify:636美元/藝術家,YouTube:2.47美元/頻道。)

DeFi也提升了金融的包容性。以太坊仍在Web3上占據主導地位,但競爭對手正在增多,包括Solana、Polygon、BNBChain、Avalanche和Fantom等區塊鏈的開發人員正在尋求復制以太坊的成功。

該報告總結部分表示,加密仍處于早期階段,a16z估計目前以太坊擁有700萬到5000萬的活躍用戶,相當于互聯網的1995年。[2022/5/17 3:22:41]

3.認證:您希望將來自外部經過驗證的方(例如,任何可以生成數字簽名的數字平臺或硬件設備)的認證整合到鏈上運行的模型或任何其他類型的智能合約中。要做到這一點,您將使用零知識證明驗證簽名,并將證明作為程序的輸入。Anna Rose和Tarun Chitra最近主持了一期零知識播客節目,嘉賓是Daniel Kang和Yi Sun,他們探討了這一領域的最新進展。

具體來說,Daniel和Yi最近發布了一項研究,探討了如何驗證由具有經過認證的傳感器的攝像機拍攝的圖像是否經過了如裁剪、縮放或有限遮蓋等變換,這在您希望證明圖像沒有經過深度偽造但確實經過了某種合法編輯的情況下很有用。Dan Boneh和Trisha Datta也做過類似的研究,使用零知識證明驗證圖像的出處。

但更廣泛地說,任何經過數字認證的信息都是這種驗證形式的候選對象:Jason Morton正在開發EZKL庫(在下一節將有更多介紹),他稱這種方法為“賦予區塊鏈視力”。任何已簽名的端點(例如,Cloudflare的SXG服務,第三方公證人)都會產生可以驗證的數字簽名,這可能對于證明來自可信任方的出處和真實性非常有用。

A16z計劃推出第三支加密風投基金,募資規模達10億美元:據英國《金融時報》報道,知名風險資公司Andreessen Horowitz(a16z)正在計劃推出一支總值最高達10億美元新基金,以向加密貨幣和加密初創公司進行投資。據悉,該基金規模可能會在8-10億美元之間。最近a16z投資隱私零知識應用程序平臺Aleo,他們也是Coinbase和Ripple等加密貨幣公司早期投資者。如果新基金順利啟動,將會是a16z第三支加密貨幣基金。A16z在2018年首次推出專注于加密貨幣行業基金,2020年推出第二支加密貨幣基金。如果a16z第三支基金最終成功募集10億美元,將比肩Paradigm成為加密領域里規模最大投資資金池之一。[2021/5/1 21:15:33]

4.分布式推理或訓練:您希望以分布式的方式執行機器學習推理或訓練,并允許人們向公共模型提交數據。為此,您可以將已有的模型部署到鏈上,或者設計一個全新的網絡,并使用零知識證明來壓縮模型。Jason Morton的EZKL庫正在創建一種用于攝取ONXX和JSON文件并將它們轉換為ZK-SNARK電路的方法。最近在ETH Denver的一個演示表明,這種技術可用于創建基于圖像識別的鏈上尋寶游戲,游戲創作者可以上傳照片,生成圖像的證明,玩家可以上傳圖像;驗證器檢查用戶上傳的圖像是否與創作者生成的證明足夠匹配。EZKL現在可以驗證多達1億個參數的模型,這意味著它可以用于在鏈上驗證ImageNet大小的模型(這些模型具有6000萬個參數)。

其他團隊,如Modulus Labs,正在為鏈上推理對不同證明系統進行基準測試。Modulus的基準測試涵蓋了多達1800萬個參數。在訓練方面,Gensyn正在構建一個分布式計算系統,用戶可以輸入公共數據,并通過分布式節點網絡進行模型訓練,同時驗證訓練的正確性。

5.人證明:您希望驗證某人是一個獨特的個體,而不損害其隱私。為此,您將創建一種驗證方法,例如生物識別掃描或以加密方式提交政府ID的方法。然后,您將使用零知識證明來檢查某人是否已經過驗證,而不會泄露關于該人身份的任何信息,無論該身份是完全可識別的,還是像公鑰那樣的偽名。

Worldcoin通過他們的人證明協議來實現這一點,該協議通過為用戶生成獨特的虹膜代碼來確保抗攻擊性。關鍵的是,為WorldID創建的私鑰(以及為Worldcoin用戶創建的加密錢包的其他私鑰)與項目的眼球掃描器本地生成的虹膜代碼完全分離。這種分離完全將生物識別標識符與可能歸因于某人的任何形式的用戶密鑰分離。Worldcoin還允許應用程序嵌入一個SDK,使用戶可以使用WorldID登錄,并通過允許應用程序檢查人是否擁有WorldID來利用零知識證明來保護隱私,但不允許跟蹤個別用戶(更多細節,請參閱此博客文章)。

這個例子是用零知識證明的隱私保護特性來對抗較弱且惡意的人工智能的形式,因此它與上述其他示例(例如,證明你是一個真實的人類而不是機器人,同時不泄露任何關于自己的信息)有很大不同。

在實現SNARKs(簡潔非交互式知識論證)的證明系統方面的突破已經成為將許多機器學習模型上鏈的關鍵驅動力。一些團隊正在現有的架構(包括Plonk、Plonky2、Air等)中制作定制電路。在定制電路方面,Halo 2已成為Daniel Kang等人的工作和Jason Morton的EZKL項目中廣泛使用的后端。Halo 2的證明者時間近似線性,證明大小通常只有幾千字節,驗證者時間恒定。或許更重要的是,Halo 2擁有強大的開發者工具,使其成為開發者喜歡使用的SNARK后端。其他團隊,如Risc Zero,正在尋求通用VM策略。還有些團隊正使用基于求和檢查協議的Justin Thaler的超高效證明系統創建定制框架。

證明生成和驗證器時間絕對取決于生成和檢查證明的硬件以及生成證明的電路大小。但這里需要注意的關鍵點是,無論代表的程序是什么,證明的大小總是相對較小,因此驗證證明的驗證者的負擔是受限的。然而,在這里有一些細微之處:對于像Plonky2這樣使用基于FRI的承諾方案的證明系統,證明大小可能會增加。(除非最后使用像Plonk或Groth16這樣基于配對的SNARK包裝,這些證明不會隨著所證明陳述的復雜性而增長。)

對于機器學習模型的啟示是,一旦設計了一個準確表示模型的證明系統,實際驗證輸出的成本將非常便宜。開發者需要考慮的最重要的是證明者時間和內存:以一種可以相對快速證明的方式表示模型,并且證明大小理想地在幾千字節左右。要證明機器學習模型在零知識情況下的正確執行,你需要將模型架構(層、節點和激活函數)、參數、約束和矩陣乘法運算編碼并表示為電路。這涉及將這些屬性分解為可以在有限域上執行的算術運算。

這個領域還處于起步階段。在將模型轉換為電路的過程中,準確性和保真度可能會受到影響。當模型表示為算術電路時,前面提到的模型參數、約束和矩陣乘法運算可能需要近似和簡化。當將算術運算編碼為證明的有限域中的元素時,可能會丟失一些精度(或者在不進行這些優化的情況下生成證明的成本在當前的零知識框架下將不堪重負)。此外,機器學習模型的參數和激活通常以32位進行編碼以提高精度,但是今天的零知識證明無法在必要的算術電路格式中表示32位浮點運算,而不產生巨大的開銷。因此,開發者可能會選擇使用量化的機器學習模型,其中32位整數已經轉換為8位精度。這些類型的模型有利于表示為零知識證明,但是被驗證的模型可能是較高質量初始模型的粗略近似。

在這個階段,這確實是一場迎頭趕上的游戲。隨著零知識證明變得更加優化,機器學習模型變得越來越復雜。已經有一些優化的有前景的領域:證明遞歸可以通過允許證明用作下一個證明的輸入來減小整體證明大小,從而實現證明壓縮。還有一些新興的框架,比如Linear A的Apache Tensor虛擬機(TVM)分支,該框架推出了一種轉換器,可以將浮點數轉換為零知識友好的整數表示。最后,我們在a16z crypto對未來的工作感到樂觀,它將使在SNARKs中表示32位整數變得更加合理。

“規模”的兩種定義 零知識證明通過壓縮實現規模化:SNARKs允許你將一個極其復雜的系統(如虛擬機或機器學習模型)數學表示,使得驗證它的成本低于運行它的成本。另一方面,機器學習是通過擴展實現規模化的:如今的模型隨著更多數據、參數以及參與訓練和推理過程的GPU/TPU而變得更好。中心化公司可以以幾乎無限制的規模運行服務器:收取API調用的月費,并支付運營成本。

區塊鏈網絡的經濟現實幾乎正好相反:開發者被鼓勵優化他們的代碼,使其在鏈上運行既可行又便宜。這種不對稱具有巨大的優勢:它創造了一個需要提高證明系統效率的環境。我們應該尋求在機器學習中要求與區塊鏈提供的相同好處,即可驗證的所有權和共享的真實觀念。

盡管區塊鏈激勵了優化zk-SNARKs,但計算相關的每個領域都將受益。

致謝:Justin Thaler, Dan Boneh, Guy Wuollet, Sam Ragsdale, Ali Yahya, Chris Dixon, Eddy Lazzarin, Tim Roughgarden, Robert Hackett, Tim Sullivan, Jason Morton, Peiyuan Liao, Tarun Chitra, Brian Retford, Daniel Kang, Yi Sun, Anna Rose, Modulus Labs, DC Builder。

金色財經 善歐巴

金色早8點

白話區塊鏈

Odaily星球日報

Arcane Labs

歐科云鏈

MarsBit

深潮TechFlow

BTCStudy

鏈得得

Tags:區塊鏈ARK加密貨幣NAR區塊鏈怎么入手BeforeCoinMarketCap加密貨幣市場還有未來嗎知乎lunar幣歸零

SHIB
LAYER:Layer2交互很熱 但這些Layer1同樣值得關注

原文:《別再只盯著Layer2空投,Layer 1 或將風云再起》作者:比推BitpushNews Asher Zhang哪些Layer1項目值得關注?加密大V都看好哪些項目?這些項目大熱背后的.

1900/1/1 0:00:00
USDT:金色圖覽 | NFT行業周報(4.02 - 4.08)

【4.02 - 4.08】周報概要:1、上周NFT總交易額:397,399,544(美元)2、上周NFT總交易筆數:713.

1900/1/1 0:00:00
NFT:頭部和黑馬NFT交易市場最近都在卷什么?

NFT 賽道的機會在哪?這應該是近幾個月 NFT 玩家苦思冥想的事情。由于 Blur 帶來的競爭壓力,NFT 市場巨頭 Opensea 的市場份額正在不斷的被擠壓,X2Y2、LooksRare.

1900/1/1 0:00:00
LAYER:跨鏈新趨勢 LayerZero如何成為全鏈時代“第0層”?

原文:《從跨鏈到全鏈,LayerZero正在成為未來全鏈生態系統的基礎網絡結構》作者:Daniel Li多鏈協同發展已經成為區塊鏈未來的必然趨勢.

1900/1/1 0:00:00
NBS:現實資產上鏈賽道進展:一文了解 14 個類別 50 個 RWA 項目

作者:黑米,白澤研究院 DeFi 正在通過對房地產、藝術品等實物資產進行代幣化來改變格局。真實世界資產 (RWA) 代幣化是一個將有形資產轉換為代幣或 NFT 的過程,使它們能夠在鏈上進行交易.

1900/1/1 0:00:00
區塊鏈:金色早報 | 安全團隊:SushiSwap項目疑似被攻擊 損失約334萬美元

▌安全團隊:SushiSwap項目疑似被攻擊,損失約334萬美元金色財經報道,據區塊鏈安全審計公司Beosin旗下Beosin EagleEye安全風險監控、預警與阻斷平臺監測顯示.

1900/1/1 0:00:00
ads