比特幣行情 比特幣行情
Ctrl+D 比特幣行情
ads

CHA:ChainBreaker:聊聊AIGC 在 Web3的應用

Author:

Time:1900/1/1 0:00:00

2023 年 4 月 7 日 21:00,「ChainBreaker Podcast」播客活動第四十六期拉開帷幕。本期直播潘致雄(ChainFeeds Co-Founder)連線區塊先生 Mr. Block Chris、Mest Founder Ashu Chan、Max(Adaverse Asia Ecosystem Head),圍繞「AIGC 在 Web3的應用」展開深度討論。

內容摘要:

阿樹:

我們曾在Crypto Wallet行業工作了五六年,一直遇到如何向用戶表達鏈上數據的困擾。因此,我們花了很多時間研究如何使用自然語言等文本形式表達不同類型的鏈上數據。Crypto Wallet可以承載多種類型的鏈上數據,例如DID、資產、NFT和DeFi。這些類型的數據很難在一個單一的窗口中表達。因此,我們一直在追求自然語言表達的解決方案。直到ChatGPT出現,我們認為這個東西變得比較可行。MEST想要解決的問題是如何使用自然語言表達鏈上數據,而ChatGPT是一個好的結合點。但早期,Mest主要在做內容分發,ChatGPT還沒有出現。

Coinbase將Multichain(MULTI)列入上幣路線圖:金色財經報道,Coinbase Assets發推表示,已將Multichain(MULTI)列入上幣路線圖。[2023/4/19 14:12:32]

如果沒有ChatGPT,我們可能會使用更笨拙的方式模擬自然語言的表達形式,但這種形式可能并不好,而我們的工作,特別是作為鏈上數據產品的工作,可以更專注于如何生成有價值的鏈上數據。我們之前做了很多工具,如Dashboard,但現在完全轉向了語言交互這種形式,這是我們的一個試點。

在我們的理解中,這兩者是兩種不同的類型。我們認為它們都有特定的應用場景。圖形界面特別適用于流程性場景,例如轉站。它并不適合用自然語言表達。但是,一旦涉及多種類型的數據信息表達,自然語言就是最適合的場景。最基本的例子是,當你想看一些數據時,現有的電商數據產品只能用圖表或表格表達,但在一個大型Dashboard中,很難識別任何信息。在一些組合產品中,你也可能會感到很復雜,因為它們要承載太多東西。但是,自然語言是非常適合的。因此,對我們來說,這種使用信息傳達技術的方法可能會有所不同。對于流程性的東西,我們通過圖形界面解決;對于信息傳達和數據傳達,自然語言的優勢是非常明顯的。這對于區塊鏈這個場景非常適用。

Sepolia測試網現在是Chainlink的主要以太坊測試網:金色財經報道,Chainlink在社交媒體上發文表示,Sepolia測試網現在是Chainlink的主要以太坊測試網,其核心服務如價格信息流、VRF、自動化和功能已經在網絡上運行。開發者可以使用Chainlink水龍頭訪問Sepolia ETH和LINK。[2023/3/5 12:42:39]

區塊鏈的特性是公開,數據都在那里。真正的問題是如何應用這些數據,重新整合來找到所需要的答案。Dune Analytics在Defi Summer變得非常的好用,因為大家開始知道它在鏈上想要找什么數據。在Defi之前,Dune已經存在了,但大家并不會特別用Dune來去獲得它想要的一些資訊。現在大家可能會透過MakerDAO的合約來了解說MakerDAO從2021年到現在的區塊高度里面Minting Fee賺了多少錢,然后可以交叉比對它跟Liquidity這種穩定幣所生成的Minting Fee差別有多少。用戶可以用這些資訊去佐證他的一些猜測,驗證他的一些投資的原因。但同樣的,這個出現了一個問題,就是一個門檻,用戶可能有一些想法,但他可能不會寫MySQL,所以就無法創造出自己的一個Dune Dashboard。ChatGPT的問世后,讓很多人討論出來一種方式,甚至可以用ChatGPT來寫合約,甚至用ChatGPT來做Unity的游戲,或是一個簡單生成一個HTML Browser的Game。

Sportzchain啟動去中心化粉絲代幣平臺Alpha階段,將于8月鑄造平臺幣SPN:7月28日消息,印度基于區塊鏈的體育粉絲互動平臺Sportzchain已經啟動其去中心化粉絲代幣平臺的Alpha階段。

球迷們現在可以讓其意見發揮作用,無論是在決定球隊訓練課程的球衣還是其他因素方面。用戶可以參與兩個卡巴迪球隊和一個板球隊的約束性/非約束性投票,以表示對球隊決策的贊成或反對意見。其平臺原生代幣SPN將于2022年8月鑄造,必須擁有該代幣才能獲得Sportzchain粉絲代幣。

據此前報道,SportZchain完成60萬美元種子輪融資,SUNiCON Ventures和MAKS Group共同領投。該公司曾在2021年10月完成40萬美元的pre-seed輪融資。(Business Insider)[2022/7/28 2:43:58]

是否可以未來通過自然語言去查詢一些數據,生成一個Dune Page?有些工具剛好滿足了這個要求,可以用自然語言去查詢一個數據。但有個問題,就是這些數據高質量的這些表是從哪里來的?必須有人去把它從區塊鏈這些無序的、可能沒有價值信息中提取有價值的數據,才能用自然語言去生成有價值的一個指標出來。我認為這是長期是一個非常可行,但是在中短期,像數據服務商可以在中間建立一個將這些區塊鏈公開數據大體量的數據去抽取出有價值的指標出來,去供用戶去調度,這個是目前比較可行的事情。我們將現在去鏈上數據有價值指標,

DeFi借貸協議Teller完成685萬美元戰略融資,BlockchainCapital領投:2月24日消息,DeFi借貸協議Teller完成685萬美元戰略融資,BlockchainCapital領投,FranklinTempleton、ToyotaVentures、BessemerVenturePartners、Upstart、SignumCapital等參投。融資用于建立一個開放的訂單簿協議,允許第三方建立無擔保DeFi借貸市場。(雅虎財經)[2022/2/24 10:12:03]

如果將來有朋友對這方面感興趣,首先要解決一個問題,那就是你要有獨特的內容。完成了第一步之后,我們要去給這些業務數據打標簽,因為只有這些業務數據有足夠多的語言信息描述,當用戶輸入自然語言時,我們才能知道如何找到這個樣的一個數據去整合給他返回。在這里,會有一個概念叫做embedding,就是在GPT中,它有一個叫做向量的概念,它將文本的語言轉換成一個高維度的數字,然后進行匹配。目前所有主流的對話式處理方案都是按照這個思路進行的,首先給自己的數據打很多標簽,這些標簽或API需要標記上很多問題,比如“我有多少NFT”的問題,這個指標可能需要我們寫上20條或者300條問法,我們還可以用GPT幫助我們生成100條類似的問法,去把它給標記。只有這樣,用戶問任何一個關于NFT的問題,我們才能很高概率地匹配上這樣的一個數據。這是目前所有做對話式處理的中期階段。

跨鏈資產橋ChainSwap已集成Polygon網絡:跨鏈資產橋ChainSwap已集成二層擴容Polygon網絡(原Matic),Chainswap用戶可在包括Polygon的多個鏈之間實現一鍵跨鏈。[2021/5/17 22:09:40]

如果到了后期的話,比較理想的情況下,我們有了數據,有了大量標記的內容,那么可能我們會希望在已有的模型上進行微調,比如在一個開源模型或GPT模型之上進行微調,讓它成為一個專屬領域的AI。我認為我們可能會按照這個思路分三個階段去實現,第一階段是有數據,第二階段是標記數據,第三階段是向量匹配,然后再進行微調。

最后,我們也在思考未來的發展,包括阿里巴巴也出了大語言模型,未來也會有更多這樣的大語言模型。我們正在追蹤這些發展,包括Facebook等都有一些開源的語言模型,雖然效果上和GPT還有些差距,但是看現在這個發展的速度和能力,他們也有機會和能力能達到GPT3或3.5的水平。

所有做鏈上數據產品的人現在面臨的困境是,大家都基于公開數據開發出沒有摩擦的產品。所以我認為,當你提出這個問題時,它的復雜度和邏輯復雜度可能會慢慢增長,可能會包含七種條件和一些嵌套的邏輯。在這種情況下,即使是GPT4也無法準確地得到一個百分之百準確的結果,它可能還需要做一些調整才能完全理解用戶體的問題。所以,在一些層面上,我們還有進步的空間。

現在只能做到六七十分的狀態,我們需要考慮的是這些詞的向量模型,例如Word2Vec。如何根據區塊鏈領域的特點對它們進行調整?這可能也是Mest會遇到的問題之一。我其實想要聊聊Word Embedding,你們如何表示區塊鏈相關的詞,以及在搜索方面如何更好地執行。

首先,我們肯定需要自己大量的人工投入,模擬用戶可能會問的問題,然后幫助我們生成一些問題,打上標簽,然后陸續投入生產,讓用戶在這個過程中去交互,發現一些問題或者獲得更多的數據,輔助我們去優化這個標簽,讓匹配度更高。

潘致雄:

我想分享一下我們使用ChatGPT的一些感受。我們已經調研了接近兩個月,并嘗試做一些基于ChatGPT的上層工具鏈或應用。如果將ChatGPT想象成一個有擴寫能力的人,給他一些主題,他就可以生成一些文章。對于內容創作來說,這可能會提供一些幫助。但是,對于深度的研究或新興行業的分析,它仍然存在許多不足之處,因為它缺乏信息庫。因此,我們使用ChatGPT更多地是為了將信息濃縮,需要給它足夠多的上下文、聯系或知識。當我們給它這些知識后,再進行提問或抽取某些信息庫中的信息,它的效果非常好。我們目前使用了兩個相對流行的開源庫:LlamaIndex。此外,我們也在使用一個基于ChatGPT的平臺,可以幫助我們構建自己的數據庫,例如PDF和其他資料和數據。在和ChatGPT對話時,我們可以對數據進行預分類和預篩選,提高ChatGPT的效果。

我想舉個例子來說明,假設我們需要回答一個用戶關于某個具體問題的疑惑,比如 ERC-4337 是什么。我們首先需要從數據庫中找到相關文章或內容,并對它們進行切分。例如,一個文章可能被切分成 2000 或 3000 Token 為一個單元。當用戶提出問題時,我們需要匹配每個單元和問題的相關度,并找到相關性較高的部分進行提問和回答。然后來匹配單元和問題,以得出相對準確度較高的部分。然后,我們使用 ChatGPT 進行提問和回答,并從中總結得出答案。

這種方法適用于知識類問題。但是如果用戶問的是關于 Twitter 這樣的短內容,我們只能將問題與每條推特的嵌入式結果進行匹配,并根據與問題相關性較高的推特進行提問和回答,并讓 ChatGPT 進行總結。通過這種方法,我們可以得出答案。

目前大多數人工知識庫和 ChatGPT 的大方向都是這樣的方法。當然,這種方法也存在一些問題,例如同義詞的處理。為了提高準確性,可以使用向量表示法進行匹配和總結。在我們的調試過程中,我們發現了許多這樣的問題,例如當一個問題涉及到 ERC-4337 時,可能在其他文章中出現了 ERC-20 和 4337 這些數字。這就可能導致搜索結果不夠準確,因為匹配的是錯誤的內容。

關于 ChainBreaker

由 @mrblocktw、 @nake13、@momoxi17 主辦的 ChainBreaker 播客,每周五晚上8點直播。

ChainBreak 播客主要和大家分享加密領域的熱點話題,加密技術的發展探討,以及加密世界的八卦等。

來源:DeFi之道

DeFi之道

個人專欄

閱讀更多

金色財經 善歐巴

Chainlink預言機

白話區塊鏈

金色早8點

Odaily星球日報

歐科云鏈

深潮TechFlow

BTCStudy

MarsBit

Arcane Labs

Tags:CHAGPTAINHAIChainXGPT GuruChainlistshoppingchain

Gate交易所
PEPE:復盤PEPE和AIDOGE暴漲背后 我們如何與meme幣共舞

“鏈上監控到一個地址,買了250美元的PEPE,剛才變成180萬美元了”,“前幾天我領了給ARB空投地址空投的代幣AIGOGE,沒有賣,剛才看單個地址領的幣可以賣500美元了.

1900/1/1 0:00:00
區塊鏈:金色觀察 | 比特幣網絡上的BRC-20代幣是什么 一文讀懂

作者:Ordinals Finance;翻譯:金色財經xiaozou多虧了比特幣網絡的Segwit和Taproot升級,Ordinals協議于1月誕生.

1900/1/1 0:00:00
TER:一覽加密VC們青睞的12個新項目

原文作者:MooMs 想了解下一個大敘事會發生在何處嗎?以下是 12 個備受期待的加密貨幣項目,它們已經得到了來自多家知名風險投資公司的支持.

1900/1/1 0:00:00
ZKP:ZK硬件加速:過去、現在和未來

原文標題:ZK Hardware Acceleration: The Past, the Present and the Future原文作者:Luke Pearson and the Cysi.

1900/1/1 0:00:00
WEB:Web3游戲全景圖:各類玩家群像解讀

主要觀點 即使市場深陷寒冬,但 web3 游戲每天依然有八十萬的用戶。Web3 游戲正在逐步完善,從 DeFi 演變出的 Web3 游戲 ,到增強了敘事的 X 2 E,再到.

1900/1/1 0:00:00
NFT:金色Web3.0日報 | PEPE市值突破12億美元 24小時交易量近8億美元

DeFi數據 1、DeFi代幣總市值:491.87億美元 DeFi總市值及前十代幣 數據來源:coingecko2、過去24小時去中心化交易所的交易量18.

1900/1/1 0:00:00
ads