一夜之間,海外投資機構對于AI的關注度重回幾年前的高點,甚至蓋過了今年以來的Web3投資熱點。
那么AI與Web3的結合會有什么新火花?這篇CoinFund近期的深度研究文章向我們介紹了,AI+Web3有哪些用武之地。一起探索,一手抓住兩個學習要點。
簡單介紹
技術創新永無止境,人工智能尤其如此。在過去的幾年里,我們看到深度學習模型作為人工智能的先行者再次流行起來。這些由密集互連的節點層組成的模型也稱為神經網絡,這些節點相互傳遞信息,大致上模仿了人類大腦的構造。在2010年代初期,最先進的模型擁有數百萬個參數,用于特定情緒分析和分類的高度監督模型。當今最先進的型號,例如DreamStudio、GPT-3、DALL-E2和Imagen已經接近一萬億個參數,并且正在完成與人類工作相媲美的復雜甚至創造性的任務。以這篇文章的標題圖片或摘要為例,都是由人工智能制造的。我們才剛剛開始看到這些模型的社會和文化影響,因為它們塑造了我們學習新事物、相互互動和創造性地表達自己的方式。
然而,今天許多技術訣竅、關鍵數據集和訓練大型神經網絡的計算能力都是封閉的,并由谷歌和Meta等"科技巨頭?"公司把關。雖然GPT-NeoX、DALLE-mega和BLOOM等開源模型的復制品由StabilityAI、EleutherAI和HuggingFace等組織率先推出,但Web3有望進一步為開源人工智能提供更多動力。
某巨鯨在過去8小時內用454萬枚USDC和150枚ETH買入PEPE:金色財經報道,據Lookonchain監測,0x31f5開頭的巨鯨地址在過去8小時內用454萬枚USDC和150枚ETH(約合28.7萬美元)以0.000001406 USDT買入3萬4千3百億枚PEPE。
該巨鯨第一次在PEPE上賺了約1147萬美元,第二次在PEPE上損失了約74.1萬美元。[2023/6/22 21:54:03]
“人工智能的Web3基礎設施層可以引入開源開發、社區所有權和治理以及普及的元素,從而在開發這些新技術時創造新的模型和效率。”
此外,Web3的許多關鍵用例將通過采用人工智能技術得到加強。從生成藝術NFT到元宇宙景觀,AI將在Web3中找到許多用例。開源AI符合Web3的開放、去中心化和民主化的精神,代表了科技巨頭提供的AI的替代方案,而科技巨頭不可能很快變得開放。
基礎模型
基礎模型是在大量數據集上訓練的神經網絡,用于執行通常需要智能人類行為的任務。這些模型已經創造了一些令人印象深刻的結果。
OpenAI的GPT-3、Google的LaMDA和Nvidia的Megatron-TuringNLG等語言模型具有理解和產生自然語言、總結和合成文本,甚至編寫計算機代碼的能力。
美國加密交易所的BTC儲備已降至2017年的水平:金色財經報道,根CryptoQuant研究報告顯示,美國加密交易所的BTC儲備已降至2017年的水平,歐盟和香港等地區已經為新興經濟制定了全面的法規,正在經歷資本、人才和數字資產公司的流入。特別是香港,已經向加密公司開放,并表示他們將對類似于傳統金融公司的實體采用“相同的活動、相同的風險、相同的監管”原則。
此外,國際加密貨幣交易所的交易量是美國平臺的四倍。比特幣在美國的現貨交易量主導地位已低于 2017 年的水平,目前為 21%。報告補充說,美國交易所幾乎沒有接觸永續期貨交易市場,該市場的交易量是現貨交易量的 11 倍,因為公司不允許提供這項服務。[2023/6/11 21:30:08]
DALLE-2是OpenAI的文本到圖像擴散模型,可以從書面文本中生成獨特的圖像。谷歌的人工智能部門DeepMind已經產生了競爭模型,包括PaLM,一個540B參數的語言模型,以及Imagen,它自己的圖像生成模型,在DrawBench和COCOFID基準上優于DALLE-2。Imagen不僅產生的效果更逼真還具有拼寫能力。
谷歌的AlphaGo?等強化學習模型已經擊敗了人類圍棋世界冠軍,同時發現了在該游戲三千年歷史中從未出現過的新策略和下棋技巧。
BigTech處于創新的最前沿,建立復雜基礎模型的競賽已經開始。盡管該領域的進步令人興奮,但有一個關鍵主題值得我們關注。在過去的十年中,隨著人工智能模型變得越來越復雜,它們也越來越不向公眾開放。
WazirX:幣安控制著WRX代幣并持有所有IEO收益,已5個季度未進行銷毀:5月17日消息,印度加密貨幣交易所WazirX發推文稱:“我們想澄清幣安控制著WRX代幣。幣安為WRX進行了IEO,WRX IE0的所有銷售收益(即價值200萬美元的108,401 BNB代幣)均由幣安收集并保留。幣安目前共持有5.8078億美元WRX代幣,WazirX團隊尚未收到任何代幣分配。進行WRX代幣季度銷毀的責任在于幣安。幣安于2022年3月9日執行了2021年10月至12月季度的最后一次WRX銷毀事件(第7次銷毀)。幣安在過去5個季度(即自2022年1月起)沒有進行過季度銷毀。”
此前1月消息,WazirX所有權爭議升級,Zanmai Labs稱幣安威脅其發布“虛假聲明”是“不道德的”。[2023/5/17 15:07:19]
科技巨頭正在大力投資于生產此類模型并將數據和代碼作為專有技術保留下來,同時通過其模型訓練和計算的規模經濟優勢來保持其競爭護城河。對于任何第三方來說,生成基礎模型都是一個資源密集型過程,具有三個主要瓶頸:數據、計算和貨幣化。
在這個方向,我們看到了Web3在解決其中一些問題的早期進展。
數據集生產可以通過Web3所有權進行匯總
標記數據集對于構建有效模型至關重要。人工智能系統通過歸納數據集內的示例進行學習,并隨著時間的推移不斷改進訓練。然而,高質量的數據集匯編和標記需要專門的知識和處理,以及計算資源。專門的內部數據團隊來處理大型專有數據集和IP系統,以訓練他們的模型,并且幾乎沒有動力開放對其數據的生產或分發的訪問。已經有一些社區正在向全球研究者社區開放和訪問模型訓練。
數據:ETH 2.0總質押數已超1654.48萬:金色財經報道,數據顯示,ETH 2.0總質押數已超1654.48萬,為16544823個,按當前市場價格,價值約269.76億美元。此外,目前ETH 2.0質押總地址數已超52.87萬,為528676個。[2023/2/11 11:59:58]
1.CommonCrawl,一個十年互聯網數據的公共存儲庫,可用于一般培訓。
2.LAION是一個非營利組織,旨在向公眾提供大規模機器學習模型和數據集,并發布了LAION5B,這是一個58.5億經過CLIP過濾的圖像-文本對數據集,一經發布就成為世界上最大的公開訪問的圖像-文本數據集。
3.EleutherAI是一個分散的集體,發布了最大的開源文本數據集之一,稱為ThePile。ThePile是一個825.18GiB的英語語言數據集,用于使用22個不同數據源的語言建模。
目前,這些社區是以非正式的方式組織起來的,并大量依靠廣大志愿者的貢獻。為了激勵社區貢獻,代幣激勵可以作為一種機制來創建開源的數據集。?代幣可以根據貢獻來發放,比如標記一個大型的文本-圖像數據集;并且DAO的存在可以驗證此類激勵聲明。最終,大型模型可以從一個公共池中發行代幣,并且基于所述模型構建的產品的下游收入可以累積到代幣價值中。這樣一來,數據集貢獻者可以通過他們的代幣持有大型模型的股份,而研究人員將能夠在開放中對構建的資源進行貨幣化。編譯構建良好的開源數據集對于擴大大型模型的研究可訪問性和提高模型性能至關重要。可以通過增加不同類型圖像的大小和過濾器來擴展文本-圖像數據集,以獲得更精細的結果。非英語數據集將需要用于訓練非英語人群可以使用的自然語言模型。逐漸地,我們可以使用Web3更快、更公開地實現這些結果。
Cash App:已通過閃電網絡支持發送和接收BTC,但7天交易上限為999美元:金色財經報道,據 Cash App 比特幣產品負責人 Michael Rihani 在社交媒體上披露,該平臺用戶現在可以使用閃電網絡發送和接收 BTC,此前 Cash App 用戶只能通過閃電網絡發送比特幣。不過根據 Cash APP 官方網站披露,雖然使用閃電網絡“通常很少或不涉及任何費用”,但通常僅用于發送少量 BTC,而且其平臺還設定了 7 天內最多可發送或接收價值 999 美元 BTC 的限制。[2022/10/26 16:38:56]
隨著時間的推移,計算將轉移到去中心化網絡訓練大規模神經網絡所需的計算是基礎模型中最大的瓶頸之一。在過去十年中,訓練AI模型的計算需求每3、4個月翻一番。在此期間,人工智能模型已經從圖像識別到使用強化學習算法,再到在戰略游戲中擊敗人類冠軍,以及利用轉化器訓練語言模型。例如,OpenAI的GPT-3有1750億個參數,訓練時間為3640petaFLOPS-day包括一天里每秒執行1015個神經網絡操作,或者總共大約1020個操作?)。在世界上最快的超級計算機上,這需要兩周時間,而標準筆記本電腦需要一千年以上的時間來計算。隨著模型規模的不斷增長,計算仍然是該領域發展的瓶頸。
AI超級計算機需要經過優化的特定硬件,以執行訓練神經網絡所需的數學運算,例如圖形處理單元(GPU)或專用集成電路(ASIC)。如今,針對此類計算優化的大多數硬件都由少數寡頭云服務提供商控制,例如GoogleCloud、AmazonWebServices、MicrosoftAzure和IBMCloud。
這是我們看到通過公共的、開放的網絡進行去中心化的計算分配的下一個主要交叉點。去中心化治理可用于資助和分配資源以培訓社區驅動的項目。此外,去中心化的市場模型可以跨地域公開訪問,這樣任何研究人員都可以訪問計算資源。想象一個通過發行代幣來眾籌模型訓練的賞金系統。成功的眾籌將為其模型獲得優先計算權,并在需求量大的地方推動創新。例如,如果DAO有很大的需求,要制作一個西班牙語或印地語的GPT模型系列是由OpenAI提出的非常強大的預訓練語言模型,這一系列的模型可以在非常復雜的NLP任務中取得非常驚艷的效果,例如文章生成,代碼生成,機器翻譯,Q&A等,而完成這些任務并不需要有監督學習進行模型微調。)以服務于更大范圍的人口,那么研究就可以集中在這個領域。
像GenSyn這樣的公司已經在努力推出協議,以激勵和協調替代、經濟高效和基于云的硬件訪問,以進行深度學習計算。隨著時間的推移,在我們共同探索人工智能的前沿,使用Web3基礎設施構建的共享、分散的全球計算網絡將變得更具成本效益,以擴展和更好地為我們服務。
開放獲取和產品協調
數據集和計算將使這篇論文變得可能:開源人工智能模型。在過去的幾年里,大型模型變得越來越私人化,因為制作這些模型所需的資源投資已經推動項目成為閉源的了。
以OpenAI為例。OpenAI成立于2015年,是一家非營利性研究實驗室,其使命是為全人類的利益生產通用人工智能,這與當時的人工智能領導者谷歌和Facebook形成鮮明對比。隨著時間的推移,激烈的競爭和資金壓力逐漸侵蝕了透明度和開源代碼的理想,因為OpenAI轉向營利性模式并與微軟簽署了10億美元的大規模商業協議。此外,最近的爭議圍繞著他們的文本到圖像模型DALLE-2,因為它的普遍審查制度.訪問這些模型的私人測試版對西方用戶具有隱含的地理偏見,這導致切斷全球大部分人口與這些模型的交互和通知。
這不是人工智能應該傳播的方式:由幾家大型科技公司看守、監管和保護。與區塊鏈的情況一樣,新技術應該盡可能公平地應用,這樣它的好處就不會集中在少數可以使用的人身上。人工智能的復合進展應在不同行業、地域和社區之間公開利用,共同發現最具吸引力的使用案例,并就人工智能的公平使用達成共識。保持基礎模型的開源可以確保防止審查,并在公眾視野下仔細監測偏見。
借助通用基礎模型的代幣模型,將有可能聚集更多的貢獻者,他們可以在發布代碼開源的同時將其工作貨幣化。像OpenAI這樣以開源論文為基礎建立的項目不得不轉向一個獨立的資助公司,以競爭人才和資源。Web3允許開源項目在經濟上同樣有利可圖,并進一步與由BigTech私有投資領導的項目競爭。此外,在開源模型之上構建產品的創新者可以放心地構建,因為底層人工智能是透明的。其下游效應將是新型人工智能用例的快速采用和上市。在Web3領域,這包括對智能合約漏洞進行預測分析的安全應用程序,可用于鑄造NFT和創建元界景觀的圖像生成器,可存在于鏈上以保留個人所有權的數字AI個性等等。
結論
人工智能是當今發展最快的技術之一,將對我們整個社會產生巨大影響。今天,該領域由BigTech主導,因為對人才、數據和計算的金融投資為開源開發創造了重要的護城河。Web3整合到AI的基礎設施層將是關鍵步驟,確保人工智能系統以公平、開放和可訪問的方式構建。我們已經看到開放模型在Twitter和HuggingFace等開放空間中采取快速、公共創新的位置,而加密貨幣可以推動這些努力超前發展。
以下是CoinFund投資團隊在AI和crypto的交叉點上所尋找的項目:
1.以開放式人工智能為核心的團隊
2.管理公共資源以幫助構建AI模型的社區
3.利用人工智能將創造力、安全性和創新帶入主流應用的產品
責任編輯:MK
兩天前,推特用戶YannickCrypto發推指控SushiSwap新CEOJaredGrey為加密詐騙犯并列舉了其多項「罪行」,該推特在社區引發了激烈討論.
1900/1/1 0:00:00EmmaCui是Web3加速器和新加坡風險投資基金LongHashVentures的創始合伙人。在開始她的銀行業職業生涯后,她遇見了加密貨幣并堅定地進入了加密行業.
1900/1/1 0:00:00Aptos最有意思的點,并不在于吹上天際的16萬TPS的交易并行模式BlockSTM,而在于它的每個區塊里沒有交易的原始數據.
1900/1/1 0:00:00這兩天XEN特別火,看了看代碼,相對比較簡單。這篇文章就來結合文檔來解讀一下合約代碼,僅做學習交流用。對于玩法還不熟悉的朋友可以先看看我昨天發的推文.
1900/1/1 0:00:00Meme效應在加密圈有多強?馬斯克就是最好的例子。狗狗幣?和屎幣在馬斯克的一段持續喊單中,從底部上漲超百倍,并迅速火爆出圈,成就一眾造富神話.
1900/1/1 0:00:00MarsBitCryptoDaily2022年10月17日 一、今日要聞 ApeCoin擬將APE質押功能延遲2~4周推出ApeCoinDAO社區發起AIP草案.
1900/1/1 0:00:00