撰文:ZeoZhang
來源:鏈聞ChainNews
騰訊創始人馬化騰曾在2017年「邁進智能新時代」中國IT領袖峰會上坦言:
目前很多大數據是垃圾數據,因為沒有標簽,用再好的算法也算不出來,數據清洗、標簽化難度非常高,我們甚至要耗費很多人工先清洗數據,再讓AI學習。
一席話道出人工智能發展難點。在互聯網計算機迭代數十年后,算法和算力的積累已將人工智能推向一個新的階段,但缺乏高質量的有效數據,成為掣肘人工智能發展的重要原因之一。在解決這一問題上,測試網已經平穩運行一年的AI數據的分布式存儲協議EpiKProtocol提出了結合區塊鏈的解決方案。
2021年8月15日,測試網已經平穩運行一年的AI數據的分布式存儲協議EpiKProtocol將正式上線主網。作為一個首次集數據標注、分布式存儲以及數據應用等功能于一身的項目,EpiKProtocol嘗試解決市場缺乏有效數據問題,構建共建共享共益的AI數據的分布式存儲協議?
為什么缺乏有效數據?
一方面,平臺默許甚至鼓勵虛假的刷數據行為,造成無用數據橫行。
對于傳統互聯網行業來說,刷數據現象司空見慣:新開的網店九成以上會選擇刷單吸引客流量;即使是訂閱量超百萬的微信大號也經常通過刷閱讀量滿足廣告客戶的數據需求;更甚者,某旅游平臺曾被爆出通過機器+人工的形式,冒充用戶發表了數千萬的用戶評價,以假亂真,影響用戶對產品的真實測評。
Compound社區提議增加以太坊主網上cWETHv3中的cbETH供應上限:金色財經報道,Compound社區發起提案146,提議增加以太坊主網上cWETHv3中的cbETH供應上限,從當前的7,100個上限設置為20,000個。[2023/1/29 11:34:24]
對于一向標榜公開、透明、鏈上可追溯的區塊鏈行業來說,刷數據現象仍不鮮見,分布式存儲領域明星項目?Filecoin?也曾陷入「無效數據」質疑:在Filecoin網絡剛上線時,較高的挖礦收益吸引大量礦工參與,甚至有部分礦工利用外部程序進行灌裝虛擬數據或自己封裝一些毫無價值的垃圾數據。
Filecoin存儲算力快速暴增,從而導致存儲的數據量短時間爆增。再加上Filecoin網絡一開始無法對存儲的數據進行分辨,真實有效數據極少,大量物理存儲被浪費,對整個Filecoin生態發展帶來不良影響。
另一方面,數據處理成本居高不下,多數人工智能不堪重負。
眾所周知,人工智能需要不斷深度學習,這需要龐大的數據量支撐。
龐大的用戶群體每天活躍在互聯網中,產生龐雜的數據。然而這些數據并不能被直接使用。人工智能的深度學習需要數據集的獲得、數據的標注等,其中數據的標注會造成巨大的人力成本。
Unicly已在主網上集成Chainlink Keepers:金色財經報道,Unicly宣布已在主網上集成Chainlink Keepers,以自動化平臺上的關鍵智能合約功能。具體來說,Chainlink Keepers用于自動向代幣持有者分配farming獎勵,并自動將NFT交易費用轉換為Unicly的原生代幣并將費用分配回代幣持有者。[2021/9/10 23:13:55]
廣泛應用深度學習網絡需要大量已標注的數據進行訓練才有可能達到預期的效果,但大數據時代下,雖然有海量的數據取之不盡,絕大部分卻是未進行標注的數據,這些訓練數據的標注需要人為進行。
對于數據品質要求越高,數據的標注需求就越精細,對標注人員的素質和專業知識的要求也就越高,相對應成本也越高。
長久以來,這些數據都由專門的數據標簽分類公司進行加工處理,以供人工智能等數據需求領域發展使用。然而,用戶-數據處理公司-數據需求者的三方協作,使得有價值的數據獲取成本極高。
標注、存儲、銷售:EpiKProtocol的一站式數據服務
EpiKProtocol生態引入領域專家、賞金獵人、數據企業三類角色,致力于構建去中心化的大規模共建共享共益的AI數據存儲協議,通過去中心化存儲技術IPFS、去中心化自治組織DAO及通證經濟模型,組織并激勵全球社區成員將人類各領域知識梳理成可用的AI數據,并持續更新這一人類永恒知識庫。
公告 | Filecoin主網上線窗口暫定6月15日至7月17日:據Filecoin官方信息顯示,其主網上線窗口暫定為6月15日-7月17日,其他更新時間表包括:1、4月17日之前完成主網硬件建議和互操作網絡(暫定);2、3月9日-4月17日敲定加密貨幣經濟結構和證明結構;3、4月20日-6月12日啟動第二階段測試。[2020/2/20]
在數據標注方面,EpiKProtocol連接C端用戶推出AI數據標注系統。
「領域專家」設計不同領域的AI數據格式,并發布數據標注任務;人人都能注冊成為「賞金獵人」,參與數據標注成為AI老師,獲得EPK代幣獎勵。
完成數據標注后,「賞金獵人」返還處理過的數據,「領域專家」驗收所負責領域AI數據獲得EPK代幣獎勵。此外,「領域專家」還會根據數據結果優化AI數據格式,良性循環下,數據質量得到不斷提升。
在數據存儲方面,EpiKProtocol推出AI數據存儲系統。
完成標注并通過驗收的數據將由「領域專家」上傳至AI數據存儲系統進行分布式存儲,參與數據存儲的設備也都可以獲得EPK代幣獎勵。
在數據銷售方面,數據企業可通過質押EPK來訪問數據,并從AI數據存儲系統中付費下載有效數據。
動態 | VeChain基金會更新主網上線時間表:據VeChain基金會官方消息,VeChain主網上線時間表已確認的更新內容如下:1.?團隊將于7月9日發布VeChainThor錢包。2.?X Node綁定服務將于7月9日開啟,至VeChainThor Ledger軟件允許遷移日的10天后截至。3.?各大交易平臺將在7月中旬為用戶提供令牌轉換服務。4.?X Node綁定服務結束當日,移動端錢包的令牌轉換服務即開啟。5.?X Node監控會在移動端錢包令牌轉換服務進行三周后重啟。6.?VeChain主網正式上線后,VeChain基金會將為令牌持有者發放VTHO代幣,作為在X Node綁定和令牌轉換期間的補償。此外,VeChain團隊還將為VeChainThor移動端錢包添加觀測功能。[2018/7/3]
由于EpiKProtocol的AI數據標注系統直接面向C端用戶,消除了中間戶數據標注公司的存在,簡化了數據處理流轉的各個環節,因此成本更低。以一條可用的AI語音方言數據為例:傳統市場一條可用數據成本約在12元左右,而在EpiKProtocol系統成本約為2元,是傳統市場的1/6。
更重要的是,由于EpiKProtocol系統中有來自各行各業的「領域專家」把關數據治理,因此EpiKProtocol系統產生的有效數據更能夠精準符合不同AI領域的數據需求。
EOS宣布在6月1日EOS主網上線之前空投代幣:日前,EOS發布公告稱,為了更早的促進社區發展和用戶參與,尤其是想要讓Everipedia的持幣人通過投票表決的方式參與到Everipedia網絡基礎規則的建設和確立當中來,將在6月1日EOS主網上線之前空投代幣并會在近幾周內發布更多空投細節。空投的代幣將是ERC20代幣,需要持幣人在ETH網絡快照前(具體日期稍后公布)將代幣從交易所中提到個人錢包,參與了EOS眾籌的持幣人,也需將所有的EOS代幣提取出到自己的個人錢包。[2018/2/3]
協同B端、C端和行業專家的開放經濟模式
不同于目前分布式存儲主要圍繞B端歸檔數據存儲服務的商業模式,EpiKProtocol是一個協同B端企業、C端用戶和領域專家的去中心化協同AI數據存儲協議,在成本控制、收益提升和服務體驗方面,都具有媲美中心化互聯網巨頭的能力。
C端用戶:更低的數據標注門檻
EpiKProtocol針對C端用戶打造了AI數據采集應用「知識大陸」,降低了數據標注門檻,同時提升了趣味性。卡通的界面和簡明的布局讓數據標注這種枯燥而繁雜的工作變為有趣的游戲,通過游戲化形式組織其全球社區成員共建大規模開放AI數據庫。
各行各業都可以在「知識大陸」中創建AI數據類型,包括金融、醫藥、法律、社交、電商等,未來隨著知識大陸的發展和運用,有數據需求的公司都可以選擇在此進行共同協作收集整理并處理數據。
其次,EpiKProtocol的標注效率更高。AI數據標注系統運營三周以來,EpiKProtocol標注了17272條有效數據,且數據指標完整,每條數據被人工驗證次數高達10次。相比較于傳統標注方式,EpiKProtocol的標注效率高了近乎10倍。
最重要的是,參與EpiKProtocol數據標注的用戶能夠獲得更高收益。傳統數據標注模式中,數據處理者僅作為一種人工勞動力,并不享有數據分紅權。而在EpiKProtocol中,對數據做出貢獻所獲得的EPK實際是獲得了數據的股權,分享數據在后續使用過程中的盈利分紅。后期數據需求越大,EPK需求就越高,EPK便會升值,EPK持有者便可以獲益。
B端用戶:激勵有效數據
EpiKProtocolAI數據存儲系統采取經典的1+3配置,即1Deamon+3Miners配置。與Filecoin相比,EpiKProtocolAI數據存儲系統參與出塊最小算力為0、存儲免費,無需指定節點且默認無限份數、無限時間,更能夠充分調度起每臺閑置存儲設備。
最重要的是,Filecoin存儲無用數據也可獲得算力,但EpiKProtocol存儲系統中只有通過「領域專家」驗證過的數據才可獲得算力,這不僅保障了數據的高質量,而且進一步遏制了無效數據浪費存儲空間的不良影響。
項目團隊
EpiKProtocol擁有行業頂級顧問以及實力派投資機構。著名AI科學家、SigularityNET創始人、全球首個機器人公民Sophia之父的首席科學家BenGoertzel出任EPIK?銘識協議顧問,協助EPIK推動歐美數據市場,助力構建高質量的AI數據生態。
融資方面,EpiKProtocol獲得了包括FBGCapital、JACKDAW、1475、ChainUpCapital、7O'clockCapital等機構的青睞,助力AI數據的分布式存儲以新的勢頭進入大眾視野。
主網即將上線
根據團隊最新消息,EpiK「主網1.0羅塞塔」將于2021年8月15日中午12點正式上線。該時間也是EpiK測試網上線1周年的時刻。目前測試網5.0在測節點已超過6萬個,穩定出塊。
隨著主網的日益臨近,挖頭礦也成為EpiKProtocol用戶的關注焦點之一。作為EpiKProtocol生態激勵代幣,EPK總發行量為10億,其具體分配規則如下:
1.創世團隊:5%,每90天釋放1/16;
2.基金會:5%,每90天釋放1/4;
3.投資人:20%,每90天釋放1/7;
4.社區:70%,出塊速遞每90天衰減一次,4年減半,分50年釋放完畢。
EpiKProtocol擁有AI數據標注和AI數據存儲兩大系統,也對應了兩種主要參與方式:
第一類,參與標注AI數據,成為EPK賞金獵人。利用閑暇時間參與標注不同AI領域數據,完成任務越多,EPK收益越高。認真答題還有機會贏取知識徽章NFT,后續可憑借NFT參與EPK空投活動。
第二類,參與存儲AI數據,成為EPK存儲節點。利用閑置的存儲設備即可參與存儲AI有效數據,每個存儲節點需要完成1000EPK的基礎質押才能擁有出塊權。存儲節點是隨機獲得出塊機會的,但是其隨機被選中的概率和其成功存儲的數據大小掛鉤:存的數據越多,被選中概率越高,同一個文件的Top100存儲者享有雙倍算力。
只有通過領域專家驗證過的數據才被計為有效存儲,存儲節點才能獲得算力,因此,為了獲取更多的有效存儲,就需要完成額外的流量抵押。1EPK可以用于訪問10Mib數據,也可用于封裝10Mib數據。目前,基礎抵押提現的解鎖期為0天,流量抵押提現的解鎖期為3天。
結語
EpiKProtocol還開啟了在分布式治理領域的探索,于7月20日發布了EpiKDAO。作為分布式存儲賽道首個DAO治理模型,社區用戶可以借助EpiKDAO參與EpiK生態資源的動態調節,有效保障EpiK社區的可持續發展,修復未來可能發生的資源錯配問題。
隨著Web3.0時代的日益來臨,數據的重要性日益凸顯。EpiKProtocol從數據標注到數據分布式存儲再到對接企業實現數據應用,打造了一個低門檻、高效率的數據收益共享閉環,未來EpiKProtocol如何實現豐富的落地應用場景值得期待。
Tags:EPIKCOLPROTTOCEpik PrimePandora ProtocolDecentralized Community Investment ProtocolHyperbolic Protocol
作者:谷昱 今晚,跨鏈互操作性協議PolyNetwork在以太坊、BSC與Polygon部署的智能合約同時遭到黑客攻擊,價值超過5.9億美元的USDC、ETH等資產被黑客轉移.
1900/1/1 0:00:00本文來自Web3基金會博客。Web3基金會今日在官方博客公布最新第10批Grant項目名單,共涉及28個項目,其中包括PhalaNetwork、MoonbeamNetwork等知名項目.
1900/1/1 0:00:00作者:BenjaminHor 編譯:胡韜 近期,以CryptoPunks為代表的頭像類NFT項目尤其火爆,平均成交價格甚至達到數十萬美元.
1900/1/1 0:00:00本文來源于鏈聞,作者是QiCapital委員會成員Archon,并由PerryWang?編譯外界對加密貨幣、非同質化代幣和基于區塊鏈的去中心化應用燃起極大興趣,推動加密資產估值高企.
1900/1/1 0:00:00鏈捕手消息,據馬尼拉公報報道,菲律賓財政部表示,從AxieInfinity等play-to-earn游戲中獲得的收入需繳納所得稅.
1900/1/1 0:00:00撰文:SungjaeHan,區塊鏈投資機構GenesisBlockVentures 翻譯:盧江飛 最近,Polygon宣布推出了一個名為「Avail」的全新數據可用層.
1900/1/1 0:00:00