比特幣行情 比特幣行情
Ctrl+D 比特幣行情
ads
首頁 > MATIC > Info

ARE:AI Arena:掌握游戲機制 訓練你的下一個拳王

Author:

Time:1900/1/1 0:00:00

人工神經網絡

一個最重要的創新:人工神經網絡

簡單來講,神經網絡意味著理論上它可以學習任何用戶動作的映射!

為了介紹一會兒將使用的一些術語,從狀態到行動的映射將被稱為“策略”。

為了讓拳手的神經網絡學習策略,AI Arena將采取模擬學習和強化學習。其中神經網絡架構存儲在IPFS上。

在上圖中,神經元之間的連接稱為“權值”。當你的神經網絡正在“學習”時,所發生的是它正在改變權值的值。

高通孟樸:混合 AI 將助推 AI 規模化擴展:金色財經報道,高通公司中國區董事長孟樸近日在第七屆世界智能大會上表示,在 5G 加持下,隨著生成式 AI 的飛速普及和計算需求的日益增長,混合處理的重要性空前凸顯。他表示,與僅在云端進行處理不同,混合 AI 在云端和邊緣終端之間分配并協同處理 AI 工作負載,這樣才能實現 AI 的規模化擴展并使其發揮巨大的潛能。混合 AI 架構可以根據模型和查詢需要的復雜度等因素,選擇不同的方式在云端和終端側之間分配任務負載,也可以完全在終端側進行;如果是更復雜的任務,模型則可以跨云端和終端進行運行。混合 AI 將在全球范圍內提供成本、能源、性能、隱私、安全和個性化方面的優勢。[2023/5/22 15:17:26]

權值最終將決定狀態如何映射到動作,這意味著我們可以將權值解釋為“智能”。

神經網絡權值對于每個NFT都是唯一的,并存儲在以太坊上。

Nvidia 發布用于創建安全 AI 模型的工具:金色財經報道,Nvidia 推出 NeMo Guardrails 工具,以幫助開發人員確保生成 AI 的準確性、相關性和安全性。NeMo Guardrails 允許開發人員對其語言模型 (LLM) 應用三種不同類型的限制。據 Nvidia 稱,NeMo Guardrails 適用于所有語言模型,包括 ChatGPT。該公司還聲稱幾乎所有軟件開發人員都可以使用該工具。[2023/4/26 14:28:30]

AI設計機制全攻略

狀態

(1)什么是狀態?

狀態是環境在某個時間點的表示。它并沒有包含所有信息——只包含了其中必要的信息。

例如:研究人員使用屏幕上的所有像素作為狀態,讓AI計算出像素代表什么。然后根據他們認為對決策過程重要的因素進行人工調試。

元気星空攜手百度飛槳,推出“數字彼岸”AI x NFT 藝術創作計劃:2021年10月8日,元気星空(METACHI)宣布與百度飛槳共同推出數字彼岸大型AI藝術創作計劃。該計劃旨在匯聚知名藝術家、設計師和AI開發者,共同基于飛槳開源深度學習平臺創作AI&NFT跨界作品,為文化藝術行業創造AI新動能。[2021/10/9 20:15:41]

AI Arena一再強調其關心的是為所有人提供平等的機會——團隊希望獎勵能夠更多地給予堅持訓練AI的用戶,而不是獎勵擁有更多資源的用戶。

(2)游戲將使用哪些變量?

下面是狀態中包含的變量列表。需要注意的是,AI Arena將使用下標1表示用戶自己的AI,下標2表示對手。

此外,競技場的左邊界的X位置為0,右邊界的X位置為1。

公告 | 雪碧交易平臺2月25日開啟Deep AI Network的認購:據官方消息,Deep AI Network(簡稱DAN)將于雪碧交易平臺開啟兩輪認購,第一場2月25日17時-18時,1DAN=0.12USDT;第二場2月26日17時-18時,1DAN=0.24USDT,用戶認購前需實名且持有7000個XB。平臺將于2月27日14:00開放DAN/USDT交易。

深度AI網絡(Deep AI Network),是一個實踐了“人工智能+區塊鏈”的區塊鏈產品,能夠在區塊鏈上實現智能協作、開源的底層系統,打造了一個平臺,提供了相應的編程語言,使開發人員能夠利用人工智能算力和區塊鏈技術來建立和發布分布式應用。

雪碧交易平臺成立于2019年,創始團隊來自火幣,已獲得BiKi產業基金戰略投資,注冊用戶約10萬,是一家“社區聯邦制”的數字資產交易平臺。[2020/2/24]

訓練

動態 | Huobi Mena和AI Trader合作推出混合智能交易模式:據blokt消息,11月1日,Huobi MENA宣布,已與AI Trader合作推出一個基于人工智能(AI)的自主數字資產交易系統,該系統允許用戶在交易活動中整合深度學習技術。Huobi MENA主要面向非洲、中東、南亞市場。[2018/11/2]

(1)訓練概述

這是改變神經網絡中權值的過程,以使AI能夠起作用。

例如:如果我們在對手面前,我們可能希望我們的戰士出擊。

有一系列的權值可以實現這一點,訓練的重點是讓AI學會在特定場景中采取特定的行動。

AI Arena在應用程序中嵌入了以下培訓計劃:

模仿學習

為了學習如何戰斗,你的AI將觀察你并學習模仿你的動作。

自我學習

為了學習你無法教給它的技能,你的AI將與自己的副本對抗,以不斷提高。

(2)為什么需要訓練?

1·隨機初始化

首次創建NFT拳手時,神經網絡權值也隨之生成。一開始它會隨機采取行動,因為它不知道在什么情況下應該采取什么行動。

因此為了準備戰斗,我們必須訓練它,使它學會一個好的作戰策略。

2·隨機策略

正如上文“神經網絡”部分中提到的,從狀態到動作的映射稱為策略。

換句話說,策略定義了代理在某些情況下的行為方式。在訓練之前,NFT拳手還沒有學會一個好的戰斗策略,所以只是隨機行動。

(1)通過觀察學習

理解模仿學習的最好方法是想象你是一個師父,你的AI是一個你正在準備戰斗的戰士。

你用你的人工智能進行搏擊,它學習模仿你在特定場景中的動作。

我們正在寫一篇關于模仿學習的綜合博文,到時候會將其鏈接到這里。

(2)演示

實際情況:你實際操控的是左邊的灰色拳手,而你的AI在右邊。你可以測試一些動作,觀察AI如何模仿你。

請注意:它不會立即復刻你的動作,因為神經網絡需要一點時間來學習,所以在AI學會之前,你可能需要多重復幾次你的動作。

為簡單演示,目前AI Arena只允許用戶使用這些操作:向左跑、向右跑、單拳、雙拳和防守。

(1)完美匹配

最完美的拳擊搭檔就是用戶自己。通過自我學習,你的AI總是在不斷地挑戰自己,不斷地改進。

(2)不同的學習范式

通過模仿學習,AI通過觀看演示進行學習。在自我學習中,AI像對手一樣學習和戰斗沒有多大意義,因為對手是人工智能本身的克隆。

但是如果沒有專家向人AI展示如何戰斗,那么它如何學習該做什么呢?——通過獎勵。

AI將學會采取給予它更多正向獎勵的行動,而減少采取給予它負面獎勵的行動。

定制訓練

Python環境[正在準備中]

AI Arena計劃為玩家引入一個python環境來訓練他們自己的模型。

目前,用戶僅限于使用團隊在應用程序中提供的兩種培訓方法;但不久的將來,應用程序將可以允許玩家導入其自定義培訓模型并上鏈。

游戲模式探索

戰斗

AI Arena目前有兩種可用的作戰模式:模擬賽和排位賽。除此之外,團隊計劃在不久后整合另外兩種作戰模式。

1)模擬賽

玩家可以在對抗競技場測試他們的拳手來預先訓練的AI。在這種模式下將沒有任何獎勵。

2)排位賽

玩家將讓他們的拳手去對抗來自世界各地的拳手。玩家的唯一目標就是努力攀登排行榜,成為競技場的冠軍!

玩家在排行榜上的排名越高,贏得一場戰斗的回報獎勵就越高。

3)目標

雖然每種戰斗模式都有其獨特之處,但它們都有一個共同的勝利目標:在指定的時間內消耗對手所有生命值。

鏈金交易員總結

目前AI Arena尚處在早期,很適合提前埋伏觀察。據官方透露,游戲正式版本大概率于明年推出,而今年年末推出的測試版本將只有白名單用戶可以參與體驗。

白名單用戶名額的獲取方式是參與團隊即將推出的解密游戲,通過游戲后的用戶將會被隨機選擇是否進入白名單。

有興趣的玩家可以加入他們的Discord嘗試體驗,大概率后期會有早鳥空投獎勵。

Tags:ARERENRENANFTCAREOREN GameMiner ArenaHurricane NFT

MATIC
DRACO:超像Axie?數萬粉絲鏈游Dracoo Master新手攻略

Dracoo Master 是第一款真正由社區擁有和管理的紙牌游戲。玩家可以組建Dracoo團隊與他人競爭,并通過戰斗獲得獎勵.

1900/1/1 0:00:00
AVA:Footprint Analytics:跨鏈風口上的明星項目 Kava 能否逆盤翻轉?

撰文:Footprint Analytics 分析師 George日期:2021 年 12 月11 月,Kava 發布 Kava 9 主網升級預告.

1900/1/1 0:00:00
DERI:Deri Protocol 去中心化衍生品賽道的遺珠

Deri Protocol 在產品機制上采用了「交易價格按照預言機成交,全體 LP 共同承擔兌付責任」,并且利用資金費率機制平衡裸頭寸.

1900/1/1 0:00:00
Rizon:一文帶你暢游來自Meta的元宇宙Horizon Worlds

快來Meta 開放虛擬世界 Horizon Worlds,一起冥想、乘船、大逃殺。在Facebook Connect 2021 大會后的一個多月,Meta 終于邁出了讓元宇宙成為現實的第一步——.

1900/1/1 0:00:00
AVE:Arweave:Web3.0存儲破局者

作者:Nicole Cheng?(Investment Manager of OFR),?Mstone?(Analyst of OFR)Advisor:?JX?(Partner of OFR)新.

1900/1/1 0:00:00
ETH:ETHDenver上5個獲獎新項目一覽

ETHDenver 2022 剛剛結束,這是全球規模最大的 Web3 會議,每年都會吸引大量來自世界各地的區塊鏈協議的愛好者,設計師和開發者來參加黑客馬拉松.

1900/1/1 0:00:00
ads