機器學習技術在幣種分析中的應用
談到機器學習,大家可能會對這個AI方面的概念比較陌生,但如果提到谷歌AlphaGo,大家肯定就很熟悉了。當年谷歌人工智能程序通過機器學習的方式掌握圍棋比賽技巧后,輕松擊敗了多個國家的圍棋冠軍,時隔3年世界冠軍韓國李世石宣布退役時,還高呼AI不可戰勝......通過機器學習訓練后的計算機程序,在某些類似比賽和交易這樣的博弈場景中,是比人類具有更高勝率的。
非小號研究本次就做了一個硬核的試驗:將機器學習技術應用在幣種分析中,看看會有什么好玩的結論,以及是否真的能夠幫助我們判斷、交易。
我們的具體課題是,通過現有的市場公開數據預測明日收益率為正還是為負。
這是一個二分類問題,我們可以使用的模型有很多,這里我們選用了以下模型用于實驗:邏輯回歸LR、線性判別分析LDA、二次判別分析QDA、支持向量機SVC、決策樹DT、隨機森林RF、漸變提升樹GBC等。
本次用來試驗的數據主要有三個方面:
WBF已上線項目PCCD與華融基金深度達成戰略合作:據官方消息,新加坡WBF交易所已經上線的PCCD美業生態攜手華融基金深度達成戰略合作,第一階段銷毀尚未發行的9000萬枚決定永久銷毀(打入黑洞)減半計劃屆時PCCD進入絕對通縮的時代,將權利回饋給用戶、將權益交給玩家減半計劃將對PCCD社區建設和生態發現帶來積極響應。[2021/3/19 19:01:38]
1、資產的歷史數據;
2、相關品種,如黃金原油美國三大股指等;
3、幣圈相關幣種數據,主要是主流幣。
完整的機器學習建立流程
1.首先,特征工程
特征工程是機器學習中最關鍵的步驟,沒有之一。
這有別于大眾認知的AI能解決一切問題,人工智能是萬能的認知。真實的情況是數據科學家們常掛在嘴邊的一句話是“輸入的是垃圾,輸出的也一定是垃圾”,這意味著特征工程做得好不好會直接影響AI的“智商”。
工信部辛國斌:推動區塊鏈與金融深度融合 提高企業融資便利性:10月22日,在2020金融街論壇年會上,工業和信息化部副部長辛國斌表示,支持銀行在合理區間自主、理性確定對制造業相關企業的貸款利率,發揮貸款市場報價利率方向性和指導性作用。辛國斌稱,通過引導貸款利率下行等方式,推動金融部門降低企業融資綜合成本,強化金融科技創新,推動大數據、云計算、區塊鏈、人工智能與金融深度融合,提高制造企業融資的可得性和便利性。(新京報)[2020/10/22]
特征工程不止是數據需要清洗重新組合,還需要將數據進行標準化處理。
2.其次,建模
建模是一個簡單的過程,模型在那里,無非是灌入數據后不斷地調參優化。國內很多大互聯網公司的AI團隊也都是在常用模型中選擇靴子不斷優化,大家的過程都是一樣的,沒有什么捷徑。
3.評價模型效果
模型的效果評估有很多,常見的有MSE,MAE,取代矩陣,ROC等。
聲音 | 數字貨幣專家:中國市場有必要深度學習Libra的設計架構和運行方式:近日,數字貨幣專家王林曦博士接受采訪時表示,未來數字經濟的發展,扁平化、一體化、成本共享化的勢頭日趨明顯。以金融驅動創新,以支付引領產業,將在未來趨于常態化。一個新產業的打造,一個新產品的發展,都離不開全球市場通過互聯網進行聯動。產品是全球的,技術是世界的,這樣的思維將越來越成為互聯網經濟的共識。而金融工具和數字貨幣的普及,將有可能成為鏈接下一個互聯網浪潮的契機。中國市場有必要深度學習Libra的設計架構和運行方式,利用數字貨幣的特點對現有的中國互聯網特色的在線生態系統進行升級,并積極探求由中國人民銀行授權發行央行數字貨幣的可能性。(經濟網)[2019/10/16]
4.最終,應用
當模型對數據的可解釋度良好時,模型可用。一般這個可解釋度要達到80%以上,90%以上更好,但如果100%可解釋就需要注意是否出錯了。
對BTC的解釋性
動態 | 人民創投區塊鏈研究院報告:區塊鏈技術日漸成熟 將與實體經濟深度融合:人民創投區塊鏈研究院《中國區塊鏈政策現狀及趨勢分析報告》今日發布。報告指出,通過技術手段來改變監管方式,提高監管效率,降低監管成本,提升自身的服務能力,基于區塊鏈的規制系統將有助于提高監管的有效性,用區塊鏈技術來監管區塊鏈市場是未來監管的新方向。區塊鏈行業監管將在市場、信息管理、服務提供、加密貨幣管理等層面進一步完善,并呈現出規范化、全面化發展趨勢。該報告最后總結表示,未來,隨著區塊鏈技術的成熟,該技術將與實體經濟深度融合,將進一步改變市場結構,重塑商業業態,帶有共識機制和智能合約技術的新生態系統與現有產業融合,升級現有的商業模式、業務模式、及監管模式。[2019/9/5]
數據一
僅有高開低收量,及高開低收量計算的技術指標作為訓練數據。得到各個模型解釋度如下表所示:
由上表可以得到,單純的用高開低收量和技術指標作為特征,在以上機器學習模型中訓練,無法很好地解釋價格。其實僅從這里就能看出幣圈屬于弱勢有效市場。技術分析得到的尺度是判斷二分類正確概率是50%,即模型無效,也與弱勢有效市場中技術分析無效,基本面分析和內幕信息有效相吻合。
聲音 | 發揮衍生品的作用需深度理解該工具的意義:本期金色相對論以“區塊鏈金融衍生品,魔鬼or天使?”為主題,在辯論環節,方圖FOTA.comCEO蔡良濱表示,其實衍生品的意義第一在于提供套期保值的工具,第二在于幫助市場進行價格發現,第三在于幫助投資者實現雙向投資,第四可以增加標的本身的維度多樣性,只有深度理解了衍生品工具的意義,才有可能真正發揮衍生品工具的市場意義。[2018/12/28]
市場包含三種信息:歷史信息,公開信息和內幕信息。
各種信息分別對應不同分析交易策略:歷史信息對應技術分析;公開信息對應的基本分析;內幕信息對應的內幕交易。
當市場有效時,市場已反映三種信息,故對三種信息的分析均值不能在市場獲得優勢,某種分析和交易策略均值無效;當市場為半強勢有效時,市場已反映公開信息和歷史信息,故技術分析和基本分析無效,內幕交易有效;當市場為弱有效市場時,市場只反映歷史信息,故技術分析無效,基本分析和內幕交易有效。
數據二
不但有高開低收量數據,我們還增加了相關品種的數據,如美國三大股指,黃金,原油,幣圈主流幣種等作為訓練數據。
為什么認為美國三大股指,黃金,原油,幣圈其他主流幣種等數據可以插入基本面數據?
雖然這些因素不是直接影響BTC的基本面因素,但是它們和BTC由相同的基本面因素影響,所以這些數據中包含很少的一部分基本面信息。
由上表可以得知:在增加基本面替代特征后,解釋度提升了10%以上。
那么提高多少可解釋度是模型極限?
經過1000次的實驗得到,當隨機因子為1730時,隨機森林RF模型的可解釋度67%,這是所有實驗中所有模型中可解釋度最高的一組。
模型效果的衡量:
混淆矩陣
混淆矩陣就是分別統計分類模型歸錯類,歸對類的觀測值個數,然后把結果放在一個表里展示出來。這個表就是混淆矩陣,把預測情況與實際情況的所有結果兩兩混合,結果就會出現以下幾種情況,就組成了混淆矩陣。如下:
ROC曲線
ROC曲線,又稱接受者操作特征曲線。該曲線最早應用于雷達信號檢測領域,用于區分信號與噪聲。后來用于評價模型的預測能力,ROC曲線是基于混淆矩陣得出的。
ROC曲線中的主要兩個指標就是真正率和假正率,其中橫坐標為假正率,縱坐標為真正率,下面就是一個標準的ROC曲線圖。
橫軸FPR:1-TNR,1-Specificity,FPR越大,預測正類中實際負類越多。
縱軸TPR:Sensitivity(正類覆蓋率),TPR越大,預測正類中實際正類越多。
為什么解釋性不強?
1.交易量數據造假
2.未有數據披露制度約束,未形成一體的基本面數據
3.市場有可能存在內幕信息
目前我們模型中的數據還不夠全面,仍然需要更多的努力揭示更多的基本面信息,才能更好地解釋BTC價格。
在披露更多信息時,才能促進市場效率的提高,促進幣圈的發展,這也是“非小號”作為機構應該做且做好的事情。
是否有使用價值?
雖然機器學習在解決傳統問題時都要求正確率達到80%甚至90%以上才可以使用,但是我們能否使用一個解釋度在60%-70%之間的模型?
-1.模型是有解釋度的,60%也遠高于50%,長期預測勝率顯著高于50%的多空各一半的平均水平,這有點類似賭場莊家在輪盤賭中有概率優勢一樣,時間越久贏面越大;
-2.加入限制條件時可以提高概率,單次若想取得概率優勢只能限制使用條件
如下所示為決策樹輸出的樹形圖,用紅色框起來的枝杈正確率很高,但是只有滿足層層條件后才會有交易機會。為了達到盈利目的,交易者要在交易機會與單次交易盈利水平中找到平衡點。
單個樹杈局部圖如下所示,當滿足紅框圈住的條件時,正確率提高到93%,這完全達到了使用要求:
對ETH和TRX的解釋性
從模型訓練結果看,已知特征使用以上模型訓練時,可解釋度也在60%-70%之間。下面我們列舉一些有價值的樹杈,樹杈概率的提高是基于條件概率提升的。
ETH
由以下ETH樹形圖可以看出,當同時滿足條件
美元比eth收盤價<0.01,eth昨日成交量<3956783616,原油成交量>117392.5,漲跌幅>0,黃金開盤價<1489.25時,時,有93%的正確率,這時交易機會是總交易機會的19.05%(28/147)。
TRX
由以下TRX樹形圖可以看出,當同時滿足條件bch<289.51,bsv>63.5,美元比eth調整后收盤價>0.01,納指收盤價<8371.12,道指最低價>24290.5,美元比eth收盤價>0.01,瑞波幣收盤價<0.32時,有82%的正確率,這時交易機會是總交易機會的23.68(36/152)。
如果以上使用機器學習來分析不同幣種交易機會的流程沒看懂,也沒有關系,涉及到的知識比較復雜。所以,非小號后期將應用很多大數據或AI等技術幫助大家建立分析模型,直接在APP中為大家提供易懂和好用的幣價預測工具或投資策略參考,一鍵體驗。
導語: 去中心化交易,現在徹底火了。特別是近期Uniswap交易量趕超CoinbasePro,更是讓篤信去中心化交易的從業者,感受到了信心.
1900/1/1 0:00:008月30日,加密貨幣研究機構BlockchainToken網站發布消息,公布了全球2020交易所“信用評級機構業務市場化排名”的情況和此次評價的結果.
1900/1/1 0:00:00牛不言頂,熊不言底。昨天早間拿的單子,下午在以太坊400關口止盈,雖然有些可惜,但還是需要在以太坊400關口附近緩緩,畢竟以太坊還是比較強勢的.
1900/1/1 0:00:00親愛的用戶: 根據先到先得規則,紅米YFV挖礦基金申購已結束,一共籌集資金502,000USDT.
1900/1/1 0:00:00巍然說幣周評:BTC今日先跌后漲,本周完美止盈1740個點!昨晚比特幣又進行了一波探底,應該是說殺跌和誘空比較合適,畢竟快速的破了新低,然后隨后就快速的反彈了回來,日線上總算緩和了一下.
1900/1/1 0:00:00親愛的用戶: 幣安將于2020年09月07日10:00上線TRXUSD1-75倍次季1225幣本位交割合約.
1900/1/1 0:00:00