一、前言
開門見山,以太坊數據同步是以節點作為數據載體存放和傳輸主要以Header,Body,Reciept組成的數據主體,通過以太坊p2p通信協議管理數據同步事務,最后交給執行器執行最后的數據下載任務。
那么問起數據主體我們進行同步需要同步哪些數據?不同數據又是否需要分類同步?
知道創宇區塊鏈安全實驗室進行了全面而詳細的分析。
二、數據主體:
進行數據同步首先需要明確我們同步的數據主體由什么組成,籠統來分有兩類,一類不需要節點發送主動同步請求,節點會在完成數據打包的時候自行向網絡廣播,這一類數據有三種——完整block,區塊hash,和交易Transaction。而我們今天重點探討下一類數據。
第二類數據是需要節點主動發送同步請求隨后其他節點響應才能進行同步的數據,除了第一類數據其他需要同步的數據都屬于第二類,所以可以說他的種類更加繁雜,而其中最重要的也有三種——區塊頭Header,區塊體Body,交易回執Receipt,跟第一類不同這三者可以說都是完整區塊的某一組成部分,這也顯示了主動同步希望節點進行數據同步時范圍自由可控,能夠優先同步必要數據而放棄同步暫時非必要的數據。
?Header表示區塊頭,在區塊里扮演這相當重要的角色,ParentHash會記錄上一個區塊的區塊hash,uncleHash會記錄叔塊hash,coinbase則標識礦工地址。Root,Txhash,ReceiptHash這三個分別是statetrie,txtrie,Receipt.trie三個前綴樹的根節點RLP編碼hash一個用于描述世界狀態,一個用于描述交易,一個用于描述交易回執。bloom是區塊頭中的布隆過濾器用于快速判斷目標hash是否在某個集合中。Header中以上數據都是區塊頭用來對區塊以及區塊中重要數據模塊利用hash進行標識的。剩下的數據則各有他用不細贅述。可以看出一個區塊頭其實已經將一個區塊框架基本描述出來了這也為后面談到的數據同步策略埋下了伏筆。
觀點:Shapella升級后機構涌向以太坊:金色財經報道,據CME Group官方數據,CME期貨未平倉合約已升至2022年3月以來的最高水平,表明機構交易員涌入加密市場。以太坊于4月12日實施了備受期待的Shapella硬分叉,也稱為上海升級,通過允許隨意提取鎖定的代幣,降低了抵押區塊鏈原生代幣以太幣(ETH)的風險。這一關鍵事件激發了機構對市值第二大加密貨幣(ETH)的興趣。
自4月10日以來,在芝加哥商品交易所(CME)交易的活躍或未平倉的以太期貨合約數量增加了39%,達到6,248ETH。以美元計算,未平倉合約增加了70%以上,達到6.33億美元。
機構通常更喜歡CME期貨等受監管產品,這些產品允許他們在不擁有數字資產的情況下接觸數字資產。因此,與以太幣和比特幣掛鉤的CME期貨被廣泛認為是機構活動的代表。[2023/4/19 14:13:32]
?Body就比較簡明了,里面包含一組交易對象,和一個叔塊的區塊頭數組。
?Receipt是區塊中所有交易對象在執行完成后生成的一個數組,用于記錄交易處理信息。他們會在生成后被逐個插入到Receipttrie中同時也會生成區塊頭中的ReceiptHash。一個交易回執記錄了三部分信息用于交易的管理和標識,第一部分為共識部分,PostState,Status,CumulativeGasUsed,Bloom,Logs只有這五個數據在ReceiptRLP會被encode構成回執hash隨后回執hash會參與共識的校驗,第二部分數據是交易部分,TxHash指的是交易回執所對應的交易哈希,,ContractAddress是當這筆交易是部署新合約時記錄新合約的地址,GasUsed表示該筆交易的Gas使用量,第三部分是區塊部分,他記錄的是BlockHash區塊哈希,BlockNumber當前區塊數,TransactionIndex該交易在區塊中的序號。對于Receipt在數據同步策略中有著直觀的區別,下文說到的fullSync和fastSync最直觀的區別就在于到底是同步對端的Receipt,還是本地自行生成Receipt。
Reese Witherspoon將制作基于以太坊的NFT影視作品:金色財經報道,好萊塢明星Reese Witherspoon將制作基于以太坊NFT系列的電影和電視作品,據媒體報道,Reese Witherspoon的媒體公司Hello Sunshine推出了全新的協議,主要基于以太坊的NFT分類“女孩世界”(WoW)開發電影電視功能。(cryptonewsbtc)[2022/2/28 10:19:47]
三、數據載體
數據傳輸載體為peer節點,這個數據載體peer,如果你在源碼里面去認真尋找你會發現,某些角落里就能找到一個peer.go.首先我列出有關數據同步模塊我所找到的peer結構。有p2p/peer.go,eth/peer.go,les/peer.go,eth/downloader/peer.go。以太坊的網絡也有傳輸層,會話層,表示層和協議層。
那p2p包中的peer扮演了一個底層的節點模型,傳輸層會基于UDP協議發現相鄰peer并維持peer連接,還會基于TCP協議建立peer之間的信息交流通道。會話層Peer管理主要管理的是節點和上層子協議的交互,而NodeTable管理主要管理的是底層基于udp協議構建的節點連接表table。所以p2p這一層的peer節點他需要能獲取和開啟子協議的能力,還需要有ping通其他節點的能力當然還要去接受其他節點消息。這就體現在p2p/peer.go中的3個重要功能模塊,pingLoop,readLoop,startProtocols而這也是peer.run()方法里的3個函數。
分析師:以太坊交易所存量達3個月峰值,轉入交易所量仍在增加:2月19日消息,鏈上分析師Phyrex發推表示,以太坊的交易所存量在繼續堆積,目前已經達到三個月存量的最高值,雖然其價格已在BTC的帶領下止跌,但ETH存量仍沒有減少。除此之外,從今日凌晨開始,雖然ETH的已下跌停止,但是其轉入交易所的量還在增加。并且在ETH的出售方面依然是20天以內的短期籌碼為主,而且籌碼更加年輕化,據SOPR數據顯示,絕大多數的出售籌碼都是虧損狀態,而且虧損比例較高。[2022/2/19 10:02:25]
可以看出上面是底層peer結構,下圖則是子協議層的peer結構,不同的子協議層會有不同的peer結構,這也就是為什么會有eth/peer.go和les/peer.go畢竟不同子協議應用于不同的數據場景。
觀點:以太坊與90年代窄帶互聯網相似,昂貴但生態系統強大:2月6日,三箭資本(Three Arrows Capital)首席執行官Su Zhu發推稱,以太坊與90年代中期的窄帶互聯網階段有相似之處,這讓嚴肅的deeptech投資者興奮不已。盡管笨重、昂貴、規模不大,但強大用戶的生態系統依然強大。未來愿景可能比想象的更快實現。[2021/2/6 19:04:33]
我們可以看出數據載體有底層peer,和子協議層peer,而進行數據同步需要利用通信協議管理連接兩層peer,由底層實現peer的消息分發,消息的監聽,子協議層peer執行數據的下載和同步,而這兩層之間就需要非常重要的protocolManger進行管理和溝通。
四、數據同步流程
那么如何啟動protocolManager呢?我們上面介紹了peer結構,他主要是代表遠程其他節點,在以太坊中還有一類同樣是代表了節點的結構Node,他主要代表了本地節點自身會稍微有點區別,而節點想要啟動p2p網絡就要依靠本地Node模塊,其中利用Node.Start()函數開啟了兩個任務,一個是啟動EthereumService,其中的Ethereum.start就啟動了protocolmanager;另一個是啟動p2p.Server,新建并刷新K桶,開啟UDP端口監聽,同時監聽TCP端口,處理從遠端節點發來的message。
當protocolManager啟動了之后,他就開始需要連接底層邏輯層peer和頂層協議層peer:
獨家|以太坊當前建議Gas費用為132.03Gwei,環比上升24.25%:金色財經消息,據歐科云鏈OKLink鏈上數據顯示,以太坊24h鏈上活躍地址數逾43.37萬,環比上升2.01%;鏈上交易量近468.28萬ETH,環比上升4.04%;鏈上交易筆數逾104.76萬筆,環比上升0.85%。
截至下午2時,以太坊全網算力約為229.8TH/s,環比上升0.72TH/s,建議Gas費用為132.03Gwei,環比上升24.25%,未確認交易數約10.35萬筆。[2020/9/14]
當啟動了protocolManager,首先節點會進行初始化,調用NewProtocolManager,初始化的過程中會調用SubProtocol函數向地城p2p.peer獲取一個消息讀寫通道,然后再構建一個消息處理器Handle,Handle,他不僅會接受請求同步的消息,也會接受節點響應的消息,在protocolManger的start方法中他會啟動一個定期同步協程syncer,他會根據消息通知調用fecher或者downloader執行器執行數據同步。
數據同步模式
主動數據同步指的是本地節點自發的向相鄰節點請求區塊數據,數據入口在eth/downloader/downloader,和eth/handler里
被動數據同步指本地節點收到其他節點數據同步消息而后請求區塊數據,數據入口在eth/fetcher/fetcher.go
主動同步流程我們以主動同步為例,當調用downloader執行器時,他會先調用findAncestor找到本地鏈和遠程鏈的共同祖先,從共同祖先開始同步,他會配置4個fetchers,分別是fetcherHeader,fetcherBodies,fetcherReceipts,ProcessHeaders最后根據同步模式調用收到processFullSyncContent和processFastSyncContent最后調用spawnSync執行同步。
以上為同步過程的源碼,從源碼里可以看出主要的下載任務是集中在他構造的可拓展fetchers里,他是一個fetcher任務隊列。而根據不同的數據同步策略他的fetcher任務隊列不僅構造不同,fetcher之間的協作流程也不盡相同。
五、數據同步策略
fetcher任務隊列的作用概括起來就是在進行,數據填充,數據組裝,和最后的數據插入。而其中填充什么樣的數據,那些數據需要組裝,什么時候插入數據,均由一個重要的數據結構mode進行標識,他代表了數據同步策略,主要分為三種。
lightSync:輕節點同步,數據填充的時候只填充區塊頭數據,不需要進行數據組裝,調用insertHeaderchain直接插入區塊頭。
fullSync:全節點同步,數據填充的時候需要填充區塊頭Header,區塊體Body,但不填充交易回執Receipt,將數據組裝到結果集Result,之后調用importBlockResults將結果集內數據插入到主鏈,和lightSync區別在于輕節點同步沒有區塊體,所以他不會執行和驗證交易而fullSync全節點同步會在插入數據的同時執行交易并驗證這也是他為什么同步速度慢的原因,之后會自行生成交易回執Receipt,所以他在填充組裝的時候不需要Receipt參與。
fastSync:快速同步,數據填充的時候會填充Header,Body,同時也會填充Receipt,然后組裝3個數據,執行數據插入,而在執行數據插入的時候和fullSync,lightSync完全不同,他調用的commitFastSyncData這個函數和fullSync全節點同步調用的importBlockResults不一樣他不會執行交易而只是提交同步數據,所以他為了保證安全加了一步驗證獲取來的交易回執。而這也才是快速同步的一部分,快速同步為了保證數據的安全性古老的區塊會使用上述方法同步,對于時間上來說比較新的區塊會使用fullSync的同步模式進行同步。用而言之就是fastSync會快速同步一大部分而一小部分還是會按照fullSync的同步模式同步。
六、結語
以太坊數據同步非常復雜,他涵蓋了其網絡架構,通信協議管理,數據傳輸通道的相互配合,數據同步策略的安排,以及加速數據同步速率的算法。其中還有眾多細節和邏輯關系。而數據同步是區塊鏈節點和外界通信的基石他還有更多的架構彩蛋令人拍案叫絕。期待后續文章和大家分享。
拓展閱讀: 詳解Arweave系列一:什么是Arweave?詳解Arweave系列三:Arweave初學者必不可少的工具詳解Arweave系列四:何上傳數據到Arweave如果你不精通區塊鏈和加.
1900/1/1 0:00:00“波卡知識圖譜”是我們針對波卡從零到一的入門級文章,我們嘗試從波卡最基礎的部分講起,為大家提供全方位了解波卡的內容,當然這是一項巨大的工程,也充滿了挑戰.
1900/1/1 0:00:00Amanda DataSource:Find100xToken區塊鏈世界機會從來不缺機會,從FootprintAnalytics數據上看,單看過去一年.
1900/1/1 0:00:00上周,我讀了JaronLanier的《虛擬現實:萬象的新開端》一書,并產生了兩個想法:1.他的名字發音有一種柏拉圖式的美2.在重要技術的開發中,早期做出的小決定在幾十年后可能徹底改變世界.
1900/1/1 0:00:00后知后覺金錢消失術 在加密世界中,私鑰管理和保持私鑰安全性,一直是個重要的話題。近日,當下最流行的NFT游戲AxieInfinity側鏈RoninNetwork受到黑客攻擊,造成價值約6.1億美.
1900/1/1 0:00:00根據官方新聞稿,昨日,金融服務應用Dave與加密貨幣交易平臺FTXUS達成戰略合作伙伴關系,并獲得FTXVentures的1億美元投資.
1900/1/1 0:00:00