比特幣行情 比特幣行情
Ctrl+D 比特幣行情
ads
首頁 > Ethereum > Info

MIX:區塊鏈入門 | 從算法層講清楚以太坊工作量證明

Author:

Time:1900/1/1 0:00:00

作者:七哥

來源:登鏈社區

編者注:原標題為《也許是國內第一篇把以太坊工作量證明從算法層講清楚的》

對于沒有把數學學會的同學來說,如果希望從算法層了解以太坊的工作量證明是非常困難的。一本黃皮書會難倒一大批吃瓜群眾。因此,本文將試圖使用圖文和盡量簡單的數學來解釋以太坊挖礦工作量證明,包括以太坊是如何對抗ASIC1、如何動態調整挖礦難度、如何校驗挖礦正確性的。

認識工作量證明PoW

工作量證明是一種對應服務與資源濫用、或是拒絕服務攻擊的經濟對策。一般是要求用戶進行一些耗時適當的復雜運算,并且答案能被服務方快速驗算,以此耗用的時間、設備與能源做為擔保成本,以確保服務與資源是被真正的需求所使用。

摘自維基百科

這種經濟性應對政策概念,是在1993年提,直到1999年才使用Proof-of-Work一詞。

ProofofWork,直接翻譯過來是工作量證明。這個詞的中文直接聽起來有點不知所云。實際上如果我跟你說結婚證明,離職證明,那你是不是首先想到的是一張上面印著一些東西的紙呢?別人看到這張紙就知道你的確結婚了,或者你的確從某單位離職了。工作量證明從語法上也是一個邏輯,也可以理解成一張紙,通過這張紙就可以證明你的確完成了一定量的工作。這就是工作量證明的字面意思。

那工作量證明有什么特點呢?我們拋開計算機,用現實世界的例子來說明。例如我上課不認真,老師罰我把《桃花源記》抄寫十遍,我用了兩個小時的勞動,最后給老師的就是一張紙,而老師要確認我的確付出了大量勞動,其實只需要看一眼就可以了。這個例子道出了POW機制的一大特點,那就是生成需要花費大量勞動,但是驗證只需一瞬間。另外一個工作量證明的例子可以是,老師給我出一道題,我給老師的運算結果,或者說就是最后的那個數字,就是我的工作量證明。回到計算機情形下,紙當然是不存在的,所以所謂的工作量證明就是花費了很多勞動而得到的一個數了。

再說說POW最早的用途。人們在使用電子郵件的時候會收到垃圾郵件的騷擾。如果沒有成本,那么發送一百萬封郵件的確是很輕松的事情了。所以,聰明的人就會想,如果讓每一封郵件發送時候,都有一個微小的成本,那么垃圾郵件就會被很大程度的遏制了。而POW就是為了服務這個目的產生的。基本過程就是郵件接收方會先廣播一道題出去,郵件發送方發郵件的時候必須附帶上這道題的答案,這樣郵件才會被接受,否則就會被認為是垃圾郵件。

摘自:https://zhuanlan.zhihu.com/p/42694998

業內專家:區塊鏈等演化生成的基礎設施已成為支撐我國產業躍遷的重要基礎:業內專家表示,當前以5G、工業互聯網、人工智能、區塊鏈等新一代信息技術演化生成的基礎設施,已成為投資熱點和支撐我國產業躍遷的重要基礎,但技術工人群體在數量、能力上的“適配性”壓力卻依舊存在,技能人才結構性缺乏帶來的挑戰或將加劇。未來,夯實復合型技術人才壯大產業轉型生力軍仍需產學研進一步形成合力。(經濟參考報)[2020/6/16]

挖礦

挖礦就是在求解一道數學方程。方程的多個可能的解被稱為解的空間。挖礦就是從中尋找一個解。不同于幾何方程,這個挖礦方程有如下特點:

1.沒有比窮舉法更有效的求解方法;

2.解在空間中均勻分布,每一次窮舉查找到解的概率基本一致;

3.解的空間足夠大,保證一定能夠找到解;

假設挖礦方程是:n=random(1,10),求n<D。

當D為10時,我們只需要運算一次就可以找到任意的n都滿足n<10,可當D=5,則平均需要兩次運算才能找到n<5,隨著D的減小,需要運算的次數就會增大。

這里的D就是通常說的挖礦難度,通過調整解空間中的符合要求的解的數量來控制求解所需要嘗試的次數,間接的控制產生一個區塊所需要的時間。使得可以調控和穩定區塊間隔時間。

當挖礦的人很多,單位時間內嘗試次數增多時,求解的速度也就更快,區塊挖出用時更短。此時則增大挖礦難度,增大平均嘗試次數,使得挖礦耗時上升。反之依然。

以太坊新區塊挖礦流程

通過父區塊可計算新區塊的挖礦難度,再求解挖礦方程。

挖礦工作量證明通過一個密碼學安全的nonce來證明“為了獲得挖礦方程解n,已經付出了一定量的計算”。工作量證明函數可以用PoW表示:

其中

1.?

是新的區塊頭,但nonce和mixHash均為空值;2.

動態 | 韓國區塊鏈初創公司獲800萬美元投資,用于其身份認證服務:據CoinTelegraph報道,韓國區塊鏈初創公司Iconloop已從參與A輪融資的七家投資公司獲得了100億韓元(800萬美元)的資金。Iconloop計劃將募集的資金用于啟動其基于區塊鏈的數字身份認證服務“ my-ID”。[2019/10/11]

?是區塊difficulty值。;3.

?是區塊mixHash值;挖礦方程算法返還的第一個參數值;4.

是區塊nonce值;挖礦方程算法返還的第二個參數值;5.d是一個計算mixHash所需要的大型數據集dataset;6.PoW是工作量證明函數,可以得到兩個值,其中第一個是mixHash,第二個是密碼學依賴于H和d的偽隨機數。

這個基礎算法就是挖礦方程Ethash。通過可以信任的挖礦方程求解,來確保區塊鏈的安全性。同時,挖出新塊還伴有區塊獎勵,所以工作量證明不僅提供安全保障,還是一個利益分配機制。

下面是挖礦工作量證明的計算過程:

大致流程如下:

1.根據父區塊頭和新區塊頭計算出

;2.在PoW開始時選擇一個隨機數作為Nonce的初始化值;3.將Nonce和作為挖礦方程Ethash的入參;4.執行Ethash將得到兩個返回值:mixHash和result;5.判斷result是否高于

。如果是則nonce加1,繼續窮舉查找;否則,如果是則說明求解成功。返回mixHash和Nonce;6.兩個值記錄到區塊頭中,完成挖礦。

聲音 | 李曉鵬:金融機構要應用區塊鏈等科技手段來識別分析企業風險:據人民網消息,中國光大集團黨委書記、董事長李曉鵬委員表示,金融機構從事普惠金融業務,需做好產品創新。一方面,金融機構要應用大數據、區塊鏈、人工智能等科技手段來識別、分析企業風險,增強各類風險管控能力;另一方面,要積極進行產品創新,結合小企業貸款金額小、希望放貸速度快的要求開發新產品,特別是免擔保、免抵押的信用產品。[2019/3/6]

區塊難度difficulty

以太坊的挖礦難度記錄在區塊頭difficulty上,那么在它是如何動態調整的呢?

調整算法在以太坊主網有多次修改,即使以太坊黃皮書中的定義也和實際實現代碼也不一致,這里我以程序實現代碼來講解區塊難度調整算法。

其中有:

是創世區塊的難度值。難度值參數

被用來影響出塊時間的動態平衡。使用了變量而非直接使用兩個區塊間的時間間隔,是用于保持算法的粗顆粒度,防止當區塊時間間隔為1秒時只有稍微高難度情況。也可以確保該情況下容易導致到軟分叉。

-99的上限只是用來防止客戶端安全錯誤或者其他黑天鵝問題導致兩個區塊間在時間上相距太遠,難度值也不會下降得太多。在數學理論是兩個區塊的時間間隔不會超過24秒。

難度增量∈會越來越快地使難度值緩慢增長,從而增加區塊時間差別,為以太坊2.0的權益證明切換增加了時間壓力。這個效果就是所謂的“難度炸彈”或“冰河時期”。

以太坊的設想是最終從PoW過度到PoS,為了給過度施加時間壓力,所以在區塊難度中預埋了一個難度炸彈∈,他是以2的指數級增長的。如果聽過“棋牌擺米”的數學故事,就應該清楚指數級增長是非常恐怖的。

最終,在拜占庭版本中,伴隨EIP-649,通過偽造一個區塊號

動態 | 阿里巴巴農場整合區塊鏈溯源等技術提高農事效率:據中國新聞網消息,湖北省秭歸縣水田壩鄉王家橋村部分臍橙園被納入阿里巴巴未來農場秭歸臍橙首期項目。農場整合了電子數據監測、水肥一體化滴灌、區塊鏈溯源以及光電分選系統,實現了無人化種植,提高了農事效率和精準度。[2018/10/30]

來延遲冰河時期的來臨。這是通過用實際區塊號減去300萬來獲得的。換句話說,就是減少∈和區塊間的時間間隔,來為權益證明的開發爭取更多的時間并防止網絡被“凍結”。

在君士坦丁堡版本升級中,以太坊開發者在視頻會議中表示,如果直接執行難度炸彈,那么難保以太坊能順利切換到PoS就有大量礦工離開,這很有可能極大的影響以太坊的安全性。因此,伴隨EIP-1234,再一次修改

到500萬來延遲冰河時期。

這個挖礦難度調整機制保證了區塊時間的動態平衡;如果最近的兩個區塊間隔較短,則會導致難度值增加,因此需要額外的計算量,大概率會延長下個區塊的出塊時間。相反,如果最近的兩個區塊間隔過長,難度值和下一個區塊的預期出塊時間也會變短。

挖礦方程Ethash

區塊鏈鼻祖比特幣,是PoW共識,已經穩定運行10年。但在2011年開始,因為比特幣有利可圖,市場上出現了專業礦機專門針對哈希算法、散熱、耗能進行優化,這脫離了比特幣網絡節點運行在成千上萬的普通計算機中并公平參與挖礦的初衷。這容易造成節點中心化,面臨51%攻擊風險。因此,以太坊需要預防和改進PoW。因此在以太坊設計共識算法時,期望達到兩個目的:

1.抗ASIC1性:為算法創建專用硬件的優勢應盡可能小,理想情況是即使開發出專有的集成電路,加速能力也足夠小。以便普通計算機上的用戶仍然可以獲得微不足道的利潤。2.輕客戶端可驗證性:一個區塊應能被輕客戶端快速有效校驗。

在以太坊早期起草的共識算法是Dagger-Hashimoto,由Buterin和Dryja提出。但被證明很容易受到SergioLerner共享內存硬件加速的影響。所以最終拋棄了Dagger-Hashimoto,改變研究方向。在對Dagger-Hashimoto進行大量修改,終于形成了明顯不同于Dagger-Hashimoto的新算法:Ethash。Ethash就是以太坊1.0的挖礦方程。

Oracle將在其服務中實施區塊鏈: Oracle文計劃將區塊鏈引入企業客戶的云服務。 Mark Rahmilevich公司的區塊鏈產品開發部門負責人宣布了這一消息。 根據Mark Rakhmilevich的說法,區塊鏈將簡化監控并提供持續備份的可能性,并使設置更加靈活。[2018/1/22]

介紹

這個算法的大致流程如下:

1.通過掃描區塊頭直到某點,來為每個區塊計算得到一個種子Seed。2.根據種子可以計算一個初始大小為16MB的偽隨機緩存cache。輕客戶端保存這個cache,用于輔助校驗區塊和生成數據集。3.根據cache,可以生成一個初始大小為1GB的DAG數據集。數據集中的每個條目(64字節)僅依賴于cache中的一小部分條目。數據集會隨時間線性增長,每30000個區塊間隔更新一次。數據集僅僅存儲在完整客戶端和礦工節點,但大多數時間礦工的工作是讀取這個數據集,而不是改變它。4.挖礦則是在數據集中選取隨機的部分并將他們一起哈希。可以根據cache僅生成驗證所需的部分,這樣就可以使用少量內存完整驗證,所以對于驗證來講,僅需要保存cache即可。

這里cache選擇16MB緩存是因為較小的高速緩存允許使用光評估方法,太容易用于ASIC。16MB緩存仍然需要非常高的緩存讀取帶寬,而較小的高速緩存可以更容易地被優化。較大的緩存會導致算法太難而使得輕客戶端無法進行區塊校驗。

選擇初始大小為1GB的DAG數據集是為了要求內存級別超過大多數專用內存和緩存的大小,但普通計算機能夠也還能使用它。數據集選擇30000個塊更新一次,是因為間隔太大使得更容易創建被設計為非常不頻繁地更新并且僅經常讀取的內存。而間隔太短,會增加進入壁壘,因為弱機器需要花費大量時間在更新數據集的固定成本上。

同時,緩存和數據集大小隨時間線性增長,且為了降低循環行為時的偶然規律性風險,數據大小是一個不超過上限的素數。每年約以0.73倍的速度增長,這個增長速率大致同摩爾定律持平。這仍有越過摩爾定律的風險,將導致挖礦需要非常大量的內存,使得普通的GPU不再能用于挖礦。因為可通過使用緩存重新生成所需數據集的特定部分,少量內存進行PoW驗證,因此你只需要存儲緩存,而不需要存儲數據集。

緩存和數據集大小

緩存c和數據集d的大小依賴用區塊的窗口周期Eepoch。

每過一個窗口周期后,數據集固定增長8MB(223字節),緩存固定增長128kb。為了降低循環行為時的偶然規律性風險,數據大小必須是一個素數。計算緩存大小公式:

計算數據大小公式:

其中,求素數公式如下:

這個素數計算是從不高于上限值中向下依次遞減2*64字節遞歸查找,直到x/64是一個素數。

生成種子哈希值

種子seed實際是一個哈希值,每個窗口周期更新一次。它是經過多次疊加Keccak256計算得到的。

第一個窗口周期內的種子哈希值s是一個空的32字節數組,而后續每個周期中的種子哈希值,則對上一個周期的種子哈希值再次進行Keccak256哈希得到。

生成緩存cache

緩存cache生成過程中,是將cache切割成64字節長的若干行數組操作的。

先將種子哈希值的Keccak512結果作為初始化值寫入第一行中;隨后,每行的數據用上行數據的Keccak512哈希值填充;最后,執行了3次RandMemoHash算法。該生成算法的目的是為了證明這一刻確實使用了指定量的內存進行計算。

RandMemoHash算法可以理解為將若干行進行首尾連接的環鏈,其中n為行數。

每次RandMemoHash計算是依次對每行進行重新填充。先求第i行的前后兩行值得或運算結果,再對結果進行Keccak512哈希后填充到第i行中。

最后,如果操作系統是Big-Endian(非little-endian)的字節序,那么意味著低位字節排放在內存的高端,高位字節排放在內存的低端。此時,將緩存內容進行倒排,以便調整內存存放順序。最終使得緩存數據在內存中排序順序和機器字節順序一致。

生成數據集

利用緩存cache來生成數據集,首先將緩存切割成n個16bytes大小的單元。在生成過程中時將數據集切割為若干個64bytes大小的數據項,可對每項數據mix并發生成。最終將所有數據項拼接成數據集。

1.在生成index行的數據時,先從緩存中獲取第index%n個單元的值u;

2.數據項mix長度64bytes,分割為4bytes的16個uint32。第一個uint32等于u^index,其他第i個uint32等于u+i;

3.用數據項mix的Keccak512哈希值覆蓋mix;

4.對mix進行FNV哈希。在FNV哈希時,是要從緩存中獲取256個父項進行運算。

1)確定第p個父項位置:FNV(index^p,mix)%n;2)再將FNV(mix,cache)的值填充到mix中;其中,FNV(x,y)=x*0x01000193^y;這里的256次計算,相當于mix的16個uint32循環執行了16次。

5.再一次用數據項mix的Keccak512哈希值覆蓋mix;

6.如果機器字節序是Big-Endian的,則還需要交換高低位;

7.最后將mix填充到數據集中,即dataset=mix;

注意,在FNV哈希計算中,初始大小1GB數據集累積需要約42億次次計算。即使并發計算,也需要一定的時間才能完成一次數據集生成。這也就是為什么在啟動一個geth挖礦節點時,剛開始時會看到一段“GeneratingDAGinprogress”的日志,直到生成數據集完成后,才可以開始挖礦。

Ethash挖礦方程求解

準備好數據集dataset就可以用于工作量證明計算。依賴nonce、h、dataset可計算出的一個偽隨機數N,工作量證明就是校驗N是否符合難度要求。工作量計算由挖礦方程Ethash定義。

上圖是Ethash的計算流程圖。說明如下:

1.首先將傳入的新區塊頭哈希值和隨機數nonce拼接后進行KEC512哈希,得到64字節的種子seed;2.然后初始化一個128字節長的mix,初始化時分割成32個4字節的單元;使用128字節的順序訪問,以便每次Ethash計算都始終從RAM提取整頁,從而最小化頁表緩存未命中情況。理論上,ASIC是可以避免的;3.mix數組的每個元素值來自于seed;mix=s;是seed的第0、4、8...60位的值;4.緊接著完成64次循環內存隨機讀寫。每次循環需要從dataset中取指定位置p和p+1上的兩個16字節拼接成32字節的m;然后,使用fnv(mix,m)去覆蓋mix;其中,i是循環索引、s是種子seed的前32字節、rows是表示數據集dataset可分成rows個128字節。5.然后壓縮mix。壓縮是將mix以每16字節分別壓縮得到8個壓縮項。每16字節又是4小份的fnv疊加哈希值fnv(fnv(fnv(m,m),m),m);6.拼接這8個壓縮項就得到mix的哈希值mixHash;7.最后將seed和mixHash進行KEC256哈希得到偽隨機數N;8.最終,返回這兩個參數:mixHash和N;

Tags:MIXASHHASH以太坊wemix幣在哪個交易所NASHhashcoin以太坊交易犯法嗎

Ethereum
MXC:行情解析:比特幣突破打破下行趨勢線,但不要過分樂觀

作者|哈希派分析團隊 比特幣突破2萬美元 納斯達克專欄引用MXC抹茶行情數據:昨日晚間,比特幣突破2萬美元引發各界關注,納斯達克官方網站《Bitcoin Magazine》頻道專欄作者.

1900/1/1 0:00:00
區塊鏈:30歲裸辭后入局產業區塊鏈,HR:這個崗位年薪60萬,一將難求!

我有一個朋友,今年30歲,裸辭了。一個月后,他拿了三份Offer,分別來自某電商巨頭,某生鮮電商品牌,某區塊鏈創業公司.

1900/1/1 0:00:00
區塊鏈:如何與“綠色未來”同行?——區塊鏈賦能知識產權保護研究

今天是“世界知識產權日”,由世界知識產權組織在2001年4月26日設立的每年固定時間的全球性節日,旨在喚醒全世界范圍內尊重知識、崇尚科學和保護知識產權的意識,營造鼓勵知識創新的法律環境.

1900/1/1 0:00:00
比特幣:如何看待比特幣的價格波動?

來源:LongHash 普遍意見認為價格波動性是比特幣無法在主流大眾間獲得更高的采用率的主要原因之一。然而,真相或許很不一樣。許多人恰恰是因為比特幣極端的價格波動才被它吸引的。想想看.

1900/1/1 0:00:00
SUI:巴比特專欄 | 幣圈傳銷,買幣者資金追繳還是返還?

原文:肖颯lawyer,作者:郭譚浩,肖颯本想買幣賺一筆,但不想發幣方竟成了傳銷組織,涉嫌違法、犯罪;參與資金都將面臨收繳。這時,買幣款能否追回,就成了買幣人最關心的問題.

1900/1/1 0:00:00
比特幣:QKL123行情分析 | 若美聯儲祭出負利率,比特幣如何反應?(0422)

摘要:若美聯儲被迫祭出負利率,短期來看,對比特幣價格會有一個不錯支撐。長期來看,對于比特幣等去中心化金融有間接促進作用.

1900/1/1 0:00:00
ads