簡介
如果你想學鬼步舞 (shuffle dance) 的話,那你就走錯地方了。但相信我,Eth2里的混洗 (shuffle) 也一樣讓人興奮。
混洗列表是以太坊2.0里一個基本運算。它主要用于在每12秒的slot里偽隨機挑選驗證者來組成委員會,以及在每個slot里選出信標鏈區塊的提議者。
混洗似乎相當簡單。盡管它有一些隱患需要注意,這些隱患在計算機科學里是非常容易理解的。其中的黃金標準大概就是Fisher-Yeats shuffle了。那我們為什么不在Eth2里使用它呢?我將在文末詳細解釋,但簡單來說就是——輕客戶端。
我們用的混洗算法是swap-or-not,而不是Fisher-Yates。這個選擇是基于這篇本來用于構建加密方案的論文。我最近在Eth2客戶端Teku中重寫我們的實現,因此我想趁熱把它寫出來。
Swap-or-Not混洗算法
一輪的操作過程
混洗以輪次進行。每輪的過程是一樣的,因此我在下面只會演示一輪的過程,它比看上去簡單多了。
選擇一個軸心點并找出第一個鏡像索引
首先,我們選一個軸心索引p,這是基于輪次和其他一些種子數據,通過偽隨機選出的。這個軸心選出后就在該輪次里固定了。
動態 | 以太坊未確認交易66432筆:據Etherscan.io數據顯示,以太坊未確認交易66432筆。當前挖礦難度2529.89 TH,交易處理能力5.6 TPS。截至目前以太坊全球均價為130.6美元,最近24小時跌幅為1.41%。[2020/1/1]
基于這個軸心點,我們在p和0的中間點選出一個鏡像索引m1,即m1=p/2。(為了方便解釋,我們將忽略麻煩的差一錯誤舍入問題)
軸心點和第一個鏡像index
從第一個鏡像索引到軸心點,替換與否
?對于鏡像索引m1和軸心索引p之間的每個索引,我們隨機決定是否對這些元素進行替換。
比如對于索引i1,如果我們選擇不替換,那么我們就繼續選下一個索引。
如果我們決定替換,那么我們將i1上的列表元素與i1’上的替換,即它在鏡像索引上的圖像。也就是i1與i1’=m1-(i1-m1)替換,這樣i1和i1’到m1的距離是相等的。
我們對每個m1和p之間的索引都做相同的swap-or-not的決定。
動態 | 以太坊將于8月14日上線Ropsten和G?rli等測試網升級:據官方消息,以太坊伊斯坦布爾(Istanbul)硬分叉升級計劃在 8 月 14 日上線 Ropsten 和 G?rli 等以太坊測試網升級。注,預計2019-10-16(周三)“伊斯坦布爾”主網升級,對于下一個硬分叉時間,粗略的計劃是2020年4月。[2019/8/13]
從第一個鏡像索引到軸心的swap-or-not決定
計算第二個鏡像索引
在做完從m1到p的所有索引決定后,我們現在找到第二個以m2為中點的鏡像索引,即到p和列表末端的距離相等的點。也就是m2=m1+n/2。
第二個鏡像索引
從軸心點到第二個鏡像,替換與否
最后,我們重復swap-or-not的過程,考慮所有點到軸心p替換的決定,即p到第二個鏡像m2的決定。如果我們選擇不替換,就繼續下一個。如果我們選擇替換,那么我們在鏡像索引m2上把j1上的元素與它在j1’上的鏡像進行替換。
動態 | 過去三個月以太坊開采空塊數量急劇增長:據AMBCrypto消息,在過去三個月中,以太坊使用指標顯示了一個相當令人吃驚的趨勢:開采的空塊數量急劇增加。CoinFi的首席數據科學家AlexSvanevik說,非法礦場所使用的技術被稱為“間諜采礦”,即礦工在不實際處理區塊內任何交易的情況下因采礦而得到獎勵。在這種情況下,形成“空塊”。這對以太坊造成了前所未有的威脅,數據顯示,空塊的傳播速度快了15%,這意味著間諜礦工的總收入也增加了15%。經過搜索發現,有兩個礦池存在這種行為:F2Pool和Etherdigg。[2018/10/7]
從軸心到第二個鏡像索引的swap-or-not決定
組合起來
在一輪的最后,我們都已經考慮了m1到m2之間所有的索引,即所有索引的一半,且無論替換與否,每個索引都在另一半有一個特定的索引。因此,關于替換與否,所有的索引都已被考慮過一次了。
下一輪以增加 (或減少) 輪次開啟,這樣我們會有一個新的軸心索引,然后開始循環上述的過程。
行情 | 一以太坊地址轉出價值1.22億美元ETH:據Chaindigg數據顯示,今天,地址0x6cc5f688a315f3dc28a7781717a9a798a59fda7b向五個地址共轉出499999個ETH。該轉出地址標記為交易所錢包。[2018/9/24]
同一輪中從一個鏡像移向另一個鏡像的過程
有趣之處
巧妙的地方
當在決定要不要替換的時候,這個算法會巧妙地選擇候選索引或其鏡像中的更高者。意思是當在軸心之下時,被選擇的是i_1而不是i_1’;當在軸心之上時,被選擇的時i_k’而不是i_k。這意味著,我們可以靈活遍歷列表中的索引:我們可以將0到m1和p到m2分為兩個獨立的循環,或將兩者合在同一個從m1到m2的循環,如我在上文所描繪(和實現)的。這兩種做法的結果是一樣的:無論我考慮的是i_1還是鏡像i_1’都沒有關系;替換與否得出的是相同的結果。
輪次
在Eth2,上述的過程會進行90次。原始論文里提到要經歷6lgN個輪次才能“開始在選擇性密碼攻擊 (CCA) 上出現較好的安全性界限”,其中N是列表的長度。在Vitalik的注釋規范里,他說“密碼學專家建議我們4log2N個輪次就能提供足夠的安全性了”。
獨家 | BlockTOP Kira:本次以太坊跌勢將持續至少半年:針對近期以太坊價格跳水的現象,金色財經就此事獨家采訪到BlockTOP Kira,在關于“以太坊暴跌將持續多久”這一問題上,他表示:“本次強勢下跌的主要原因來自項目方受二級市場壓力和恐慌情緒影響集中拋ET所致,下跌趨勢會自我強化,本次以太坊跌勢預計還將持續至少半年以上,向下仍具有超過20%以上的下跌空間,之后還有漫長的震蕩筑底時間,可以說現在最黑暗的時刻還沒有完全到來。”[2018/8/22]
在Eth2里驗證者數量的絕對最大值,也就是我們需要混洗的列表最大次數,大概是222 (420萬)。Vitalik給出的預估值是88輪,在論文里的預估值是92輪 (假設lg是自然對數)。因此,我們現在處于一個大致正確的范圍,特別是我們最后非常可能沒有這么多活躍驗證者。
基于列表長度來調整輪次可能會得出有趣的結果,但我們不會這么做,這可能是不必要的優化。
有意思的是,當Least Authority審計信標鏈的規范時,他們一開始發現在選擇區塊提議者的混洗中是有偏倚的 (參考Issue F)。但結果是他們錯誤使用了只有10輪次的混洗配置。當他們將混洗配置增加到90輪 (我們在主網使用的輪次) 時,偏倚的情況消失了。
(偽) 隨機
混洗算法要求我們在每一輪里隨機選一個軸心點,且在每輪里隨機選擇是否對每個元素進行替換。
在Eth2,我們肯定會從一個種子值產生隨機性,由此這同一個種子總會產生同一個混洗結果。
軸心指標是由把與輪次串聯的種子進行8字節的SHA2哈希產生的,軸心索引由種子值SHA2哈希的八個字節生成,該種子值與輪次相串聯,因此它通常在每輪里都有會改變。
用來決定是否要替換元素的決定性數位從以下幾個元素中提取:種子的SHA256哈希、輪次、列表上元素的索引。
效率
這個混洗算法比Fisher-Yates算法要慢得多。如果Fisher-Yates算法需要N次混洗的話,我們的算法平均需要90N/4次。我們還要考慮偽隨機性的產生,這是算法中成本最高的部分。Fisher-Yates需要接近Nlog2N數位的隨機性,而我們需要90(log2N+N/2)數位,根據我們在Eth2里需要的N值范圍,超出的數位是相當多的?(當N為一百萬時,Eth2大約需要N的兩倍)。
為什么選擇swap-or-not這種算法
如果效率不高,為什么要選擇這個實現?
對單一元素進行混洗
這個算法的閃光點在于,如果我們只關注少數幾個索引,我們不需要對整個列表的混洗進行計算。事實上,我們可以將這個算法用于單個索引,來找出哪個索引將會被替換。
因此,如果我們想知道索引217的元素被混洗到哪里了,我們可以運行只針對該索引的算法,而無需混洗整個列表。此外,相反地,如果我們想知道是什么元素被混洗到索引217,我們可以將算法倒過來運行來找到元素217 (倒過來的意思是從高到低運行輪次,而不是從低到高)。
總之,我們可以在恒定時間內計算出元素?i?被混洗到哪里,也可以計算出元素?i?的源頭在哪里 (用反向操作),計算時間并不取決于列表的長度。Fisher-Yates混洗并不具有這種特性,且不能對單個索引進行混洗,它們往往需要重復混洗整個列表。
在Eth2規范里寫的就是關于如何將算法應用到對單個索引進行混洗。事實上,一次性混洗整個列表只是它的一種優化!如果我們想的話,我們可以輪流只對列表里的一個元素進行混洗:(反向) 運行混洗來找出哪個元素最終落在索引0,再運行一次混洗找出哪個元素最終落在索引1,如此進行下去。
我們不那樣做的原因只是由于決定swap-or-not需要一次性生成一個256位的哈希,且就這樣拋棄255位是很浪費的。如果我們使用1位的哈希或預言,混洗列表中一個元素的效率與混洗整個列表相去無幾。
做到真正的“輕”客戶端
這個特性之所以有意義,原因全在于輕客戶端。輕客戶端相當于是Eth2信標鏈和分片鏈的觀測者,他們不儲存整個狀態,但希望可以安全地訪問鏈上的數據。要對他們的數據正確性進行驗證,即沒有發生欺詐,其中的必要一步就是對證明數據的委員會進行計算。
也就是要用到混洗算法,且我們并不希望輕客戶端必須存儲或是混洗整個驗證者列表。通過swap-or-not混洗,他們可以只對他們需要的一小部分委員會成員進行計算,這樣將在整體上大幅提高效率。
歷史
如果你像我一樣喜歡GitHub的考古特性,你可以在這里查看最初為Eth2尋求混洗算法的討論,這里公布了最后的勝出者。
如果想從另一個角度看swap-or-not混洗算法,可以看一下Protolambda發表的一個更可視化的解釋。
最后
這張圖片是2019年我在EthCC上一邊聽Justin Drake講swap-or-not混洗,一邊在Teku客戶端 (當時它還叫Artemis) 中實現初版swap-or-not混洗。?
作者 | Ben Edgington
Tags:ETH以太坊SWAPETH2Ethereum Name Service以太坊官網錢包OpenSwapVETH2
北京時間9月29日,CertiK安全研究團隊發現Yearn.finance的新項目Eminence.finance出現異常交易.
1900/1/1 0:00:00文章系金色財經專欄作者幣圈北冥供稿,發表言論僅代表其個人觀點,僅供學習交流!金色盤面不會主動提供任何交易指導,亦不會收取任何費用指導交易,請讀者仔細甄別,謹防上當.
1900/1/1 0:00:00比特幣上一次單日上漲接近5%的時期要追溯到8月初,當時比特幣正朝著12000美元沖擊。而昨天比特幣則是從10200美元附近沖到10700美元上方.
1900/1/1 0:00:00現在再看 SushiSwap,它遠沒有剛面世時的光鮮了。最開始,Uniswap 的進化、社區掠奪 VC 等點評一度將 SushiSwap 捧至神壇,在經歷創始人被爆控制價值 2700 萬美元的.
1900/1/1 0:00:00Oracle 是什么?Oracle 的中文意思是先知,預言者。電影黑客帝國里扮演先知角色的老太太就叫做 Oracle。 Oracle 的定義之一是,在某方面具有絕對權威或可提供指引的人或物.
1900/1/1 0:00:00DeFi流動性挖礦火爆一時,吸引了大量投資者參與。為了方便投資者及時了解DeFi挖礦項目的相關信息和挖礦流程,金色財經與Bitouq聯合推出了“金色說明書”系列挖礦教程。每周三,周五固定更新.
1900/1/1 0:00:00