階段式同步(staged sync)重構自 Go-Ethereum 的完全同步模式(full sync),以實現更好的性能。
階段式同步需要進行大量讀寫操作。雖然我們的目標是能夠在機械硬盤上同步節點,但是我們仍建議使用固態硬盤。
顧名思義,階段式同步需要依次執行 10 個階段。
Turbo-Geth 客戶端會向每個對等節點了解該節點的 HEAD 區塊(即最新區塊),然后依次執行每個階段、尋找本地 HEAD 區塊和對等節點的 HEAD 區塊之間缺失的區塊。
第一個階段(下載區塊頭)會設置本地 HEAD 區塊。
各階段會按順序執行。在每個階段執行期間,只有節點本地的狀態達到目標狀態,該階段才會結束。
也就是說,在理想情況下(沒有出現網絡中斷、應用沒有重啟等問題),每個階段只需執行一次,即可完成初始同步。
最后一階段結束后,整個同步流程會重新開始,尋找新的區塊頭下載。
數據:最近一周,以太坊網絡新增77萬枚NFT資產:金色財經報道,NFTScan數據顯示,最近一周,以太坊網絡新增77萬枚NFT資產,平均每天新增鑄造11萬枚NFT資產。[2022/1/9 8:35:42]
如果你在兩個階段之間重啟應用,應用會從第一階段開始重啟。
如果你在某個階段執行期間重啟應用,應用會從當前階段開始重啟,以完成該階段。
通過下方的餅狀圖,我們可以看出每個階段的耗時占比(這些都是從完全同步中得出的數據)。雖然這些數據并不精確,但是足以作為參考。
如果區塊鏈發生重組,我們需要“回退”部分同步數據。
回退指的是從最后一個階段倒退回第一個階段。但是,需要注意的一點是,我們執行完回退之后才會更新交易池,因此我們知道新的 nonce 。
以太坊與比特幣的相關性在2周內接近翻倍:根據Coinmetrics的數據,以太坊與比特幣的相關性在11月下旬降至0.42,目前已上漲至0.75。(EWN)[2020/12/9 14:44:03]
回退的階段順序如下例所示(從右往左依次發生)。
state.unwindOrder = []*Stage{
// Unwinding of tx pool (reinjecting transactions into the pool needs to happen after unwinding execution)
stages, stages, stages, stages, stages, stages, stages, stages, stages, stages,
}
通過 ETL 進行預處理
USDC Incinerator在以太坊網絡銷毀2100萬枚USDC:金色財經報道,Whale Alert數據顯示,北京時間8月11日02:56,USDC Incinerator在以太坊網絡上銷毀2100萬枚USDC。銷毀哈希為9ce14f6319d5aa57135ec42a0215c45ef831086e24c749da137e47d1b577d8b8。[2020/8/11]
在將數據插入數據庫之前,一些階段會使用我們的 ETL 框架根據鍵值對數據進行排序。
這樣就可以極大減少數據庫寫入放大(write amplification)的情況。
因此,當我們生成索引或者說哈希值化狀態(Hashed State)時,我們會執行一個多步驟流程。
將處理過的數據寫入位于數據目錄的幾個臨時文件中;
然后使用一個堆棧(heap)把臨時文件中的數據插入到數據庫中,并且使按照能夠最小化數據庫寫入放大現象的順序插入數據。
當前以太坊全網未確認交易為118354筆:金色財經消息,據OKLink數據顯示,當前以太坊全網未確認交易為118354筆,當前全網算力為179.78TH/s,全網難度為2.41p,當前持幣地址為44,390,971個,同比增加153,130個,24h鏈上交易量為1,446,211.38ETH,當前平均出平均出塊時間為13s。[2020/7/19]
這種優化有時會將寫入速度提高幾個數量級。
每個階段都包含兩個函數,分別是向前推進階段的ExecFunc 和向后回退階段的 UnwindFunc。
從理論上來說,部分階段可以離線工作,但是當前版本并未實現這一功能。
階段 1 :下載區塊頭
在這一階段,我們會下載本地 HEAD 區塊和對等節點的 HEAD 區塊之間的所有區塊頭。
這一階段是 CPU 密集型的,適合使用多核處理器,因為要驗證區塊頭的工作量證明。
巴西政府正設法使用以太坊區塊鏈提高效率:巴西政府正設法將以太坊區塊鏈應用在目前效率較低的選民請愿工作上,目前在巴西,一些重要的決定需要1.45億選民進行投票達成共識,傳統處理手段效率較低。[2018/1/8]
由于區塊鏈重組,大多數回退都是在這一階段開始的。
這一階段會推動本地 HEAD 的指針(指向更新的區塊)。
階段 2 :區塊哈希值
從區塊頭中抽取出一個從區塊哈希值映射成區塊號(blockHash -> blockNumber)的索引表,以支持更快速的查找功能,并讓同步過程對機械硬盤更為友好。
階段 3 :下載區塊體
在這一階段,我們會將上一階段已下載區塊頭的區塊體也下載下來。
這一階段需要保持良好的聯網連接。絕大多數數據都在這一階段下載。
階段 4 :復原發送者
這一階段會復原出并存儲每個已下載區塊中的每筆交易的發送者。
這一階段同樣是 CPU 密集型的,適合使用多核處理器。
這一階段不需要聯網。
階段 5 :執行區塊
在這一階段,我們會執行之前下載的所有區塊中的每一筆交易。
需要注意的一點是,在執行區塊的過程中,我們不會驗證根哈希,甚至不會創建默克爾樹。
這一階段是單線程的,無需聯網,需占用大量磁盤空間。如果區塊執行失敗,可以回退該階段。
階段 6 :計算狀態根
這一階段會構建默克爾樹,并驗證當前狀態的根哈希。
這一階段也會構建中間哈希值(Intermediate Hashes),并將它們存儲到數據庫中。
如果之前沒有存儲任何中間哈希值(這種情況可能在第一個初始同步期間發生),這一階段會構建出完整的默克爾樹及其根哈希。
如果數據庫中沒有中間哈希值,這一階段就會利用區塊的歷史記錄來弄清楚哪些哈希值已經過時,哪些哈希值是最新的,然后使用最新的哈希值來構建部分默克爾樹,只重構過時的哈希值。
如果根哈希無法匹配,就會向后回退一個區塊。
階段 7 :生成哈希值化狀態
在執行期間,Turbo-Geth 使用無格式狀態存儲(Plain state storage)。
無格式狀態(Plain State):在標準狀態(我們稱之為 “哈希值化狀態”)中,賬戶和存儲項的地址是 keccak256(address) ,但是在一般狀態中,二者的地址就是 address 。
盡管如此,為了確保一些 API 能夠正常運作并與其它客戶端保持兼容,我們也會生成哈希值化狀態。
如果哈希值化狀態不是空值,我們會查看歷史記錄變更集(History ChangeSet),并且只更新已更改的項。
這個階段不需要聯網。
階段 8、9、10 :生成索引
同步期間會生成 3 個索引。
這 3 個索引可能會被禁用,因為所有 API 都不使用它們。
交易查詢索引
該索引表由從交易哈希值到區塊號的映射構成。
賬戶歷史索引
該索引存儲了從賬戶地址到區塊列表(在這些區塊中,該賬戶的狀態有了更改)的映射。
存儲歷史索引
該索引存儲了從存儲項地址到區塊列表(其中,該存儲項在一定程度上有了更改)的映射。
在這一階段,我們會啟動交易池或更新其狀態。例如,如果我們已下載的區塊中包含了某些交易,就把這些交易從交易池中移除。
在回退時,我們會將被回退的區塊中的交易重新添加到交易池中。
原文鏈接:
https://github.com/ledgerwatch/turbo-geth/tree/master/eth/stagedsync
作者: Alex Sharov
翻譯&校對: 閔敏 & 阿劍
文章系金色財經專欄作者幣圈北冥供稿,發表言論僅代表其個人觀點,僅供學習交流!金色盤面不會主動提供任何交易指導,亦不會收取任何費用指導交易,請讀者仔細甄別,謹防上當.
1900/1/1 0:00:00數字基礎設施是準公共品,具有非排他性、非競爭性和正外部性,同時又具有高度的技術性和創新性,必須依靠大眾創新,競爭擇優。區塊鏈應用宜先從數據存證、共享入手,這是務實的策略.
1900/1/1 0:00:00藍狐筆記有不少讀者一直在問DeFi保險的事情,尤其是怎么看NXM價值捕獲的問題。今天的主題是,如何看待NXM和它的價值捕獲.
1900/1/1 0:00:00金色財經近期推出金色硬核(Hardcore)欄目,為讀者提供熱門項目介紹或者深度解讀。8月14日的市場熱點是Curve發布治理代幣CRV.
1900/1/1 0:00:00上證報中國證券網訊(記者 李丹丹)記者從全國金融標準化技術委員會官網獲悉,2020年6月22日至7月3日,國際電信聯盟電信標準化部門(ITU-T)第十六研究組(SG16)全會在線上召開.
1900/1/1 0:00:00央廣網北京9月7日消息(記者趙珂)據中央廣播電視總臺經濟之聲《天下財經》報道,今年上半年以來,我國外貿進出口下行壓力加大,部分外向型企業、金融機構國際業務受到一定影響.
1900/1/1 0:00:00