導語
在智能合約世界中,“以太坊虛擬機(EVM)”及其算法和數據結構是首要原則。我們創建的智能合約就是建立在這個基礎之上的。不管是想要成為一名出色的 Solidity 智能合約開發人員還是安全人員都必須對 EVM 有深入的了解。
此系列我們將引介翻譯 noxx 的文章(https://noxx.substack.com/),深入探討 EVM 的基礎知識。
基礎知識:Solidity → 字節碼 → 操作碼
在閱讀本篇文章之前,你需要了解一些智能合約相關基礎知識以及如何將智能合約代碼部署到以太坊鏈上。正如我們所知,智能合約在部署到以太坊網絡之前需要先將 Solidity 代碼編譯成字節碼,EVM 會根據編譯后的字節碼執行相應的操作。本篇重點介紹編譯后的字節碼以及其如何被 EVM 執行的。
智能合約被部署后編譯生成的字節碼代表了整個合約的內容,其中存在多個可調用的函數。那么 EVM 是如何知道不同函數所對應的字節碼是哪個呢?下面我們將通過一個 Solidity 智能合約及其字節碼和操作碼來向大家演示 EVM 在執行代碼時是如何在字節碼中選擇對應的函數的。
1_Storage.sol Breakdown
我們使用在線 Solidity IDE 工具 Remix 來編譯 Storage 合約。
此合約中存在兩個函數 store() 和 retrieve(),在進行函數調用時 EVM 需要判斷我們調用的是哪個函數。我們可以通過 remix 看到整個合約編譯后的字節碼。
聊天應用程序Grill.chat已實現EVM錢包兼容,允許用戶使用Polygon發送加密貨幣:金色財經報道,基于 Subsocial 網絡的聊天應用程序Grill.chat現在已經實現了以太坊虛擬機 (EVM) 錢包兼容性,允許用戶使用以太坊身份聊天并通過 Polygon 相互發送加密貨幣。[2023/6/9 21:24:55]
下面這段字節碼是我們需要重點關注的,這段就是 EVM 判斷被調用函數的選擇器。與其對應的是 EVM 操作碼及輸入值。
我們可以通過 Ethervm.io 來查看 EVM 操作碼列表。一個操作碼長度為 1 個字節(byte),這使得它可以存在 256 種不同的操作碼。但 EVM 僅使用其中的 140 個操作碼。
下面是我們將上述字節碼解析成與其對應的操作碼。這些操作碼會由 EVM 在調用棧上按順序執行。
智能合約函數調用
在深入研究操作碼之前,我們需要快速了解如何調用合約中的函數。調用智能合約中的函數有以下方式:
abi.encode(...) returns (bytes):計算參數的 ABI 編碼。
abi.encodePacked(...) returns (bytes):計算參數的緊密打包編碼。
abi. encodeWithSelector(bytes4 selector, ...) returns (bytes):計算函數選擇器和參數的 ABI 編碼。
Uniswap V3擬上線Polygon zkEVM,現處于提案階段:3月4日消息,Uniswap社區成員Jack Melnick發起提案,擬使Uniswap V3在PolygonzkEVM發布,建議授權Uniswap Labs代表社區將Uniswap的協議部署到稱為zkEVM的Polygon零知識以太坊虛擬機。
Uniswap在EVM兼容的ZKrollup上可用具有重要價值。Polygon zkEVM是一種新的zk-rollup,它提供以太坊虛擬機(EVM)等效性(操作碼級兼容性),以實現透明的用戶體驗以及現有的以太坊生態系統和工具兼容性。[2023/3/4 12:42:20]
abi.encodeWithSignature(string signature, ...) returns (bytes):等價于?abi.encodeWithSelector(bytes4(keccak256(signature), ...)。
abi.encodeCall(function functionPointer, (...)) returns (bytes memory):使用 tuple 類型參數 ABI 編碼調用 functionPointer()。執行完整的類型檢查,確保類型匹配函數簽名。結果和?abi.encodeWithSelector(functionPointer.selector, (...)) 一致。
這里我們以第四種為例,調用 store() 并傳入參數 10:
下面是通過?abi.encodeWithSignature (" store (uint256)",10)?編碼后的內容:
OffChain Labs聯創: zkEVM遠未成熟,任何推動這種敘事的團隊都在損害社區:10月17日消息,Arbitru m開發公司OffChain Labs聯創Steven Goldfeder在其社交平臺表示,目前有團隊聲稱首個zkEVM將于本月底上線主網,但其對此持否定態度,并稱任何推動這種敘事的團隊都在損害社區。
Goldfeder表示,當前推出的zkEVM測試網并沒有啟用zk-proofs,也沒有經過安全審計,這表明我們還沒有為黃金時段做好準備。[2022/10/17 17:29:00]
這段數據就是編碼后的函數簽名。
我們可以使用在線工具(“https://emn178.github.io/online-tools/keccak_256.html”)來查看?store(uint256) 和?retrieve() 哈希后的結果。
也可以通過以太坊函數簽名數據庫(https://www.4byte.directory/signatures/)進行反查。
Function X已在主網上線EVM兼容鏈f(x)EVM并推出提供2000萬美元的生態基金:金色財經消息,區塊鏈項目Function X宣布已在區塊高度5,713,000處進行升級并上線EVM兼容鏈f(x)EVM,用戶可以通過FX Bridge將以太坊上資產橋接至f(x)EVM。此外,Function X基金會將提供2000萬美元資金以吸引開發人員并推動Function X生態發展。[2022/7/18 2:20:56]
再回到上面的那組函數簽名數據,其中前 4 個字節對應的是 store(uint256)。而剩余的 32 個字節則對應的是一個十六進制的值 “a”,也就是我們調用函數時傳入的 uint256 類型的 10。
這里我們可以得到一個結論,通過?abi.encodeWithSignature()?編碼后得到的數據,共 36 個字節。這 36 個字節的數據就是函數簽名,其中前 4 個字節為函數選擇器,它將指引 EVM 去選擇我們調用的目標函數,后 32 個字節的數據則是我們調用函數時傳入的參數。
操作碼和調用棧
這里相信大家已經大致了解了智能合約中函數調用的原理了,下面我們將通過解讀每個操作碼的作用及其對棧調用的影響。如果你不熟悉棧數據結構的工作原理,可以觀看此視頻來快速入門:https://www.youtube.com/watch?v=FNZ5o9S9prU
我們將得到的字節碼分解成相對應的操作碼后依次開始分析。
?PUSH1 操作,將一個?1 字節的值壓入棧,它會告訴 EVM 將下一個數據字節 0x00(也是十進制的 0)?壓入棧中。
區塊鏈數據索引協議The Graph已集成首個非EVM兼容的公鏈NEAR:金色財經報道,區塊鏈數據索引協議The Graph已集成公鏈NEAR,使得NEAR成為GraphNode支持的首個非EVM(以太坊虛擬機)兼容的區塊鏈,從而在TheGraph的托管服務上可以使用beta版的NEAR索引服務。此次集成將使開發人員能夠使用TheGraph在NEAR網絡上構建Subgraphs應用,以允許Web3基礎設施支持更多的DApps,同時該集成采用StowFast的Firehose接口,支持擴展到任何區塊鏈。(CoinDesk)[2021/10/26 20:58:41]
接下來是 CALLDATALOAD,其作用是從消息數據中讀取 32 個字節的值,其中使用 “輸入” 值作為偏移量將 calldata 加載到棧中。棧項大小為 32 字節,但是當前我們的 calldata 有 36 個字節。推送的值是 msg.data[i:i+32] 其中 “i” 就是這個輸入值。此操作確保只有 32 個字節被推送到棧,同時也能保證我們能夠訪問 calldata 中的任何部分。
當前輸入值為 0 也就是沒有偏移量(從棧中彈出的值是前一個 PUSH1 的值 0),因此 calldata 的前 32 個字節會被推送到調用棧。
還記得之前所獲取到的函數簽名嗎?如果要傳入這 36 個字節,這就意味著后面的 4 個字節“0000000a”將會丟失。如果想訪問這個 uint256 類型的參數,需要設置 4 的偏移量來省略函數簽名,這樣就可以保證參數的完整性。
第二次進行 PUSH1 的操作將傳入十六進制的數據 0xe0,也就是十進制的 224。我們上面提到過,函數簽名是 4 個字節也就是 32 位。我們加載的 calldata 是 32 個字節也就是 256 位,而 256 - 32 =224 正好滿足。
SHR,是向右移位指令。它從棧中獲取第一項 224 表示要位移的位數,從棧中獲取第二項?(0x6057361d0…00)?表示需要移位的內容。在這個操作之后調用棧上有了 4 個字節的函數選擇器。
如果對于位移的工作原理不熟悉的小伙伴,可以查看這個視頻了解:https://www.youtube.com/watch?v=fDKUq38H2jk&t=176s
接下來的操作碼, DUP1,它用來獲取并復制棧頂部的值。
PUSH4 將?retrieve() (0x2e64cec1) 的 4 個字節函數簽名推入調用棧。
如果你好奇是這個值是如何獲得的,那是因為 solidity 代碼被編譯成字節碼中。編譯器可以從字節碼中獲取所有函數名稱和參數類型的信息。
EQ 用于判斷從棧中彈出的 2 個值,在當前事例中為 0x2e64cec1 和 0x6057361d 并檢查它們是否相等。如果相等,則將 1 推回棧,如果不相等則為 0。
PUSH2 將 2 字節的十六進制數據 0x003b,十進制值為 59,推送到調用棧中。
調用棧中有一個叫做程序計數器的東西,它會指定下一個執行命令在字節碼中的位置。這里的 59,是通過 retrieve()?字節碼的開始位置所得到的。
JUMPI 代表“如果條件為真,則跳轉”,它從棧中彈出 2 個值作為輸入,第一個 59 表示的是跳轉位置,第二個 0 是是否應該執行此跳轉條件的布爾值。其中 1 為真,0 為假。
如果條件為真,程序計數器將被更新,執行將跳轉到該位置。但我們的例子中條件為假的,程序計數器沒有改變并且繼續執行。
再次進行DUP1。
PUSH4 將 store(uint256) (0x6057361d)?的 4 字節函數簽名推送到調用棧上。
再次進行 EQ,但這次結果為真,因為函數簽名相同。
PUSH2 推送 2 個字節的十六進制數據?0x0059 也就是十進制的 89, 到 store(uint256) 字節碼的程序計數器位置。
執行 JUMPI,此次 bool 值為真,執行跳轉。因此會將程序計數器更新為 89,這會將執行移動到字節碼的不同部分。在這個位置,會有一個 JUMPDEST 操作碼,如果沒有這個操作碼在這里的話,JUMPI 操作就會失敗。
有了它,在執行此操作碼后,將被帶到 store(uint256)?對應的字節碼的位置,并且函數的執行將繼續。雖然這個合約只有 2 個函數,但基礎原理都是相同的。
通過上面的例子我們知道了 EVM 是如何根據合約函數調用來確定它需要執行的函數字節碼的位置。簡單來說就是由合約中每個函數及其跳轉位置所組成的一組簡單的“if 語句”。
EVM Playground
這是一個 EVM Playground(https://www.evm.codes/playground)測試平臺,在平臺上我們可以設置剛剛運行的字節碼。就能夠通過交互方式來查看棧的變化,并且傳入 JUMPDEST(注:可能跳轉的目標元數據),可以看到 JUMPI 之后會發生什么。
敬請期待《EVM 深入探討-Part 2》,讓我們共同探索合約內存是什么以及它在 EVM 下的工作方式。
慢霧科技
個人專欄
閱讀更多
金色早8點
Bress
鏈捕手
財經法學
PANews
成都鏈安
Odaily星球日報
Tags:TORSTO以太坊INTTORGRestore Truth Token以太坊價格今日行情比特幣EurocoinToken
注:原文作者是 Bitcoin Magazine 分析師 Dylan LeClair 和 Sam Rule9 月 15 日,以太坊計劃實施其長期承諾的"合并".
1900/1/1 0:00:00DAO 通過激勵用戶參與活動,以促進其商業目標;同時它使個人能夠一起工作,最大限度地減少信任,并保持對審查和脅迫的抵抗。為了促進這一點,DAO 需要不同層次的復雜智能合約、組織結構和治理.
1900/1/1 0:00:00ERC-20、ERC-721、ERC-1155、ERC-4626、ERC-之類的,不知道各種以太坊代幣標準是什么?為什么這些標準很重要?來源 | @SalomonCrypto推文作者 | Hay.
1900/1/1 0:00:00作者:小牛 原文:《Move語言的機會》1.Move語言具有將資產作為一等公民編程、安全性、靈活性、可組合性等特點;2.采用Move語言的公鏈生態發展尚處初期.
1900/1/1 0:00:00前言 由于分片技術擱置,以太坊 2.0 升級最令人期待的就是共識機制從 PoW 變更為 PoS.
1900/1/1 0:00:00上圖為BTC月線長期走勢,下方為標準強弱加權指標,對比可以發現一旦指標快線跌至0軸以下,歷史上BTC均已進入各輪熊市底部區域,后面開始數月之久的低位盤整,筑底后啟動牛市行情.
1900/1/1 0:00:00