Vitalik：以太坊 The Verge...

首頁
專家專欄
Vitalik：以太坊 The Verge 階段的關鍵目標

Vitalik：以太坊 The Verge 階段的關鍵目標

發表於 2024-10-23 14:34 作者：金色財經

作者：以太坊創始人Vitalik；編譯：鄧通，金色財經

按：本文爲以太坊創始人Vitalik近期發表的“以太坊協議的未來發展”系列文章的第四部分“Possible futures of the Ethereum protocol, part 4: The Verge”。第三部分見“Vitalik：以太坊The Scourge階段的關鍵目標”，第二部分見“Vitalik：The Surge階段以太坊協議應該怎么發展”，第一部分見“以太坊PoS還有哪些可以改進”。以下爲第四部分全文：

特別感謝 Justin Drake、Hsiao-wei Wang、Guillaume Ballet、Ignacio、Josh Rudolf、Lev Soukhanov、Ryan Sean Adams 和 Uma Roy 的反饋和審查。

區塊鏈最強大的功能之一是任何人都可以在自己的計算機上運行節點並驗證鏈是否正確。即使運行鏈上共識（PoW、PoS……）的95%的節點都立即同意改變規則，並开始按照新規則生產區塊，每個運行完全驗證節點的人都會拒絕接受這條鏈。不屬於此類集團的利益相關者將自動匯聚並繼續構建一條繼續遵循舊規則的鏈，並且完全驗證的用戶將遵循該鏈。

這是區塊鏈和中心化系統之間的關鍵區別。然而，爲了保持這一特性，運行完全驗證的節點需要對臨界數量的人來說實際上是可行的。這既適用於質押者（就好像質押者沒有驗證鏈，他們實際上並沒有爲執行協議規則做出貢獻），也適用於普通用戶。如今，可以在消費類筆記本電腦（包括用於撰寫本文的筆記本電腦）上運行節點，但這樣做很困難。 The Verge 旨在改變這一現狀，讓完全驗證鏈的計算成本變得如此低廉，以至於每個移動錢包、瀏覽器錢包，甚至智能手表都默認這樣做。

The Verge，2023 年路线圖。

最初，“Verge”指的是將以太坊狀態存儲轉移到 Verkle 樹的想法 - 這種樹結構允許更緊湊的證明，從而實現以太坊區塊的無狀態驗證。節點可以在其硬盤上沒有任何以太坊狀態（账戶余額、合約代碼、存儲……）的情況下驗證以太坊區塊，但代價是花費幾百千字節的證明數據和幾百毫秒的額外時間來驗證證明。如今，Verge 代表了一個更大的愿景，專注於實現以太坊鏈的最大資源效率驗證，其中不僅包括無狀態驗證技術，還包括使用 SNARK 驗證所有以太坊執行。

除了長期關注 SNARK 驗證整個鏈之外，另一個新問題與 Verkle 樹是否是最好的技術有關。 Verkle 樹很容易受到量子計算機的攻擊，因此，如果我們用 Verkle 樹替換當前的 KECCAK Merkle Patricia 樹，我們稍後將不得不再次替換這些樹。 Merkle 樹的自然替代方案是直接跳到在二叉樹中使用 STARK Merkle 分支。從歷史上看，由於开銷和技術復雜性，這被認爲是不可行的。然而，最近，我們看到 Starkware 在帶有 Circle STARK 的筆記本電腦上證明了每秒 170 萬次 Poseidon 哈希值，並且由於 GKR 等技術，更多“傳統”哈希值的證明時間也在迅速縮短。

因此，在過去的一年裏，Verge 變得更加开放，並且存在多種可能性。

The Verge：關鍵目標

無狀態客戶端：完全驗證客戶端和質押節點不需要超過幾 GB 的存儲空間。

（長期）在智能手表上全面驗證鏈（共識和執行）。下載一些數據，驗證 SNARK，完成。

在本文中重點介紹以下內容：

無狀態驗證：Verkle 或 STARKs
EVM執行的有效性證明
共識的有效性證明

無狀態驗證：Verkle 或 STARKs

我們要解決什么問題？

如今，以太坊客戶端需要存儲數百GB的狀態數據才能驗證區塊，並且這個數量每年都在持續增加。原始狀態數據每年增加約 30 GB，個人客戶端除了能夠有效更新 trie 之外還必須存儲一些額外的數據。

這減少了可以運行完全驗證以太坊節點的用戶數量：盡管硬盤驅動器足夠大，可以存儲所有以太坊狀態甚至多年的歷史記錄，但人們默認購买的計算機往往只有幾百個千兆字節的存儲空間。狀態大小還會給首次設置節點的過程帶來很大的麻煩：節點需要下載整個狀態，這可能需要數小時或數天的時間。這會產生各種連鎖反應。例如，這使得質押者升級其質押設置變得更加困難。從技術上講，可以在不停機的情況下完成此操作 - 啓動新客戶端，等待其同步，然後關閉舊客戶端並傳輸密鑰 —— 但實際上，這在技術上很復雜。

它是什么以及它是如何工作的？

無狀態驗證是一種允許節點在不擁有完整狀態的情況下驗證區塊的技術。相反，每個區塊都帶有一個見證人，其中包括（i）該區塊將訪問的狀態中特定位置的值（例如代碼、余額、存儲），以及（ii）這些值的加密證明是正確的。

實際實現無狀態驗證需要改變以太坊狀態樹結構。這是因爲當前的 Merkle Patricia 樹對於實現任何密碼證明方案都極其不友好，尤其是在最壞的情況下。對於“原始”Merkle 分支以及將 Merkle 分支“包裝”在 STARK 中的可能性都是如此。主要困難源於 MPT 的兩個弱點：

它是一棵六叉樹（即每個節點有 16 個子節點）。這意味着平均而言，大小爲 N 的樹中的證明有 32*(16-1)*log16(N) = 120*log2(N) 字節，或者在 232 項樹中大約有 3840 字節。對於二叉樹，只需要 32*(2-1)*log2(N) = 32*log2(N) 字節，即大約 1024 字節。
該代碼未默克爾化。這意味着提供帳戶代碼的任何訪問權限都需要提供完整的代碼，最大長度爲 24000 字節。

我們可以計算最壞的情況如下：

30,000,000 Gas / 2,400（“冷”账戶讀取成本）* (5 * 480 + 24,000) = 330,000,000 字節

分支成本略有下降（5*480 而不是 8*480），因爲當分支數量很多時，分支的頂部會重復。但即便如此，在一個插槽內下載的數據量也是完全不切實際的。如果我們嘗試將其包裝在 STARK 中，我們會遇到兩個問題：(i) KECCAK 相對 STARK 不友好，(ii) 330 MB 的數據意味着我們必須證明對 KECCAK 輪函數的 500 萬次調用，這是一種方式即使我們可以使 STARK 證明 KECCAK 更加高效，但除了最強大的消費類硬件之外，還有很多東西無法在所有硬件上進行證明。

如果我們只是用二叉樹替換六叉樹，再加上 Merkelize 代碼，那么最壞的情況大約會變成 30,000,000 / 2,400 * 32 * (32 - 14 + 8) = 10,400,000 字節 ~214 個分支，其中 8 是長度進入一片葉子的證明）。請注意，這需要改變Gas成本，以對訪問每個單獨的代碼塊進行收費； EIP-4762 就是這樣做的。 10.4 MB 就好多了，但對於許多節點來說，在一個插槽內下載的數據仍然太多。所以我們需要引入一些更強大的技術。爲此，有兩種主要的解決方案：Verkle 樹和 Starked 二叉哈希樹。

Verkle 樹

Verkle 樹使用基於橢圓曲线的向量承諾來做出更短的證明。關鍵在於，無論樹的寬度如何，每個父子關系對應的證明片段只有 32 個字節。樹寬度的唯一限制是，如果樹太寬，證明的計算效率就會降低。以太坊的建議實現寬度爲 256。

因此，證明中單個分支的大小變爲 32*log256(N) = 4*log2(N) 字節。理論上的最大證明大小變爲大約 30,000,000/2,400*32*(32-14+8)/8 = 1,300,000 字節（由於狀態塊分布不均勻，數學計算在實踐中略有不同，但這作爲第一個很好）。

作爲額外的警告，請注意，在上述所有示例中，這種“最壞情況”並不是最壞情況：更糟糕的情況是攻擊者故意“挖掘”兩個地址以在樹中具有很長的公共前綴，並且從其中一個讀取，這可以將最壞情況的分支長度再延長約 2 倍。但即使有這樣的警告，Verkle 樹也能讓我們獲得約 2.6 MB 的最壞情況證明，這大致與今天的最壞情況呼叫數據相匹配。

我們還利用這個警告來做另一件事：我們使訪問“相鄰”存儲變得非常便宜：同一合約的許多代碼塊，或相鄰的存儲槽。 EIP-4762提供了鄰接的定義，鄰接訪問僅收取200 Gas費用。對於相鄰訪問，最壞情況的證明大小變爲 30,000,000/200*32 = 4,800,800 字節，這仍然大致在容差範圍內。如果爲了安全我們希望降低這個值，我們可以稍微增加相鄰的訪問成本。

已加星標的二元哈希樹

這裏的技術是非常不言自明的：你做一個二叉樹，採用你需要證明一個塊中的值的 max-10.4-MB 證明，並用該證明的 STARK 替換該證明。這讓我們發現證明本身僅包含被證明的數據，加上實際 STARK 的約 100-300 kB 固定开銷。

這裏的主要挑战是證明時間。我們可以進行與上面基本相同的計算，只不過我們不計算字節，而是計算哈希值。 10.4 MB 的塊意味着 330,000 個哈希值。如果我們添加攻擊者“挖掘”樹中具有長公共前綴的地址的可能性，那么真正最壞的情況將變爲大約 660,000 個哈希值。因此，如果我們能夠證明每秒約 200,000 個哈希值，那就沒問題。

這些數字已經在具有 Poseidon 哈希函數的消費筆記本電腦上達到了，該函數是專門爲 STARK 友好性而設計的。然而，波塞冬相對不成熟，因此許多人還不信任它的安全性。因此，有兩條現實的前進道路：

快速對 Poseidon 進行大量安全分析，並熟悉它以將其部署在 L1
使用更“保守”的哈希函數，例如 SHA256 或 BLAKE

在撰寫本文時，Starkware 的 STARK 證明者如果要證明保守的哈希函數，則只能在消費筆記本電腦上每秒證明約 10-30k 哈希值。然而，STARK技術正在迅速進步。即使在今天，基於 GKR 的技術也顯示出有望將其提高到約 100-200k 範圍的潛力。

除了驗證區塊之外的見證人用例

除了驗證塊之外，還有其他三個關鍵用例可以實現更高效的無狀態驗證：

內存池：當交易被廣播時，p2p 網絡中的節點需要在重新廣播之前驗證交易是否有效。如今，驗證不僅包括驗證籤名，還包括檢查余額是否充足以及隨機數是否正確。將來（例如，使用本機帳戶抽象，例如 EIP-7701），這可能涉及運行一些 EVM 代碼，這些代碼會執行一些狀態訪問。如果節點是無狀態的，則交易將需要附帶證明狀態對象的證明。
包含列表：這是一項提議的功能，允許（可能是小型且不復雜的）權益證明驗證器強制下一個塊包含交易，而不管（可能是大型且復雜的）塊構建者的意愿如何。這將降低強大的參與者通過延遲交易來操縱區塊鏈的能力。然而，這要求驗證者有辦法驗證包含列表中交易的有效性。
輕客戶端：如果我們希望用戶通過錢包（例如 Metamask、Rainbow、Rabby...）訪問鏈而不信任中心化參與者，則他們需要運行輕客戶端（例如 Helios）。核心 Helios 模塊爲用戶提供了經過驗證的狀態根。然而，爲了獲得完全去信任的體驗，用戶需要爲他們進行的每個單獨的 RPC 調用提供證明（例如，對於 eth_call 請求，用戶需要在調用期間訪問的所有狀態的證明）；

所有這些用例的一個共同點是它們需要相當大量的證明，但每個證明都很小。因此，STARK 證明實際上對他們來說沒有意義；相反，直接使用 Merkle 分支是最現實的。 Merkle 分支的另一個優點是它們是可更新的：給定一個以區塊 B 爲根的狀態對象 X 的證明，如果您收到一個帶有其見證人的子區塊 B2，您可以更新該證明以使其以區塊 B2 爲根。 Verkle 證明本身也是可更新的。

與現有研究有哪些聯系？

Verkle樹：https://vitalik.eth.limo/general/2021/06/18/verkle.html

John Kuszmaul 的原始 Verkle 樹論文：https://math.mit.edu/research/highschool/primes/materials/2018/Kuszmaul.pdf

Starkware 證明數據：https://x.com/StarkWareLtd/status/1807776563188162562

Poseidon2 論文：https://eprint.iacr.org/2023/323

Ajtai（基於格硬度的替代快速哈希函數）：https://www.wisdom.weizmann.ac.il/~oded/COL/cfh.pdf

Verkle.info：https://verkle.info/

還需要做什么，需要權衡什么？

剩下要做的主要工作是：

對EIP-4762後果的更多分析（無狀態gas成本變化）
更多工作完成和測試過渡程序，這是任何無狀態 EIP 復雜性的很大一部分
對 Poseidon、Ajtai 和其他“STARK 友好”哈希函數的更多安全分析
進一步开發用於“保守”（或“傳統”）哈希函數的超高效 STARK 協議，例如基於 Binius 或 GKR 的想法。

我們很快就會做出選擇以下三個選項中的哪一個的決策點：(i) Verkle 樹，(ii) STARK 友好的哈希函數，以及 (iii) 保守哈希函數。它們的屬性可以大致總結如下表：

除了這些“標題數字”之外，還有一些其他重要的考慮因素：

如今，Verkle樹代碼已經相當成熟。使用 Verkle 之外的任何東西實際上都會延遲部署，很可能是通過硬分叉。這可能沒問題，特別是如果我們無論如何都需要額外的時間來進行哈希函數分析或證明者實現，並且如果我們有其他重要功能希望盡早包含在以太坊中。
使用哈希更新狀態根比使用 Verkle 樹更快。這意味着基於哈希的方法可以縮短全節點的同步時間。
Verkle 樹具有有趣的見證更新屬性 - Verkle 樹見證是可更新的。此屬性對於內存池、包含列表和其他用例很有用，它還可能有助於提高實現效率：如果更新狀態對象，您可以更新倒數第二個級別的見證人，甚至無需讀取最後一個級別。
Verkle 樹更難通過 SNARK 證明。如果我們想將證明大小一直減少到幾千字節，Verkle 證明會帶來一些困難。這是因爲 Verkle 證明的驗證引入了大量的 256 位操作，這要求證明系統要么具有大量开銷，要么本身具有自定義的內部結構，其中包含用於 Verkle 證明的 256 位部分。

如果我們希望Verkle見證的可更新性以一種量子安全且相當高效的方式進行，另一種可能的途徑是基於網格的Merkle樹。

如果證明系統在最壞的情況下不夠有效，我們可以使用另一個“帽子裏的兔子”來彌補這種不足，那就是多維Gas：對(i) calldata、（ii）計算、（iii）狀態訪問以及可能的其他不同資源有單獨的Gas限制。多維Gas增加了復雜性，但作爲交換，它更嚴格地限制了平均情況和最壞情況之間的比率。對於多維Gas，要證明的理論最大分支數可能會從30,000,000 / 2400 = 12,500減少到3000。這將使BLAKE3（勉強）即使在今天也足夠了，沒有進一步的證明改進。

多維Gas允許區塊的資源限制更接近地復制底層硬件的資源限制。

另一個“突然出現的兔子”是延遲狀態根計算直到塊之後的槽的提議。這將爲我們提供整整 12 秒的時間來計算狀態根，這意味着即使在最極端的情況下，只有約 60,000 次哈希/秒的證明時間就足夠了，這再次將我們置於 BLAKE3 勉強夠用的範圍內。

這種方法的缺點是，它會增加輕客戶端延遲一個時間段，盡管該技術有更聰明的版本可以將這種延遲減少到僅證明生成延遲。例如，只要任何節點生成證明，就可以在網絡上廣播該證明，而不是等待下一個塊。

它如何與路线圖的其他部分交互？

解決無狀態問題大大增加了單獨質押的便利性。如果能夠降低單獨質押最低余額的技術（例如 Orbit SSF 或應用層策略（例如小隊質押））變得可用，那么這將變得更有價值。

如果同時引入 EOF，多維Gas會變得更容易。這是因爲用於執行的多維 Gas 的一個關鍵復雜性是處理不傳遞父調用的完整 Gas 的子調用，而 EOF 通過簡單地使此類子調用非法（並且本機帳戶抽象將提供一個 in -當前部分Gas子調用主要用例的協議替代方案）。

另一項重要的協同作用是無狀態驗證和歷史過期之間的協同作用。如今，客戶必須存儲近 TB 的歷史數據；這個數據比國家數據大幾倍。即使客戶端是無國籍的，除非我們也能減輕客戶端存儲歷史的責任，否則客戶端幾乎無存儲的夢想也無法實現。這方面的第一步是 EIP-4444，這也意味着將歷史數據存儲在 torrent 或 Portal 網絡中。