引言
這幾年,學術和產業界對區塊鏈的理解和應用產生了大量誤區,本人也在過去的文章中逐步澄清和重新定義。不過,總覺得意猶未盡,沒有專門立題成章。最近由于正在設計分布式產業協作模型,每到區塊鏈技術運用精妙之處,覺得需要有系列文章來逐一解釋這些誤解。希望通過本人的反復倡導,可以為區塊鏈產業運用提供更多的方案和定義。
這次我們首先討論“區塊鏈是共享數據庫”這個說法到底有沒有問題。在百度百科這樣描述區塊鏈:“區塊鏈是一個信息技術領域的術語。從本質上講,它是一個共享數據庫,存儲于其中的數據或信息,具有“不可偽造”“全程留痕”“可以追溯”“公開透明”“集體維護”等特征。”可以說大部分認為區塊鏈是一種共享數據庫的說法,受百度百科影響比較大。
接下來,我們就分析一下什么是共享數據庫?
一、什么是共享數據庫
本人通過“知網”搜索“共享數據庫”關鍵字,并未發現直接匹配的論文,更多是關于數據共享模式的相關論文;通過百度百科詞條搜索也沒有發現“共享數據庫”的概念描述,倒是有“共享存儲”。可以說,一直以來“共享數據庫”就不是學術和系統軟件實踐的概念,“共享數據庫”更多的是互聯網造詞的畸形產物之一。
LBank藍貝殼于4月9日16:50首發 BOSON:據官方公告,4月9日16:50,LBank藍貝殼首發BOSON(Boson Protocol),開放USDT交易,4月9日16:00開放充值,4月12日16:00開放提現。上線同一時間開啟充值交易BOSON瓜分10,000 USDT。
LBank藍貝殼于4月9日16:50開啟充值交易BOSON瓜分10,000 USDT。用戶凈充值數量不少于1枚BOSON ,可按凈充值量獲得等值1%的BOSON的USDT空投獎勵;交易賽將根據用戶的BOSON交易量進行排名,前30名可按個人交易量占比瓜分USDT。詳情請點擊官方公告。[2021/4/9 20:02:26]
這是因為,無論從數據集成和共享模式分析,還是從數據庫分類分析看,“共享數據庫”都是一種偽命題。
首先,從數據庫的定義上看:“數據庫是按照數據結構來組織、存儲和管理數據的倉庫,是一個長期存儲在計算機內的、有組織的、可共享的、統一管理的大量數據的集合”,也就是說數據可共享本身就是數據庫的基礎功能之一,不需要額外使用區塊鏈技術來建立數據庫的數據共享能力。
其次,從數據庫分類看,目前常見分類按照數據結構的組織不同,可分為:“關系型數據庫”和“NoSQL數據庫”;按照部署模式不同,可分為:“單機數據庫”和“分布式數據庫”等,也從未出現過按照數據共享程度分類的數據庫。
首發 | 歐科云鏈推出“天眼方案”推動鏈上安全系統再升級:8月28日,區塊鏈產業集團歐科云鏈宣布推出區塊鏈“天眼方案”,主要通過鏈上數據追蹤系統研發、對外技術支持、凝聚企業眾力等途徑,全面助力區塊鏈安全提升和產業平穩健康發展。
據了解,在“天眼方案”下,歐科云鏈集團將打造鏈上數據追蹤系統,通過溯源數字資產、監控非法交易等手段,全力遏制洗錢等非法行為;協助執法機關辦案,并為打造法務等區塊鏈系統提供技術支持;為聯盟鏈和基于各類業務的鏈上數據提供區塊鏈+大數據的解決方案。[2020/8/28]
再者,從數據共享方式上看,業界常采用數據集成,實現把不同來源、格式、特點性質的數據在邏輯上或物理上有機地集中,從而為企業提供全面的數據共享。通常采用聯邦式、基于中間件模型和數據倉庫等方法來構造數據集成的系統,并且已有很多成熟的框架可以利用。
所以,無論是數據庫技術,還是企業數據共享模式的發展都從未出現過“共享數據庫”這個概念,因為開發數據庫軟件的初衷本質上就是解決數據的組織、存儲、管理和共享的。
二、為什么會認為區塊鏈是共享數據庫
上面講到“區塊鏈是一種共享數據庫嗎?”是一種偽命題,因為數據庫的使命之一就是提升數據的訪問和共享便捷性。那我們為什么有這樣的定義呢?我猜測,“區塊鏈是一種共享數據庫”主要還是受一些通用底層區塊鏈平臺或產品的影響。
首發 | 嘉楠耘智宣布與Northern Data在AI、區塊鏈等高性能計算領域達成戰略合作:據官方消息,2020年2月17日,嘉楠耘智宣布與區塊鏈解決方案及數據中心服務提供商Northern Data AG達成戰略合作。本次合作的內容涵蓋AI、區塊鏈及數據中心運維等高性能計算領域。
嘉楠耘智擁有豐富的高性能計算專用ASIC芯片研發經驗。Northern Data AG則專注于區塊鏈和數據中心等高性能計算基礎設施的建設。通過本次戰略合作,雙方將在AI、區塊鏈等新興領域進一步釋放增長潛能。[2020/2/19]
首先,大部分的公鏈平臺,例如:Bitccoin、Ethereum、EOS等,本身并不是一個通用底層區塊鏈平臺,他們都是以點對點資產交易為核心構建區塊鏈相關技術的組合應用,包括:加密技術、分布式技術、P2P數據傳輸、共識算法、鏈式數據結構、博弈論等。技術的運用是為點對點、安全、高效的資產交易達成服務的。所以在非資產處理的行業領域,例如:政務、工業、供應鏈等,直接使用基于公鏈的區塊鏈技術往往會格格不入。由于公鏈平臺業務目的是明確的,所以大家不會去討論BitCoin是否是一個共享數據庫的問題。
首發 | 火幣集團全球業務副總裁:監管將決定區塊鏈技術和加密貨幣的落地速度:1月21日,火幣集團全球業務副總裁Ciara Sun在達沃斯世界經濟論壇上表示,對區塊鏈和數字貨幣的監管態度,2019年是重要的一年。在美國,到2019年底,針對加密貨幣和區塊鏈政策有21項法案,這些法案包括稅收問題,監管結構,跟蹤功能和ETF批準,哪些聯邦機構監管數字資產等。歐盟(EU)在2020年1月10日實施了一項新法律,要求加密貨幣平臺采取更嚴格的反洗錢做法。瑞士,日本,立陶宛,馬耳他和墨西哥通過法律,要求交易所必須根據KYC和AML準則獲得許可。中國,土耳其,泰國等國家正在計劃自己的中央銀行數字貨幣(CBDC)。而監管將決定區塊鏈技術和加密貨幣的落地速度。[2020/1/22]
其次,在大部分已開展聯盟鏈應用的行業中,底層大量采用ApacheHyperledger系列平臺,受Hyperledger的影響頗深。以Hyperledger核心的Fabric為例,Fabric是一個業務目的不明確的通用區塊鏈平臺。從下圖可以看到Fabric的節點主要由智能合約和分布式賬本構成。而節點中的數據主要由分布式賬本Ledger存儲。
首發 | 螞蟻礦機S17真機圖首次曝光 采用雙筒風扇及一體機設計 ?:繼正式宣布在4月9日現貨銷售后,比特大陸即將發布的新品螞蟻礦機S17又有了新動態。據悉,螞蟻礦機S17真機圖今天在網上首次曝光。
從曝光的圖片來看,螞蟻礦機S17延續上一代產品S15的雙筒風扇設計,且采用一體機的機身設計。有業內人士認為,采用雙筒設計可有效縮短風程,礦機出入風口的溫差變小,機器性能將得到很大改善。
此前比特大陸產品負責人在接受媒體采訪時表示,新品S17較上一代產品相比,無論是在能效比還是單位體積的算力等方面,均有較大提升。[2019/4/3]
Fabric?節點構成?來源:HyperledgerFabric技術白皮書
而分布式賬本Ledger又主要由Blockchain和全局狀態構成,全局狀態的更新被區塊中的交易Transactions觸發和決定。見下圖:
Fabric?賬本構成?來源:HyperledgerFabric技術白皮書
由下圖可見,分布式賬本Ledger中的全局狀態WorldState本質確實是一種分布式的KV存儲模型,再配合分布式節點網絡,就不難解釋為什么會認為區塊鏈是一種共享數據庫了。
Fabric?狀態模型?來源:HyperledgerFabric技術白皮書
上面已經提到,Fabric是一種業務目的不明確的通用區塊鏈平臺,在Fabric的賬本模型Ledger中,其實和我們日常理解的金融賬本并沒有直接關系,Ledger只是一種通用KV存儲模型,你可以存儲任意數據。在Fabric實際使用過程中,如果沒有領域模型驅動,Fabric就真是一個分布式數據存儲架構。
受這個因素影響,實際上我們在區塊鏈行業應用中,大量采用Fabric的全局狀態存儲WorldState,實現分布式存儲鏈。我在其他文章已經反復強調了,如果把區塊鏈定位為分布式的數據存儲機制,那和目前常用的分布式數據庫相比沒有任何技術優勢,只是實現更復雜,效率更低而已。
三、數據的共享與數據存儲結構無關
通過上面的分析,也確實可以把以Fabric為代表的區塊鏈通用平臺,定義為分布式數據存儲模型,但這種分布式存儲機制可以帶來數據共享和開放嗎?這里有個誤區,是我們片面的理解為,數據分布式可帶來數據的共享,但本文想強調,數據是否共享與存儲結構和部署模式無關。
數據的存儲結構和部署模式是物理模型,而數據的共享是業務模型。在當下“數據即資產”以及個人隱私保護和商業數據安全得到民眾和輿論強化理解的當下,決定數據是否共享的關鍵,不是數據如何存儲和部署,而是數據共享的業務必要性和多方參與者的利益是否得到平衡和保障。簡單利用分布式存儲機制解決“信息孤島”問題,顯然是異想天開了。
而且,大部分“信息孤島”的問題,恰恰是數據分散存儲和管理造成的,可以說數據的分布式是現狀,而不是前景。解決數據分散造成的“信息孤島”問題,首先要區分數據主權關系。在單一數據主權下最高效的方法是數據集成,通過數據聯邦、數據中間件和數據倉庫等方式實現數據的匯聚;在多方數據主權關系下,則是通過法律強制或商業模式驅動,在合法合規的前提下讓數據在數據應用相關方之間安全流動。
在無法建立數據集成的環境下,例如:多方數據主權、集成成本和法律限制條件,確實可以采用區塊鏈技術建立數據可交易、可流動、可監管的可信數據共享網絡。但這時區塊鏈技術應用重點恰恰不是分布式的數據存儲,而是數據資產的交易。如果沒有建立數據資產交易模型,簡單利用Fabric的全局狀態,是無法實現數據共享的。
其實,以Bitcoin為代表的經典區塊鏈技術,已經證明了區塊鏈分布式節點中的數據存儲只是為了保障各節點,可以本地化、高效的驗證交易數據的真偽,而不是為數據共享為最終目的。
四、新技術驅動總是先帶來啞鈴效應
進入互聯網Web2.0時代以來,大量新技術、新概念、新名詞涌入產業界,從大數據、AI、5G、區塊鏈再到今年的量子計算,每一次的新技術和產業結合都避免不了在國內產業圈出現技術認知的“啞鈴效應”,即:啞鈴的一頭是高度概念化、抽象化,而另一頭是高度的實例化和工具化。
區塊鏈技術的興起也是如此,一邊是從概念化和抽象化上刻畫區塊鏈是一種去中心化,用網絡自治代替中心化系統的價值互聯網;而另一邊則是將區塊鏈描述為共享數據庫,一種分布式存儲工具。為什么會產生這樣的認知呢?我想很大原因是,一種新技術的突然興起,往往只是被幾篇論文、幾個應用場景點燃,但在廣泛領域的應用型配套研究還未完全跟上,采用高度概念化、抽象化或實例化、工具化的定義,總能在現實世界找到映射關系,這是一種低成本的解釋路徑。
可以說,新技術發展的啞鈴效應是一個必然過程,但隨著新技術在領域實踐中的知識積累和模型沉淀,將會不斷修正啞鈴的兩端,讓價值認知更為平滑、實用。愛因斯坦說過:“你無法在制造問題的同一思維層次上解決這個問題”,看待新技術往往不能直接從現實事物中直接匹配和映射,而是需要以創新思維在應用領域發展和完善新技術的定義和價值。
總結:
區塊鏈技術在某種程度上確實可以充當分布式數據庫或數據共享機制使用,但在實際應用中與傳統數據集成框架相比,并無優勢。同時由于采用分布式共識算法、P2P網絡傳輸和區塊數據結構等技術,系統復雜度更高、性能和可維護性更差。這么大的代價只是為了建立分布式一致性的存儲機制顯然是得不償失的,也沒有實際商業前途。利用區塊鏈技術需要關注分布式的對等、安全、公平的交易環境的搭建上,以優化數據交易環境為前提,間接實現數據充分共享和利用。可以說在數據共享領域,區塊鏈技術只是基礎條件之一,而不是絕對因素。在數據所有權分散的環境下,決定數據是否可以共享,最重要的是業務和商業模型的確立。
參考文獻:
百度百科
https://baike.baidu.com/item/數據庫/103728
Apachehyperledger-fabric-readthedocs-io-en-release-2.0.pdf
尊敬的用戶:根據《Hotbit關于交易中心分區轉區細則》,Hotbit定于2020年11月26日起將COU(COUCHAIN)、DEEP(DeepCloudAI)及BQT(非小號)從“主力區”轉.
1900/1/1 0:00:00各位小伙伴們大家好,今天是2020年11月25日星期三,我是區塊鏈里面的狂牛,很高興與大家見面.
1900/1/1 0:00:00上期文章《致富思維:落魄環衛工當街怒罵,原來身份不簡單,晚景凄涼并不遠》,V客預言,大多數人都是晚景凄涼.
1900/1/1 0:00:00“Gate.io理財寶”上線至今推出許多款熱門幣種高年化率鎖倉/活期理財產品,始終緊跟市場步伐推出當下熱門的理財產品,深受用戶的喜愛與支持.
1900/1/1 0:00:00當我還是一個七年級的學生時,我就已經被加密貨幣的世界吸引住了。起初,我覺得這簡直就是一個免費的貨幣生成器,只要我讓我的筆記本電腦像風火輪一樣呼呼地運行Crypto-mining軟件,它就會給我免.
1900/1/1 0:00:00你知道“肥宅比特幣”嗎?這是一位加密貨幣交易員,幣coin實盤大鱷,微博知名大V。你知道“肥宅比特幣”嗎?這是一位加密貨幣交易員,幣coin實盤大鱷,微博知名大V.
1900/1/1 0:00:00