加密貨幣交易所 加密貨幣交易所
Ctrl+D 加密貨幣交易所
ads
首頁 > 萊特幣 > Info

歐科云鏈研究院:本福特定律能否考察區塊鏈鏈上數據_區塊鏈:穩定幣

Author:

Time:1900/1/1 0:00:00

美國大選幾經反轉,終于塵埃落定,拜登目前以290票擊敗232票的特朗普,將成為下一任美國總統。然而拜登選舉欺詐的傳聞也甚囂塵上,最初拜登選票造假的質疑基于本福特定律,后來陸續有重復計票等消息傳出。本福特定律是宇宙中許多數據都適用的規律,雖不能作為直接證據,但常被用于探測數據造假。本文介紹了本福特定律,并且應用到區塊鏈行業,找出滿足本福特定律的數據指標,并從本福特定律的視角考察鏈上數據的合理性。

一、本福特定律:廣泛存在的數據規律

1.?廣泛存在的自然規律

就像牛頓因蘋果落地發現了萬有引力定律,西蒙·紐康和弗蘭克·本福特因翻對數表發現了本福特定律。根據本福特定律,對于許多數據樣本,第一位數字是1的概率遠遠大于其他數字,并且數字越大,出現的概率越小。具體而言,對于最常用的10進制數字,首位數字出現的概率如下:

價值逾7700萬美元的BTC從未知錢包轉移到Coinbase:金色財經報道,數據顯示,今日16:50, 2616 BTC (價值約77,169,276美元) 從未知錢包轉移到Coinbase。[2023/8/10 16:17:58]

人口、GDP、面積等數據被驗證符合本福特定律,甚至斐波那鍥數組、放射性元素半衰期等絕對自然的數據也滿足本福特定律。但本福特定律是一個經驗性的自然規律,沒有嚴格的證明推導。通常來講,本福特定律的適用條件如下:

樣本數量和數量級跨度盡可能大。如跨度小的身高數據不適用,但實踐表明,對一些較小樣本數據也適用;

數據不能有人為操控的痕跡。人為規定的數字如電話號碼、郵編等不滿足本福特定律。當數據被人為篡改后,很可能不符合本福特定律,也正因此,本福特定律可以被用來探測數據造假;

數據:6月比特幣鏈上NFT銷售額超1億美元,較上月縮水44%:7月1日消息,據CryptoSlam鏈上NFT銷售數據顯示,6月比特幣鏈上NFT銷售額達到110,161,309.36美元,交易量為195,725筆。不過該指標較5月份出現了大幅下滑,5月比特幣鏈上NFT銷售額為195,975,372美元,這意味著6月跌幅達到44%。[2023/7/1 22:11:36]

對于隨著時間呈指數型增長的數據,本福特定律一定契合。這一點是可以從數學上嚴格證明的,在b進制中數字n出現的概率即。這類數據的特點是早期增長遲緩,后來增長得越來越快;數據本身有自己的分布規律則很可能不符合本福特定律。如收益率不滿足本福特定律。

人口、GDP、營業收入、播放量、交易量等數據由于規模效應或者網絡效應,早期從1到2很艱難,但發展到一定規模后,從8增長到9相對容易,所以在較小數字停留時間長,在較大數字停留時間短,最終數字首位分布呈現出本福特定律。

美眾議院穩定幣聽證會關注由州或聯邦監管穩定幣發行商:5月19日消息,在5月18日美國眾議院關于穩定幣的聽證會上,州與聯邦監管是一個關鍵問題,主要關注點是兩個有競爭性的穩定幣法案。其中共和黨的法案將允許穩定幣發行商選擇他們注冊的州,而無需通過聯邦儲備委員會;民主黨的法案保留了聯邦手中適當的監管機構的監管機會。(Coinlelegraph)[2023/5/19 15:12:54]

2.?用于探測數據造假

本福特定律常用于探測數據造假,尤其是財務數據中。2003年美國華盛頓州詐騙案中,最初是會計師Darrell?Dorrell用本福特定律發現了支票匯款數據的不合理性,通過進一步調查發現了涉案金額高達1億美元的詐騙。無獨有偶,安然公司2000-2001年的每股盈利也與本福特定律相去甚遠。事實上,自20世界70年代以來,本福特定律被廣泛用于挖掘會計欺詐性行為。

NEAR將于本月啟動夜影協議第一階段并引入Chunk-Only Producers:9月9日消息,NEAR宣布將于本月啟動夜影協議第一階段并引入Chunk-Only Producers,Chunk-Only Producers僅負責在一個分片中生成區塊。NEAR計劃引入250至400名Chunk-Only Producers,該階段預計將于本月下旬啟動。

據悉,之后的第二和第三階段均將于2023年啟動,第二階段會將狀態和處理都將完全分片,第三階段則將實現動態分片,網絡將被動態拆分為分片,然后根據資源利用率進行合并,進一步提高網絡可擴展性。[2022/9/9 13:20:23]

除了金融財務領域,本福特定律也被用于其他領域的數據,如2009年的伊朗大選、希臘政府的宏觀經濟數據、公共計劃經濟數據,比爾·克林頓的納稅申報數據……

安全團隊:MOC項目發生Rug Pull:金色財經消息,據CertiK安全團隊,北京時間2022年7月21日下午05:30,MOC代幣的價格下降了約80%。經過調查,CertiK安全團隊已確認MOC項目為欺詐項目。該項目從配對池中移除了先前添加的流動性,導致池中的流動性大幅下降,并隨后出售MOC代幣。被移除的MOC代幣是在部署MOC智能合約時鑄造的。被移除的BUSD價值約為7.8萬美元。[2022/7/22 2:30:01]

但值得注意的是,本福特定律不能作為呈堂供證,只能作為數據造假的推測,需要后續的取證調查。即使是在華盛頓州詐騙案這一成功應用案例中,會計師Darrell用本福特定律的檢驗只是開始,歷經多方努力和3年的搜證才將主犯凱文·勞倫斯送進監獄,判處20年徒刑。加之,本福特定律在某些領域的適用性存在爭議,如哈佛大學一份研究表明本福特定律不適用于選票數據。基于以上原因,網友對拜登選票進行本福特定律檢驗,在適用性和說服力上存在問題,不能作為選票造假的直接有力證據。

二、本福特定律在區塊鏈領域的應用

上文講述了本福特定律的一般性應用,下文立足于區塊鏈行業,挖掘哪些指標滿足本福特定律,并結合區塊鏈技術的特性探討鏈上數據的合理性。

1.?區塊鏈行業中適用本福特定律的數據

由前文可知,一些宏觀數據如人口、GDP、面積等符合本福特定律。在區塊鏈行業,區塊鏈專利數量、企業數量等宏觀數據也滿足本福特定律。下圖展示了2020年至今各省市的區塊鏈專利數量和Wind全球企業庫中的區塊鏈企業數量,其首位分布均較符合本福特定律。

除此之外,區塊鏈行業中的財務數據也是本福特定律的典型適用場景,下文的數據來自區塊鏈指數成分股。

2.?從本福特定律視角看鏈上數據的合理性

區塊鏈技術本身具有分布式和數據透明的特點,有利于數據的多方監督,數據的不可篡改性也增加了數據造假的成本,欺詐行為會永久留痕,因此區塊鏈技術可以有效抑制數據造假。目前,區塊鏈已在金融、公益等多個領域應用落地,幫助解決數據造假的痛點。

本文先考察了成交額數據的一般特性,再對比了相似體量的基于區塊鏈和不基于區塊鏈的平臺數據。首先,在考察了樣本量為100多,1000多,2000多的交易平臺數據后,發現成交額十分符合本福特定律,并且樣本越大數據越接近本福特定律理論值。接下來,從基于區塊鏈的一個交易平臺獲取成交額數據,整理114個有效樣本并比較其首位數字分布和本福特定律理論值,觀察發現鏈上成交額與本福特定律較吻合,除了數字8。為了對比,選取了一個不基于區塊鏈技術的相似體量的交易平臺,有效樣本數為195,但其成交額在6和7偏高。考慮到鏈上數據樣本量的劣勢和整體情況的吻合,僅從本福特定律出發,基于區塊鏈的成交額數據更為合理。

公益項目水滴籌自稱是基于大數據和區塊鏈的應用,下文以官網公布的122名失信籌款人黑名單為例,從本福特定律的視角探究區塊鏈技術鏈上數據的真實性。根據前文討論,手機號、身份證號等人為規定的數據不符合本福特定律,于是研究對象定為2017年至今每月失信人數量,結果如下。

受制于樣本數量,失信人員數量首位分布未完全吻合本福特定律,但大體呈現數字越大出現概率越低的趨勢。

三、結語

雖未得到嚴格證明,但大量實踐檢驗表明本福特定律是廣泛存在的有趣數據規律,被用于挖掘數據造假,尤其是財務數據中。此次美國大選中拜登選票不符合本福特定律的問題在數據適用性和說服力上存在問題,因此不能作為推翻選舉結果的有力證據。正如本文一再強調的,本福特定律僅僅是發現可疑性的方法,而非充足證據,只是數據打假的起點而非終點。

本福特定律也適用于區塊鏈行業的一些數據,如區塊鏈企業數量、專利數量、公司財務數據等。此外,區塊鏈技術本身數據透明、不可篡改的特點有助于維護數據的真實性。并且對比了一組實際數據發現,從本福特定律的視角,鏈上數據的首位分布是合理的。

來源:金色財經

Tags:區塊鏈MOCCER穩定幣區塊鏈的四大核心技術MOCEANSCERE價格穩定幣和代幣的區別是什么

萊特幣
巍然說幣:比特幣開啟高位震蕩 區間內高拋低吸即可_ETH:btc兌換人民幣匯率查詢

消息面: 美股開盤,標普500指數開盤下跌0.41%;納斯達克指數開盤下跌0.11%;道瓊斯指數開盤下跌0.51%.

1900/1/1 0:00:00
香港區塊鏈協會-火星財經 《香港虛擬資產發佈牌照新政對行業生態會產生哪些影響?》_TEND:ETHSTK幣

11月3日,香港政府財經事務及庫務局發布《有關香港加強打擊洗錢及恐怖分子資金籌集規管的立法建議公眾諮詢》,嘗試透過立法,授權香港證監會引入虛擬資產服務提供者發牌制度.

1900/1/1 0:00:00
亮亮說幣:11.19ETH下午行情分析.多空博弈主力是否疲軟_ETH:LANA價格

?前言:? 時間沒有等你,是誰忘了帶你走,左手過目不忘的是你我,右手里是十年一個漫長的打坐。如果能夠繼續等待,如果時間能夠停下,如果沒有如果?所謂的單邊還在不在,提過的念想還想不想,期待的行情還.

1900/1/1 0:00:00
老萬幣圈:11-20 凌晨比特幣行情分析及操作策略_MIR:RAN

??BTC行情分析: ??日線圖上,大餅收線四連陽,多頭勢力強勢,布林通道開口,攻擊線與防守線均偏向上行,價格點逐漸拉高,午后雖然多次回撤,但下方支撐未被打破,目前還是一個上漲行情.

1900/1/1 0:00:00
金佳說幣:11.19ETH晚間行情分析與操作建議_RAC:COSHI

金佳說幣:11.19ETH晚間行情分析與操作建議從4小時圖來看,目前價格476置附近波動,MACD綠色動量持續放量,KDJ三線目前處于50軸位置向上運行,CCII線常態區向上運行.

1900/1/1 0:00:00
Coinsbuy比特幣交易平臺:投資比特幣需要搞明白三件事_比特幣:COIN

從比特幣的價格走勢上看,近日價格一度接近16000美元,雖稍有回落,但也搶盡了黃金的風頭,被市場稱之為這是一場“靜悄悄的牛市”.

1900/1/1 0:00:00
ads