我們不必知道現象背后的因果,我們只想讓數據自己發聲。那么,在區塊鏈時代,如何讓端對端加密的數據發聲?
原創|阿常
在大數據時代,我們不必知道現象背后的原因,我們只要讓數據自己發聲。
維克托·邁爾-舍恩伯格《大數據時代》移動互聯網、大數據技術的發展讓我們享受著數據帶來的紅利,購物、打車、理財等等應用或者服務采集用戶的信息,提供精準化、個性化的服務,給人們的生活帶來了極大便利。
而這些便利背后,卻是數據分析方放棄追求數據“結果”,選擇追求一種“聯系”,尋找數據之間的關聯性,洞察我們的需求進而提供出更具針對性的服務。
而在區塊鏈的網絡中,數據呈現出端對端加密的特質,遠比互聯網數據更加嚴密,尋找這些數據背后的“結果”更是難上加難;但是對于從業者而言,找到這些數據之間的關聯,提供“定制化服務”并研判發展趨勢同樣重要。
觀點:即使以百倍價格,比特幣最高主義者亦不會賣出BTC:放射學家、個人比特幣礦工Brian Goss博士在推特上表示,比特幣社區的許多“toxic(有)”參與者不會出售他們的財富,即使是以“100倍”的價格(截至發稿時約為87萬美元)。他指出,所有這些以美元計算的收益都是偽鈔。因此,用比特幣去交換美元無論如何都是沒有意義的。認同這種BTC最高主義的“有人群”有很多,一般人根本意識不到這個社區有多大。
對此,Blockstream聯合創始人和首席執行官Adam Back用一個著名的模因,即黑客帝國里的“what-if-I-told-you”來支持這一說法。(U.Today)[2020/5/12]
市場剛需,加密數據如何利用
比特幣鏈上數據顯示:礦工認為減半會推升比特幣價格:鏈上數據公司CryptoQuant數據分析師Joe Nemelka最近表示,礦工流入交易所的比特幣有所增加可能預示著即將到來的價格波動。根據Nemelka的說法,礦工流入交易所的比特幣與所有其他流入(其他交易所、錢包等)的比例是顯而易見的。在礦工流入交易所百分比圖里,一些峰值達到6%以上,這表明價格趨勢發生了變化。礦工流入交易所百分比數據集可以讓市場參與者發現礦工賣壓的峰值,而礦工頭寸指數使我們能夠了解他們持有或出售比特幣的趨勢。自一月份以來,礦工一直持有比特幣,可能希望以減半后的價格出售比特幣。CryptoQuant首席戰略官 Mason Jang表示,“ MPI(礦工頭寸指數)突顯出,在歷史上,礦工每日流出的比特幣價值一直處于極高或極低的水平。MPI值大于2表示大多數礦工正在出售比特幣。同樣,如果MPI小于0,則意味著礦工的賣壓較小。”(Cointelegraph)[2020/5/2]
大數據分析精髓在于挖掘數據與真實信息的關系。通過海量數據分析甚至某一特殊事件的數據解讀,不再熱衷于追求數據分析的精確度。單純令數據發聲,提供行動指南。
聲音 | 數字貨幣交易所Abra CEO:比特幣及區塊鏈技術或將使部分商業部門消失:據bitcoinexchangeguide消息,數字貨幣交易所Abra首席執行官Bill Barhydt近期表示,比特幣以及區塊鏈技術與互聯網技術相比,擁有可能將眾多現有商業部門從地球上抹去的潛力。因為這項技術,諸如書店、雜志以及音像出租店等要不就是被改造,要不就過時了。他還稱,當你忘記市場波動時,就會看到比特幣的特性從未改變,盡管其價格波動,但以美元計價的比特幣價格并不重要。比特幣作為一項技術,對于跨境支付、分散投資和資產融資非常重要。[2018/10/1]
而區塊鏈數據由于其本身的匿名性特征,很多時候并不能輕易找到關聯關系,但是通過過去某種現象背后數據的全面分析,就能為之后類似事件提供前瞻性建議或者預警。
FUNDSTRAT分析師TOM LEE:比特幣價格下跌是“很健康的”:比特幣市場及價格機制都不成熟,造成波動巨大,穩定性不好。因此很多人猜測存在泡沫風險,投資需要謹慎。可是FUNDSTRAT分析師TOM LEE也認為即使存在泡沫,也是規模很小的。而對于比特幣固有價值,整個行業也存在很大的分歧。[2017/12/26]
區塊鏈大數據技術已經廣泛應用在交易所、錢包、安全機構的業務場景中,通過對交易信息特征的分析,可以得到交易與潛在風險的關聯關系,規避掉黑客盜幣、洗錢等等違法犯罪行為,并能夠幫助用戶挽回受損資產。
Chaindigg創始人葉茂舉例稱,一些黑客在盜取數字貨幣后,有時會設定遠高于市價標準的手續費,令礦工率先確認其交易,以便快速實現資金轉移的目的。那么在面對一些不合常理的手續費時,交易所可以對這類地址進行區分處理,降低風險。
區塊鏈大數據,可以說是目前市場的剛需,可誕生于互聯網的大數據技術仍需要做出一些改變,適應區塊鏈數據的特征。
相比較互聯網中的數據構成,區塊鏈數據更具備規律性。所有信息都是按照區塊組織排列,每個區塊中包含著的交易數據都按照該公鏈所設定的邏輯排列,且大部分區塊在時間中存在先后次序,那么在挖掘數據、查找數據的過程中能夠精確規定到某一個時間節點;而互聯網大數據則往往由于沒有一致的標準和時序,產生諸多異構性數據,通過統一加工后方才能夠分析。
區塊鏈數據維度比互聯網數據相對簡單。區塊鏈大數據能夠劃分的維度相對較少,一般分為交易發起方、交易接收方、交易時間、交易金額、交易頻次等維度,簡單的特征將有助于更好地對數據進行歸類分析。
處理區塊鏈大數據,了解數據特征只是基礎,更重要的是需要保證兩個關鍵因素:準確率、召回率。
如何保證數據分析精度?
區塊鏈大數據不光要考慮數據的特征,同時也要考慮數據的準確性,以及在相關維度中信息的關聯——其核心難度在于準確性、召回率的提升。
準確性又可以理解為真實性,即數據真偽。以比特幣網絡為例,在可抓取到的幾億條地址當中,存在一些洗錢地址、詐騙地址等,那么如果能夠在分析數據時發現這些數據,無疑能夠提高安全性,降低風險,只有準確率足夠高時才能夠發揮數據的真正作用。
但僅僅保證高準確性并不足夠,召回率同樣重要。在巨量的準確數據中仍只有一部分數據能夠被分析出來,而某些特征不清晰的數據則無法被解讀。以比特幣網絡為例,某些地址交易記錄頻繁,有時間、數量、交易費等特征可以分析,這部分數據無疑更方便解讀;但同時也有一些地址,可以分析的特征維度較少,甚至只有一筆或者沒有交易記錄,這部分“難啃的骨頭”啃不掉,數據召回率同樣無法提高,也就難以利用區塊鏈大數據。
Chaindigg創始人葉茂在接受鏈得得采訪時就指出,準確性、召回率雖然劃分維度不同,但是同樣重要,只有兩者齊備才能夠真正進行區塊鏈大數據分析,單一一項很難起到決定作用。
理論上而言,提高了準確性、召回率,就能夠提高區塊鏈大數據的使用能力,但是區塊鏈大數據仍面臨諸多困難。
相比較互聯網數據,同一公鏈中內容更加規范,但是目前主流數字貨幣基數較多,存在一些公鏈產生的數字貨幣具有較強的特殊性;此外,聯盟鏈中數據則具備更強的商業價值,甚至涉及商業機密,起著指導企業后續規劃等作用,這也給數據分析的普適性提出更高要求。
換而言之,想要進行區塊鏈數據分析,就必須研制出能處理這些差異的普適性技術。以比特幣與以太坊網絡為例,后者較前者增加了智能合約的功能,那么在進行數據采集分析過程中就要考慮到智能合約地址的特征,提高數據分析的準確率和召回率。
互聯網語境中大數據分析常用的多項技術和策略,例如機器學習、數據標注、模型分析、交叉驗證等等,將其嫁接到區塊鏈語境中同樣事半功倍。
區塊鏈大數據,或許可以理解為大數據技術在區塊鏈領域的延伸,盡管區塊鏈數據經過了層層加密,但是仍需要從中尋找到向前發展的指引。
在中國歷史上,從來不缺聰明人,他們精通人性,慣于權謀,為了實現個人的理想,往往能樹立一個偉大且不可非議的愿景,吸引蕓蕓眾生趨附,成為其揮斥方遒的工具.
1900/1/1 0:00:00加密貨幣交易所Bitfinex在其官網上宣布,已向穩定幣運營商Tether償還了1億美元的貸款。雖然貸款尚未到期,Bitfinex已通過電匯匯款至Tether的銀行賬戶.
1900/1/1 0:00:00親愛的社區用戶: 應FOneSERVICEEX交易區要求,現已開放以下幣種的充值:LDF(Lend0xDefiToken).
1900/1/1 0:00:00火星財經APP一線報道,美國商品期貨交易委員會已向加密衍生品供應商ErisX授予衍生品清算組織許可,這意味著該公司現在可以在美國監管機構的支持下推出實物結算的期貨產品.
1900/1/1 0:00:00金色財經比特幣7月3日訊本周二,也就是亞洲區塊鏈峰會的第二天,知名比特幣交易所BitMEX首席執行官亞瑟·海耶斯和“末日博士”魯里埃爾·羅比尼進行了一場“TangleinTaipei”辯論.
1900/1/1 0:00:00“這不就是Q幣嗎?”在Facebook的Libra推出當天,就有網友這樣調侃。但除了吃瓜群眾的調侃之言,幾乎沒有人會真的把libra等同于Q幣.
1900/1/1 0:00:00