加密貨幣交易所 加密貨幣交易所
Ctrl+D 加密貨幣交易所
ads
首頁 > FTT > Info

主網上線在即,AI 數據的分布式存儲協議 EpiK 如何變垃圾數據為有效數據?_EPIK:PROT

Author:

Time:1900/1/1 0:00:00

撰文:ZeoZhang

來源:鏈聞ChainNews

騰訊創始人馬化騰曾在2017年「邁進智能新時代」中國IT領袖峰會上坦言:

目前很多大數據是垃圾數據,因為沒有標簽,用再好的算法也算不出來,數據清洗、標簽化難度非常高,我們甚至要耗費很多人工先清洗數據,再讓AI學習。

一席話道出人工智能發展難點。在互聯網計算機迭代數十年后,算法和算力的積累已將人工智能推向一個新的階段,但缺乏高質量的有效數據,成為掣肘人工智能發展的重要原因之一。在解決這一問題上,測試網已經平穩運行一年的AI數據的分布式存儲協議EpiKProtocol提出了結合區塊鏈的解決方案。

2021年8月15日,測試網已經平穩運行一年的AI數據的分布式存儲協議EpiKProtocol將正式上線主網。作為一個首次集數據標注、分布式存儲以及數據應用等功能于一身的項目,EpiKProtocol嘗試解決市場缺乏有效數據問題,構建共建共享共益的AI數據的分布式存儲協議?

為什么缺乏有效數據?

一方面,平臺默許甚至鼓勵虛假的刷數據行為,造成無用數據橫行。

對于傳統互聯網行業來說,刷數據現象司空見慣:新開的網店九成以上會選擇刷單吸引客流量;即使是訂閱量超百萬的微信大號也經常通過刷閱讀量滿足廣告客戶的數據需求;更甚者,某旅游平臺曾被爆出通過機器+人工的形式,冒充用戶發表了數千萬的用戶評價,以假亂真,影響用戶對產品的真實測評。

Aave V2版本已在主網上線:金色財經報道,Aave協議V2版本已經在主網上線。在V2版本中,被用作抵押品的資產可以進行自由的交易,新功能還包括閃電貸升級、抵押品直接還款、閃電貸清算、批量處理閃電貸、債務代幣化、本地信貸授權、Gas優化、穩定利率及浮動利率切換。Aave V2已通過了MixBytes、CertiK、ConsenSysDiligence及PeckShield的審計。[2020/12/4 23:02:37]

對于一向標榜公開、透明、鏈上可追溯的區塊鏈行業來說,刷數據現象仍不鮮見,分布式存儲領域明星項目?Filecoin?也曾陷入「無效數據」質疑:在Filecoin網絡剛上線時,較高的挖礦收益吸引大量礦工參與,甚至有部分礦工利用外部程序進行灌裝虛擬數據或自己封裝一些毫無價值的垃圾數據。

Filecoin存儲算力快速暴增,從而導致存儲的數據量短時間爆增。再加上Filecoin網絡一開始無法對存儲的數據進行分辨,真實有效數據極少,大量物理存儲被浪費,對整個Filecoin生態發展帶來不良影響。

另一方面,數據處理成本居高不下,多數人工智能不堪重負。

眾所周知,人工智能需要不斷深度學習,這需要龐大的數據量支撐。

龐大的用戶群體每天活躍在互聯網中,產生龐雜的數據。然而這些數據并不能被直接使用。人工智能的深度學習需要數據集的獲得、數據的標注等,其中數據的標注會造成巨大的人力成本。

CENNZnet主網上線后,已有2億枚CENNZ轉換為主網代幣:自CENNZnet團隊8月13日宣布上線主網后,至今已有2億枚CENNZ資產轉換為主網代幣,約占總量的16.6%。據介紹,CENNZnet目前正運行著CENNZ、CPAY兩種資產。參與者之后可在主網上質押CENNZ,來獲得CPAY、Gas和區塊獎勵,而CPAY正是CENNZnet發行的算法穩定幣。[2020/9/14]

廣泛應用深度學習網絡需要大量已標注的數據進行訓練才有可能達到預期的效果,但大數據時代下,雖然有海量的數據取之不盡,絕大部分卻是未進行標注的數據,這些訓練數據的標注需要人為進行。

對于數據品質要求越高,數據的標注需求就越精細,對標注人員的素質和專業知識的要求也就越高,相對應成本也越高。

長久以來,這些數據都由專門的數據標簽分類公司進行加工處理,以供人工智能等數據需求領域發展使用。然而,用戶-數據處理公司-數據需求者的三方協作,使得有價值的數據獲取成本極高。

標注、存儲、銷售:EpiKProtocol的一站式數據服務

EpiKProtocol生態引入領域專家、賞金獵人、數據企業三類角色,致力于構建去中心化的大規模共建共享共益的AI數據存儲協議,通過去中心化存儲技術IPFS、去中心化自治組織DAO及通證經濟模型,組織并激勵全球社區成員將人類各領域知識梳理成可用的AI數據,并持續更新這一人類永恒知識庫。

ETC Core:當前多數礦池和礦工已確認在正確的ETC主網上挖礦:8月5日早間,ETC Core官方發推稱,自ETC遭受51%攻擊以來,當前所有主要的礦池和多數礦工都已確認在正確的ETC主網絡上挖礦。[2020/8/5]

在數據標注方面,EpiKProtocol連接C端用戶推出AI數據標注系統。

「領域專家」設計不同領域的AI數據格式,并發布數據標注任務;人人都能注冊成為「賞金獵人」,參與數據標注成為AI老師,獲得EPK代幣獎勵。

完成數據標注后,「賞金獵人」返還處理過的數據,「領域專家」驗收所負責領域AI數據獲得EPK代幣獎勵。此外,「領域專家」還會根據數據結果優化AI數據格式,良性循環下,數據質量得到不斷提升。

在數據存儲方面,EpiKProtocol推出AI數據存儲系統。

完成標注并通過驗收的數據將由「領域專家」上傳至AI數據存儲系統進行分布式存儲,參與數據存儲的設備也都可以獲得EPK代幣獎勵。

在數據銷售方面,數據企業可通過質押EPK來訪問數據,并從AI數據存儲系統中付費下載有效數據。

由于EpiKProtocol的AI數據標注系統直接面向C端用戶,消除了中間戶數據標注公司的存在,簡化了數據處理流轉的各個環節,因此成本更低。以一條可用的AI語音方言數據為例:傳統市場一條可用數據成本約在12元左右,而在EpiKProtocol系統成本約為2元,是傳統市場的1/6。

行情 | BMJ主網上線FUBT,兩日漲幅近148%:據FUBT實時行情顯示,BMJ今日漲幅35%,現報0.7875USDT,兩日累計漲幅近148%,請注意回調風險。BMJ基于分布式存儲開發的公鏈,2020推出燃燒挖礦機制、主動通縮經濟模型。燃燒即銷毀,必須銷毀一定量的BMJ幣才能獲得采礦權,銷毀的越多、硬盤容量越大,礦工獲取的權限則越高,這種機制將會是區塊鏈3.0的代表模型。[2020/2/8]

更重要的是,由于EpiKProtocol系統中有來自各行各業的「領域專家」把關數據治理,因此EpiKProtocol系統產生的有效數據更能夠精準符合不同AI領域的數據需求。

協同B端、C端和行業專家的開放經濟模式

不同于目前分布式存儲主要圍繞B端歸檔數據存儲服務的商業模式,EpiKProtocol是一個協同B端企業、C端用戶和領域專家的去中心化協同AI數據存儲協議,在成本控制、收益提升和服務體驗方面,都具有媲美中心化互聯網巨頭的能力。

C端用戶:更低的數據標注門檻

EpiKProtocol針對C端用戶打造了AI數據采集應用「知識大陸」,降低了數據標注門檻,同時提升了趣味性。卡通的界面和簡明的布局讓數據標注這種枯燥而繁雜的工作變為有趣的游戲,通過游戲化形式組織其全球社區成員共建大規模開放AI數據庫。

比原鏈主網上線:比原鏈主網上線公告比原鏈公告宣布“”經過10個月的開發與測試,比原鏈主網1.0.0版 “智” 于北京時間4月24日14:00正式上線。[2018/4/24]

各行各業都可以在「知識大陸」中創建AI數據類型,包括金融、醫藥、法律、社交、電商等,未來隨著知識大陸的發展和運用,有數據需求的公司都可以選擇在此進行共同協作收集整理并處理數據。

其次,EpiKProtocol的標注效率更高。AI數據標注系統運營三周以來,EpiKProtocol標注了17272條有效數據,且數據指標完整,每條數據被人工驗證次數高達10次。相比較于傳統標注方式,EpiKProtocol的標注效率高了近乎10倍。

最重要的是,參與EpiKProtocol數據標注的用戶能夠獲得更高收益。傳統數據標注模式中,數據處理者僅作為一種人工勞動力,并不享有數據分紅權。而在EpiKProtocol中,對數據做出貢獻所獲得的EPK實際是獲得了數據的股權,分享數據在后續使用過程中的盈利分紅。后期數據需求越大,EPK需求就越高,EPK便會升值,EPK持有者便可以獲益。

B端用戶:激勵有效數據

EpiKProtocolAI數據存儲系統采取經典的1+3配置,即1Deamon+3Miners配置。與Filecoin相比,EpiKProtocolAI數據存儲系統參與出塊最小算力為0、存儲免費,無需指定節點且默認無限份數、無限時間,更能夠充分調度起每臺閑置存儲設備。

最重要的是,Filecoin存儲無用數據也可獲得算力,但EpiKProtocol存儲系統中只有通過「領域專家」驗證過的數據才可獲得算力,這不僅保障了數據的高質量,而且進一步遏制了無效數據浪費存儲空間的不良影響。

項目團隊

EpiKProtocol擁有行業頂級顧問以及實力派投資機構。著名AI科學家、SigularityNET創始人、全球首個機器人公民Sophia之父的首席科學家BenGoertzel出任EPIK?銘識協議顧問,協助EPIK推動歐美數據市場,助力構建高質量的AI數據生態。

融資方面,EpiKProtocol獲得了包括FBGCapital、JACKDAW、1475、ChainUpCapital、7O'clockCapital等機構的青睞,助力AI數據的分布式存儲以新的勢頭進入大眾視野。

主網即將上線

根據團隊最新消息,EpiK「主網1.0羅塞塔」將于2021年8月15日中午12點正式上線。該時間也是EpiK測試網上線1周年的時刻。目前測試網5.0在測節點已超過6萬個,穩定出塊。

隨著主網的日益臨近,挖頭礦也成為EpiKProtocol用戶的關注焦點之一。作為EpiKProtocol生態激勵代幣,EPK總發行量為10億,其具體分配規則如下:

1.創世團隊:5%,每90天釋放1/16;

2.基金會:5%,每90天釋放1/4;

3.投資人:20%,每90天釋放1/7;

4.社區:70%,出塊速遞每90天衰減一次,4年減半,分50年釋放完畢。

EpiKProtocol擁有AI數據標注和AI數據存儲兩大系統,也對應了兩種主要參與方式:

第一類,參與標注AI數據,成為EPK賞金獵人。利用閑暇時間參與標注不同AI領域數據,完成任務越多,EPK收益越高。認真答題還有機會贏取知識徽章NFT,后續可憑借NFT參與EPK空投活動。

第二類,參與存儲AI數據,成為EPK存儲節點。利用閑置的存儲設備即可參與存儲AI有效數據,每個存儲節點需要完成1000EPK的基礎質押才能擁有出塊權。存儲節點是隨機獲得出塊機會的,但是其隨機被選中的概率和其成功存儲的數據大小掛鉤:存的數據越多,被選中概率越高,同一個文件的Top100存儲者享有雙倍算力。

只有通過領域專家驗證過的數據才被計為有效存儲,存儲節點才能獲得算力,因此,為了獲取更多的有效存儲,就需要完成額外的流量抵押。1EPK可以用于訪問10Mib數據,也可用于封裝10Mib數據。目前,基礎抵押提現的解鎖期為0天,流量抵押提現的解鎖期為3天。

結語

EpiKProtocol還開啟了在分布式治理領域的探索,于7月20日發布了EpiKDAO。作為分布式存儲賽道首個DAO治理模型,社區用戶可以借助EpiKDAO參與EpiK生態資源的動態調節,有效保障EpiK社區的可持續發展,修復未來可能發生的資源錯配問題。

隨著Web3.0時代的日益來臨,數據的重要性日益凸顯。EpiKProtocol從數據標注到數據分布式存儲再到對接企業實現數據應用,打造了一個低門檻、高效率的數據收益共享閉環,未來EpiKProtocol如何實現豐富的落地應用場景值得期待。

Tags:EPIKCOLPROTPROepikprime幣行情Fountain ProtocolRebellion Protocolx42 Protocol

FTT
固定利率借貸協議Element Finance發布治理模型_ENT:Women Empowerment Token

鏈捕手消息,固定利率借貸協議ElementFinance發布推文介紹其治理模型,目標是通過授權、資本效率投票和資金管理,做出決策和表達價值.

1900/1/1 0:00:00
PayPal首席執行官:PayPal正加強關注DeFi和智能合約_PAY:BITPAY價格

鏈捕手消息,PayPal首席執行官DanSchulman在第二季度財報電話會議上發表的評論表明,該公司正在加速關注加密貨幣技術。Schulman表示:“我們仍然對加密貨幣的勢頭感到非常滿意”.

1900/1/1 0:00:00
Coinbase 收購加密數據聚合器 Zabo_OIN:coinbase官網下載

鏈捕手消息,美國加密貨幣交易所Coinbase已同意收購Zabo,該公司的10人核心團隊正在加入Coinbase.

1900/1/1 0:00:00
央行正式公布數字人民幣全貌,你應該了解這些特點_數字人:比特幣

本文來源于區塊律動BlockBeats,作者為?0x49。7月16日,中國人民銀行正式發布《中國數字人民幣的研發進展白皮書》,這是數字人民幣從概念出現到落地試驗的7年中,官方首次公布數字人民幣的.

1900/1/1 0:00:00
Spartan Group合伙人:18年的加密熊市是怎樣的?_SPA:MuscleX

本文來自SpartanGroup合伙人JasonChoi推特,并由鏈捕手翻譯。你們中的很多人都沒有經歷過2018年加密熊市.

1900/1/1 0:00:00
NFT 交易平臺 OpenSea 完成 1 億美元 B 輪融資,a16z 領投_NFT:SEA

鏈捕手消息,NFT交易平臺OpenSea完成由a16z領投的1億美元B輪融資,參投方包括Coatue和CreativeArtistsAgency等機構.

1900/1/1 0:00:00
ads