加密貨幣交易所 加密貨幣交易所
Ctrl+D 加密貨幣交易所
ads
首頁 > Bitcoin > Info

事理圖譜:事件演化的規律和模式_人工智能:CIR人工智能技術應用

Author:

Time:1900/1/1 0:00:00

本文作者為哈工大SCIR實驗室丁效,李忠陽,劉挺,雷鋒網獲權轉載。

2016年7月,哈工大社會計算與信息檢索研究中心開始啟動事理圖譜的研究工作。2017年10月,研究中心主任劉挺教授在中國計算機大會上正式提出事理圖譜的概念。2018年9月,在研究中心丁效老師的主持下,研制出中文金融事理圖譜1.0版本,2019年7月更新為2.0版。本文是對2016年7月以來工作的最新總結,敬請各位同行指正。

引言

事件是人類社會的核心概念之一,人們的社會活動往往是事件驅動的。事件之間在時間、空間上相繼發生的演化規律和模式是一種十分有價值的知識。然而,現有的典型知識圖譜均以實體及其屬性和關系為研究核心,缺乏對事理邏輯這一重要人類知識的刻畫。為了彌補這一不足,事理圖譜應運而生,它能夠揭示事件的演化規律和發展邏輯,刻畫和記錄人類行為活動。在圖結構上,事理圖譜是一個有向有環圖,其中節點表示事件,有向邊表示事件之間的演化關系。現實世界中事件演化規律的復雜性決定了我們必須采用這種復雜的圖結構。本質上,事理圖譜是一個事理邏輯知識庫,描述了事件之間的演化規律和模式。

1.研究背景及意義

隨著深度學習的興起,人工智能迎來了新的發展高潮。人工智能的一個發展瓶頸在于,如何讓機器掌握人類知識。例如,人類能輕易理解“吃過飯”后,就“不餓”了這樣的常識知識,而讓機器理解并掌握大量這樣的知識是一件極其困難的事情,而這也是通往強人工智能的必由之路。在眾多類型的人類知識中,事理邏輯是一種非常重要且普遍存在的知識。

幣安將于9月7日更新BTC零手續費交易活動:金色財經報道,幣安發布公告表示,將于2023年09月07日08:00(東八區時間)更新BTC零手續費交易活動。該計劃的BTC/TUSD現貨和杠桿交易對更新費率結構如下:BTC/TUSD現貨和杠桿交易對的吃單(Taker)手續費將根據用戶對應VIP等級費率收取。同時,用戶仍可以通過TUSD零掛單手續費活動享受BTC/TUSD現貨和杠桿交易對的零掛單手續費優惠。自2023年09月07日08:00(東八區時間)起,BTC/TUSD現貨和杠桿交易對的交易量將計入VIP等級計算和所有流動性做市商計劃統計中。此外,將恢復BTC/TUSD現貨和杠桿交易量的BNB折扣、推薦返利和任何其他手續費調整。[2023/8/24 10:40:06]

許多人工智能應用依賴于對事理邏輯知識的深刻理解。以隱式消費意圖識別以及隱式情感分析為例,只有讓機器知道“結婚”事件伴隨著后續一系列消費事件,例如“買房子”、“買汽車”和“去旅行”,我們才能在觀察到“結婚”事件的時候,準確地識別出用戶潛在的隱式消費意圖,進而向目標用戶做出精準的產品推薦。只有讓機器掌握“考試不及格”會引起“情緒低落”這樣的常識事理,才能從顯式事件當中挖掘出用戶背后的隱式情感。現有的對話生成系統大多從大規模對話語料中以最大似然估計進行訓練。然而人類對話的語義和語境是復雜多變的,這樣得到的對話系統很難深入理解對話上下文的前因后果,而只是對訓練語料中特定問答模式的記憶。只有讓機器理解了“吃過飯”之后“人不餓了”,“看電影”之前要“先買票”這樣的常識事理,對話系統才能根據不同的問答語境,做出更加智能的回復。股市一般伴隨著短期內隨機的小波動,以及長期內重大事件驅動的大波動。例如,近來隨著人工智能迎來發展高潮,以及“國家將人工智能列為國家發展戰略”,科大訊飛等人工智能企業股價迎來了一波大漲。事件驅動的股市預測悄然興起。從金融文本中挖掘“糧食減產”導致“農產品價格上漲”,再導致“通脹”,進而導致“股市下跌”這樣的遠距離事件依賴,對于事件驅動的股市漲跌預測非常有價值。事理邏輯知識的挖掘與知識庫構建迫在眉睫,這將極大地推動多項人工智能應用的發展。

Reddit Gen 3 Avatar鑄造量突破500萬枚,過去兩個月已增長4倍多:金色財經報道,據Dune Analytics最新數據顯示,Reddit Gen 3 Avatar鑄造量已突破500萬枚,本文撰寫時達到5,309,543枚,總銷售額約為3,320,218美元,此外該系列當前持有者地址數為37,849個,其中獨立地址數為20,744個。Reddit Gen 3 Avatar是社交網絡巨頭Reddit在Polygon區塊鏈上部署的“Reddit Avatar”第3代合約,于今年4月正式發行,歷史數據顯示該系列鑄造量于5月2日突破100萬枚,這意味著此指標數據過去兩個月增長了4倍多。[2023/7/1 22:12:32]

事件是人類社會的核心概念之一,人們的社會活動往往是事件驅動的。事件之間在時間上相繼發生的演化規律和模式是一種十分有價值的知識,挖掘這種事理邏輯知識對我們認識人類行為和社會發展變化規律非常有意義。然而,當前無論是知識圖譜還是語義網絡等知識庫的核心研究對象都不是事件。盡管傳統知識圖譜在現代搜索引擎中得到了廣泛應用,但是其聚焦于實體和實體之間的關系,缺乏對事理邏輯知識的挖掘。我們認為事理邏輯知識,包括事件之間的順承、因果、條件和上下位等關系,對于人工智能領域的多種任務具有非常巨大的價值。為了揭示事件的演化規律和發展模式,我們提出了事理圖譜的概念,旨在將事件的演化規律和模式構建成一個有向圖形式的事理知識庫,用于刻畫和記錄人類行為活動和事件客觀演化規律。

Orbiter Finance:官推并未被入侵,已暫停與BitKeep聯合舉辦的活動:6月24日消息,Layer2 跨 Rollup 橋 Orbiter Finance 發推稱,其 Twitter 賬戶是安全的,沒有被黑客攻擊,今天早些時候發布的活動是與 BitKeep 錢包官方團隊聯合舉辦的。但是為了防止該活動信息被冒用,現已暫時停止該活動。此外,Orbiter Finance 目前還沒有進行任何空投,請用戶警惕所有釣魚鏈接和虛假鏈接。

此前報道,據 CertiK 監測,Orbiter Finance 的 Twitter 賬戶被攻擊,并通過該賬戶發布一個釣魚網站。[2023/6/24 21:57:35]

2.事理圖譜的定義

事理圖譜是一個事理邏輯知識庫,描述了事件之間的演化規律和模式。結構上,事理圖譜是一個有向有環圖,其中節點代表事件,有向邊代表事件之間的順承、因果、條件和上下位等事理邏輯關系。

理論上,事理圖譜中的事件是具有一定抽象程度的泛化事件。表示為抽象、語義完備的謂詞短語或句子,也可以表示為可變長度的、結構化的(主體、事件詞、客體)多元組,其中必然包含一個事件詞,標志事件的發生,例如:“跑步”,而事件的主體和客體都可以在不同的應用場景下被省略,例如:“”可以省略事件的客體,“”可以省略事件的主體。一般情況下,事件以及事件的抽象程度與該事件發生的場景緊密關聯在一起,脫離了具體的場景,一個單獨的事件可能變得過度抽象而難以理解。

HTC全球副總裁:不認同元宇宙降溫,會持續投入:5月26日消息,在2023中關村論壇上,宏達電(HTC)全球副總裁黃昭穎在接受澎湃新聞獨家采訪時表示,不認同外界說的“元宇宙降溫”論調,HTC對元宇宙賽道非常樂觀,目前有很多項目在開展,未來將持續投入和開發新的相關應用。

此前去年6月消息,宏達電推出首款元宇宙手機,售價近1.2萬新臺幣。[2023/5/26 9:43:52]

例如,雖然脫離了具體的場景,但“吃火鍋”,“看電影”,“去機場”,“地震”仍是合理的事件表達;但“做事情”,“吃”等事件由于過度抽象,屬于不合理或不完整的事件表達。事件詞可以是動詞或名詞,但是絕大多數事件都是動詞觸發的。其中,按動詞的內容意義進行劃分,可將事件分為動作類事件、狀態類事件、關系類事件與能愿類事件四個大類。

2.1事理圖譜中的事件關系類型

我們認為,現實世界中有四種事理邏輯關系特別重要,也是我們提出的事理圖譜中主要關注的事理邏輯關系,包括事件之間的順承關系、因果關系、條件關系和上下位關系。

順承關系是指兩個事件在時間上相繼發生的偏序關系。我們借鑒TimeML時序關系類別中的before和after偏序關系,在事理圖譜中的順承關系包括兩種情況:一種情況是順承的前序事件a結束后,后序事件b緊接著發生;另一種情況是前序事件a結束后,隔一段時間后序事件b才會發生,具體如圖1所示。兩個前后順承的事件之間存在一個介于0到1之間的轉移概率,表示從一個事件按時序順承關系演化到下一事件的置信度。

比特幣全網未確認交易數量為14960筆:金色財經報道,據BTC.com數據顯示,目前比特幣全網未確認交易數量為14960筆,全網算力為294.45 EH/s,24小時交易速率為3.94交易/s,目前全網難度為43.05 T,預測下次難度下調0.5%至42.84 T,距離調整還剩10天22小時。[2023/3/1 12:34:56]

事理圖譜與傳統知識圖譜有本質上的不同。如表1所示,事理圖譜以事件為核心研究對象,有向邊表示事理邏輯關系,即順承、因果、條件和上下位;邊上標注有概率信息說明事理圖譜是一種事件間相繼發生可能性的刻畫,不是確定性關系。而知識圖譜以實體為核心研究對象,實體屬性以及實體間關系種類往往成千上萬。知識圖譜以客觀真實性為目標,某一條屬性或關系要么成立,要么不成立。

4.事理圖譜的構建

4.1基本技術原理

事理圖譜課題主要研究從大規模無結構化文本數據中自動獲取事理邏輯知識,并將這些知識組織成有向有環圖結構,用以描述事件之間的演化規律和模式。這樣的知識庫我們稱之為“事理圖譜”。

事理圖譜項目包含“構建”、“推理”和“應用”三個關鍵技術點:

(1)事理圖譜的構建

事理圖譜的構建主要用到以下具體的自然語言處理技術:事件定義、開放域或限定域事件抽取,事理關系抽取,事理關系置信強度計算,事件相似度計算,事件抽象與泛化等。

(2)事理圖譜的推理

事理圖譜的推理可以用于事件及關系的補全,主要涉及到的技術有:結構化事件表示學習,短語級、句子級事件表示學習,事理圖譜圖結構上的圖神經網絡技術等。

(3)事理圖譜的應用

事理圖譜的應用是指將構建好的事理圖譜用于下游任務,例如消費意圖識別和商品推薦、對話系統回復生成、股市漲跌預測、未來事件預測等,幫助提升具體任務的效果。此階段用到的技術主要有:事理圖譜的存儲與查詢,事件表示學習,事理圖譜表示學習等。

4.2主要技術領域及當前發展熱點

與事理圖譜項目密切相關的技術領域主要包含以下幾個方面:

(1)常識知識庫資源構建

傳統的常識知識庫資源構建主要圍繞實體及其關系展開。2012年谷歌成功將大規模知識圖譜商業化,顯著改善了搜索結果的呈現方式,并提升了搜索引擎的用戶體驗。之后以實體為中心的知識圖譜獲得了長足的發展以及廣泛的應用。時至今日,知識圖譜仍然是學術界的一個發展熱點。知識圖譜上的知識表示學習、實體鏈接、實體消歧、知識圖譜補全等等研究方向仍然是當下研究的熱點問題。

然而,已有研究者注意到事件常識的重要性,部分最新的研究工作開始研究以事件為中心的常識知識庫構建。

(2)統計腳本學習

給出多個事件組成的上文,統計腳本學習研究下一個可能發生的事件是什么,可以認為是建模事件預測的能力。

傳統方法多在無監督抽取的結構化事件鏈條上進行模型的搭建,這條技術路線仍然在發展當中,不斷有新的模型涌現;最近,學者們提出故事結尾預測的評估方式,是對傳統評估方法的進一步完善。

(3)事件順承關系抽取

由于語料標注的限制,事件時序關系抽取研究進展相當緩慢。雖然曾經連續舉辦多個技術評測,推動了該技術的發展,但是進步仍然十分有限。最近,時序關系抽取重新引起了學者的研究興趣,有許多相關研究發表。從預料的構建,識別方法的改進等多個方面繼續推動該研究走向使用階段。目前,已有開放域的時序關系抽取系統發布。

(4)事件因果關系抽取

文本中的因果關系抽取一直是一個難點。雖然學者們提出了許多方法,但是仍以因果模板匹配的方法抽取精確度最好。模板匹配的缺點在于召回率難以保證,許多有價值的因果關系無法召回。目前,高效準確的因果關系抽取方法仍然是一個難點及研究熱點。

(5)知識表示學習與網絡表示學習

知識表示學習是指將知識圖譜中的實體及關系映射到低維稠密向量,進而可以更加方便地用于后續任務當中。網絡表示學習的研究對象不僅僅包含知識圖譜這種網絡,而是更廣義上的網絡。這兩個研究方向都是當下研究的熱點問題,屬于事理圖譜應用階段的實用技術。

5.金融事理圖譜V2.0版本發布

2018年9月10日,HIT-SCIR正式對外發布金融事理圖譜V1.0版本,經過近10個月的潛心研發,HIT-SCIR推出金融事理圖譜V2.0版本,相對于V1.0版本,V2.0版本進行了如下的改進。

金融事理圖譜V2.0版本擴充了數據源,擴大了數據規模,增加了事件節點數量以及因果關系數量,同時增加了事件上下位關系以及抽象事件和抽象因果關系,采用基于BERT+CRF的方法將因果關系抽取的F值由原來的59.54%提升到了85.12%。

結束語

知識圖譜在各個領域精耕細作,逐漸顯露價值。知識表示形式有待突破,推理能力有待提高。統計腳本學習和事件關系識別等事理圖譜相關研究越來越吸引研究者關注。以“謂詞性短語”為節點,以事件演化為邊的事理圖譜方興未艾。事理圖譜必將在預測、對話等領域發揮重要作用,有力地提升人工智能系統的可解釋性。

詳細論文請參考:https://arxiv.org/pdf/1907.08015.pdf

Tags:人工智能SCICIR人工智能技術應用學人工智能后悔死了人工智能考研考哪些科目SCI幣SCI價格CIR價格CIR幣

Bitcoin
嘉楠耘智孔劍平:比特幣是數字世界之錨,2020年算力極限是增長一倍_比特幣:數字貨幣交易所官方網址

22日,幣印礦池在成都舉辦了2019新時代礦業峰會。嘉楠耘智聯席董事長孔劍平受邀參與開場分享。他講了一個笑話,甲乙丙三個人擠進電梯上到樓上,問他們怎么上來的,三人都有自己的說法,但沒有一個人說是.

1900/1/1 0:00:00
從JPM Coin到反洗錢 摩根大通的區塊鏈布局再下一城_區塊鏈:區塊鏈存證怎么弄

原標題:從JPMCoin到反洗錢摩根大通的區塊鏈布局再下一城來源:金色財經近日,摩根大通執行董事DaizaburoSanai表示.

1900/1/1 0:00:00
企業知識圖的四個戰略差異_Graph:Graph幣是什么幣人工智能技術應用

憑借其無限大小,企業知識圖包含組織的所有數據–結構化,非結構化,內部或外部–呈現為數萬億個相互關聯的事實,可根據需要以任意組合形式提供給已批準的用戶.

1900/1/1 0:00:00
日本那些你必須知道的常識_阿童木:富士山

因為日語相對英語的簡單易學,學習周期短,日語能參加高考外語考試等特點。每年通過日語參加高考的高考生越來越多。每年高考日語的題干中都存在不少日本常識題.

1900/1/1 0:00:00
12月火線幣商城再添新品,拿下這把極具圣誕特色的鷹爪難道不香嗎_FER:FERA

哈嘍,大家好,歡迎來到皇說游戲!現在已經進入12月份,2019年的最后一個月了,離2020更加進了一步.

1900/1/1 0:00:00
山寨幣流血不止,比特幣獨享牛市,我們該如何理性投資?_Huobi:數字貨幣交易所官方網址

為什么? 為了方便,我們就拿火幣的HT舉例——最近這個幣種的市值挺進了Coinmarketcap市值前十,可以說是平臺幣中最具代表性的幣種之一了.

1900/1/1 0:00:00
ads