加密貨幣交易所 加密貨幣交易所
Ctrl+D 加密貨幣交易所
ads
首頁 > 酷幣 > Info

OpenAI發布炸裂研究:讓AI解釋AI黑箱,人類無法理解,語言無法描述_OPEN:NAI

Author:

Time:1900/1/1 0:00:00

來源:FounderPark

就算在新產品滿天飛,商業文明正在被AI重建的當下,我們仍然不知道,這些令人驚嘆的技術是如何運作的。

AI,語言模型,它是個黑箱,人類無法理解,我們甚至不知道怎樣研究才能夠理解。

但如果,研究這個黑箱的不是人類,而是AI自己呢?

這是一個令人好奇但又非常危險的想法。因為你甚至不知道,這一研究方法產生的結果,是否會徹底顛覆多年來人類對人腦和AI的理解。

但是有人這樣做了。幾小時前,OpenAI發布了最新的研究成果,他們用GPT-4解釋GPT-2的行為,獲得了初步的成果。

毫不夸張地說,人們震驚極了:「求求你們讓它離覺醒遠點吧!」

「AI理解AI,然后很快,AI訓練AI,然后再過幾年,AI創造新的AI。」

但客觀來說,學術界為之感到興奮:「瘋了,OpenAI剛剛搞定了可解釋性問題。」

人與機器之間是GPT-4

OpenAI剛剛在官網發布博客文章《語言模型可以解釋語言模型中的神經元》。

微軟正向ChatGPT創建者OpenAI投資100億美元進行洽談:1月10日消息,知情人士表示,微軟一直在就向AI聊天機器人ChatGPT的創建者OpenAI投資100億美元進行談判。知情人士稱,此次融資還將包括其他風投公司。包括新投資在內,OpenAI的估值將達到290億美元。

目前尚不清楚該交易是否已經敲定,但最近幾周發給潛在投資者的文件顯示,該交易的目標是在2022年底前完成。若達到這一門檻,微軟將持有OpenAI 49%的股份,其他股東持有另外49%,OpenAI的非營利母公司持有2%。(Semafor)[2023/1/10 11:04:01]

簡單來說,他們開發了一個工具,調用GPT-4來計算出其他架構更簡單的語言模型上神經元的行為,這次針對的是GPT-2,發布于4年前的開源大模型。

大模型和人腦一樣,由「神經元」組成,這些神經元會觀察文本中的特定規律,進而影響到模型本身生產的文本。

舉例來說,如果有一個針對「漫威超級英雄」的神經元,當用戶向模型提問「哪個超級英雄的能力最強」時,這個神經元就會提高模型在回答中說出漫威英雄的概率。

持有OpenDAO原生代幣SOS的地址數已突破21萬:金色財經報道,據Etherscan數據,持有OpenDAO原生TokenSOS的地址數已突破21萬。

此前報道,12月24日,NFT社區OpenDAO宣布向全體OpenSea交易用戶發起SOS空投活動,此前在OpenSea進行過交易的用戶都可領取。SOS總供應量為100萬億枚,其中50%將用于向OpenSea用戶進行空投,20%用于質押獎勵,20%將用于OpenDAO組織的維護,10%將用于流動性挖礦獎勵。[2021/12/29 8:12:25]

OpenAI開發的工具利用這種規則制定了一套評估流程。

開始之前,先讓GPT-2運行文本序列,等待某個特定神經元被頻繁「激活」的情況。

然后有三個評估步驟:

第一步,讓GPT-4針對這段文本,生成解釋。比如在下面的案例中,神經元主要針對漫威內容。GPT-4接收到文本和激活情況后,判斷這與電影、角色和娛樂有關。

NFT市場OpenSea總交易額擊穿30億美元,創下歷史新高:8月26日消息,據最新數據顯示,NFT市場OpenSea總交易額已擊穿30億美元,創下歷史新高,本文撰寫時為30.18億美元,位列NFT市場交易額排名第一位。排在第二名位置的是Axie Infinity,當前交易額達到16.19億美元;第三名是CryptoPunks,交易額為8.94億美元。此前OpenSea單日交易額曾達到2.09億美元,一度創下單日交易額新高。[2021/8/26 22:37:53]

第二步,用GPT-4模擬這個GPT-2的神經元接下來會做什么。下圖就是GPT-4生成的模擬內容。

最后一步,對比評估打分。對比4代模擬神經元和2代真實神經元的結果,看GPT-4猜的有多準。

幣高CtopEX交易所榮獲加拿大MSB合規牌照:據官方消息,幣高CtopEX交易所宣布榮獲加拿大MSB合規牌照,該牌照是由FINTRAC (加拿大金融交易和報告分析中心)監管并頒發,允許幣高CtopEX交易所在加拿大境內合規開展加密資產相關服務。幣高CtopEX始終將合規作為企業發展的重要方針,該牌照的取得成為幣高規范化運營與全球化布局的又一重要里程碑。幣高CtopEX在獲得美國MSB金融牌照、加拿大MSB金融牌照的基礎上將在全球持續推進合規布局,擁抱監管。[2021/6/11 23:31:04]

通過這樣的方法,OpenAI對每個神經元的行為作出了初步的自然語言解釋,并對這種解釋和實際行為的匹配程度進行了評分。

最終他們對GPT-2中307200個神經元全部進行了解釋,這些解釋匯編成數據集,與工具代碼一起在GitHub上發布。

超越語言的機器,人類無法理解的機器

據OpenAI在博客文章中表示,目前GPT-4生成的解釋還不完美,尤其要解釋比GPT-2更大的模型時,表現效果很差,「可能是因為后面的layer更難解釋」。

ETC Labs將為Filecoin Lotus提供OpenRPC支持:金色財經報道,據官方博客消息,ETC Labs正在與Filecoin合作,將首次使用OpenRPC在Filecoin Lotus API上為開發人員提供一個現代化的接口。據悉,OpenRPC是ETC Labs的開源項目,為JSON-RPC 2.0 API定義了一個標準編程與語言無關的接口描述。與Filecoin Lotus的集成將為開發人員提供適當的文檔,并使其能夠以最小占用空間支持自動類型的安全客戶端生成和文檔編制。[2020/9/17]

對于GPT-2解釋的評分大多也非常低,僅有1000個左右的解釋獲得了較高的評分。

OpenAI可拓展對齊團隊的JeffWu表示,「大多數解釋的得分很低,或者無法解釋實際神經元那么多的行為。比如,許多神經元以一種難以判斷的方式保持活躍,它們在五六件事上保持激活,但卻沒有可以辨別的模式。有時候存在明顯的模式,但GPT-4有無法找到它。」

雖然現階段成績不好,但是OpenAI卻比較有信心,他們認為可以使用機器學習的方式提高GPT-4產出解釋的能力。

比如通過反復產出解釋,并根據激活情況修改解釋;或者使用更大的模型作出解釋;以及調整解釋模型的結構等等。

OpenAI還提到,這一方法目前還有很多局限性。

使用簡短的自然語言進行解釋,也許并不匹配神經元可能非常復雜的行為,不能簡潔地進行描述。神經元可能會具備多個不同概念,也可能,會具備一個人類沒有語言描述甚至無法理解的概念。

最終OpenAI希望能夠自動化找到并解釋能夠實現復雜行為的整個神經回路,而目前的方法只解釋了神經元的行為,并沒有涉及下游影響。

解釋了神經元的行為,但沒有解釋產生這種行為的機制。這意味著即使是拿了高分的解釋,也只能描述相關性。

整個過程是計算密集型的。

在論文中,OpenAI表示:「語言模型可能代表了人類無法用語言表達的陌生概念。這可能是因為語言模型關心不同的事情,比如統計結構對下一個token預測任務有用,或者因為模型已經發現了人類尚未發現的自然的抽象,例如在不同領域的類似概念家族。」

它把LLM的這種屬性,稱為AlienFeature,在生物領域翻譯為「異類特征」。

FounderPark微信后臺回復「解釋神經元論文」,獲取論文鏈接和中英對照PDF鏈接。

把對齊問題也交給AI

「我們正試圖開發預測『AI系統會出現什么問題』的方法,」OpenAI可解釋性團隊負責人WilliamSaunders對媒體說,「我們希望能夠真正做到,讓這些模型的行為和生產的回答是可以被信任的。」

SamAltman也轉發博客文章稱:GPT-4對GPT-2做了一些可解釋性工作。

可解釋性是機器學習的研究子領域,指的是對模型的行為有清晰的理解和對模型結果的理解能力。

簡單來說,目的就是解釋機器學習模型「如何做到」。

2019年開始,可解釋性成為機器學習的重要領域,相關研究有助于開發人員對模型進行優化和調整。針對當下AI模型大規模應用時,亟需解決的可信度、安全性和決策參考等問題。

如果我們不知道AI是如何作出決策的,始終把它當做一個黑箱,那么就算AI在各種場景下表現得再完美,也無法解決部分人類的信任問題。

OpenAI這次使用GPT-4來解決可解釋性的問題,就是希望能夠使用自動化的方式,讓機器完成AI研究。

「這是我們對齊研究的第三支柱的一部分:我們希望自動化對齊研究。令人期待的是,這一方向能讓它與AI發展的步伐相匹配。」

在2022年夏天,OpenAI曾發布文章《我們做對齊研究的方法》。

文中提到,宏觀來看,OpenAI的對齊研究將由三大支柱支撐:

1、利用人工反饋訓練AI

2、訓練AI系統協助人類評估

3、訓練AI系統進行對齊研究

「語言模型非常適合自動化對齊研究,因為它們通過閱讀互聯網『預裝』了大量有關人類價值觀的知識和信息。開箱即用,它們不是獨立代理,因此不會在世界上追求自己的目標。」

太快了,連認知都范式革命了

雖然OpenAI本意很好,但是這樣的研究成果著實嚇壞了網友。

OpenAI的推文下梗圖橫飛,有不少人在認真地建議OpenAI搞慢點。

「用我們不理解的東西,解釋另一個我們不理解的東西,這合理嗎?」

「護欄都被你撤了」

「這太迷人了,但也讓我感到極度不適。」

「自然創造了人類來理解自然。我們創造了GPT-4來理解自己。」

「我們要怎么判斷解釋者是好的?這就像...誰監督著監督者?」(whowatchesthewatchers)

還有人看到了更深的一層:

「大模型很快就能比人類更好地解釋他們自己的思維過程,我想知道我們未來要創造多少新的詞匯,來描述那些AI發現的概念?我們還沒有一個合適的詞描述它們。或者,我們是否會覺得這些概念有意義?它們又能教會我們如何認識自己呢?」

另一網友回應道:「人類本身對自己行為的解釋,大多是謊言、捏造、幻覺、錯誤的記憶、事后推理,就像AI一樣。」

Tags:OPENPENGPTNAIOpen CampusOpen PlatformGPT4AIIMGNAI幣

酷幣
日本東京 TEAMZ Web3 Summit大會議程全部確定,峰會參與者同時有機會贏取價值100萬日元比特幣的抽獎活動_WEB3:MAMZN

TEAMZWeb3Summit將于5月17日18日舉行,為期兩天的議程和會場LayOut已經揭曉。?與此同時到場參與峰會的參加者可以有機會參與總價值100萬日元的BTC抽獎活動.

1900/1/1 0:00:00
暴跌并未如期而至,比特幣本輪漲勢持續時間已超過往峰值_比特幣:FOIN

本文來源:環球外匯網 在2017年一度逼近20000美元之后,比特幣的價格在2020年尾聲終于又升破了這一關口.

1900/1/1 0:00:00
Bitget Research每周要聞:Meme板塊集體回調,Bitget獨家發布首個BRC20 Launchpad項目BIP1_BIT:KCC MemePad

過去一周,市場出現了不少新的熱門幣種和話題。1.市場焦點MarketTrends本周(?05.08-05.12)市場最關注的焦點話題為:Milady?開始回調,BRC?20?市場延續下跌CPI?.

1900/1/1 0:00:00
zkEVM VS zkVM:一字之差 天壤之別_ISC:Protogonos

作者:RISCZero高級工程師ErikKaneda;編譯:Maxlion 前言 本文將對比zkEVM和zkVM在技術上的差異,并介紹RISCZerozkVM及其即將推出的Bonsai網絡.

1900/1/1 0:00:00
一文了解ZKWasm及其最新進展_ASM:web3.0幣種

原文作者:LouisSong原文編譯:GWEIResearchWebAssembly是一種廣泛采用的虛擬機,它徹底改變了Web開發.

1900/1/1 0:00:00
2021NFT生態研究報告:拉開加密世界多樣化進程帷幕_比特幣:The Last McAfee Token

中國人民銀行決定于2023年3月27日下調金融機構存款準備金率:金色財經報道,中國人民銀行決定于2023年3月27日降低金融機構存款準備金率0.25個百分點(不含已執行5%存款準備金率的金融機構.

1900/1/1 0:00:00
ads