加密貨幣交易所 加密貨幣交易所
Ctrl+D 加密貨幣交易所
ads

Stable Diffusion 團隊放大招!新繪畫模型直出 AI 海報,像素級生成_STA:DEEPSPACE

Author:

Time:1900/1/1 0:00:00

來源:量子位

開源AI繪畫扛把子,StableDiffusion背后公司StabilityAI再放大招!

全新開源模型DeepFloydIF,一下獲星2千+并登上GitHub熱門榜。

DeepFloydIF不光圖像質量是照片級的,還解決了文生圖的兩大難題:

準確繪制文字。

以及準確理解空間關系。

Starknet Alpha v0.11.0已上線主網:3月30日消息,Starknet 官方宣布,Starknet Alpha v0.11.0 已上線主網。[2023/3/30 13:36:02]

網友表示,這可是個大事,之前想讓Midjourneyv5在霓虹燈招牌上寫個字AI都是瞎劃拉兩筆,對于鏡子理解的也不對。

使用DeepFloydIF,可以把指定文字巧妙放置在畫面中任何地方。

Alchemy 宣布支持以太坊擴容方案 StarkNet:3月8日消息,Alchemy 和 StarkWare宣布達成戰略合作伙伴關系,Alchemy將支持以太坊擴容方案 StarkNet。通過此次合作,StarkNet 預計將有更多的開發人員能夠使用 Alchemy 的全套專有平臺基礎設施技術開始在鏈上進行構建,而S??tarkNet 為用戶提供了更高的吞吐量和比 1 層低 100 倍的 gas 費用。[2022/3/8 13:43:43]

霓虹燈招牌、街頭涂鴉、服飾、手繪插畫,文字都會以合適的字體、風格、排版出現在合理的地方。

這意味著,AI直出商品渲染圖、海報等實用工作流程又打通一環。

波卡生態多鏈智能合約平臺 ParaState 完成 500 萬美元戰略融資:4月9日消息,波卡生態多鏈智能合約平臺 ParaState 宣布完成由 KNS Group 領投的 500 萬美元戰略融資,參投方包括 Alameda Research、Signum Capital、HyperChain Capital、BiXin Ventures、Genesis Block Ventures、Inclusion Capital、Gate.io Labs、ZMT Capital、Polkastarter、DAO Maker、DuckDAO、Moonwhale Ventures、Chronos Ventures、Master Ventures、Lotus Capital、Momentum6、Taureon、GenBlock Capital、DDC、Blocksync Ventures、GFS Ventures、Gainz Associates、Titans Ventures、4SV、WWG、1Cap、PAKA、Exstvc 和 AKG Ventures。

CMS Holdings 和 SevenX Ventures 等種子輪投資者繼續跟投。[2021/4/9 20:03:11]

還在視頻特效上開辟了新方向。

金色財經現場報道 Blockstack推出全球首個dapp商店:金色財經現場報道,今日在Coindesk 2018共識會議上,Blockstack聯合創始人Ryan Shea表示希望創建一個分散的網絡(互聯網3.0)。Blockstack聯合創始人Ryan Shea宣布推出全世界第一個dapp商店——App.co。[2018/5/16]

目前DeepFloydIF以非商用許可開源,不過團隊解釋這是暫時的,獲得足夠的用戶反饋后將轉向更寬松的協議。

比特幣在Bitstamp跌破9000美元大關:目前在Bitstamp平臺,比特幣在2017年11月26日后首次跌破9000美元關口。目前比特幣價格已跌至8880美元,跌幅高達12.50%。[2018/2/2]

有需求的小伙伴可以抓緊反饋起來了。

像素級圖像生成

DeepFloydIF仍然基于擴散模型,但與之前的StableDiffusion相比有兩大不同。

負責理解文字的部分從OpenAI的CLIP換成了谷歌T5-XXL,結合超分辨率模塊中額外的注意力層,獲得更準確的文本理解。

負責生成圖像的部分從潛擴散模型換成了像素級擴散模型。

也就是擴散過程不再作用于表示圖像編碼的潛空間,而是直接作用于像素。

官方還提供了一組DeepFloydIF與其他AI繪畫模型的直觀對比。

可以看出,使用T5做文本理解的谷歌Parti和英偉達eDiff-1也都可以準確繪制文字,AI不會寫字這事就是CLIP的鍋。

不過英偉達eDiff-1不開源,谷歌的幾個模型更是連個Demo都不給,DeepFloydIF就成了更實際的選擇。

具體生成圖像上DeepFloydIF與之前模型一致,語言模型理解文本后先生成64×64分辨率的小圖,再經過不同層次的擴散模型和超分辨率模型放大。

在這種架構上,通過把指定圖像縮小回64×64再使用新的提示詞重新執行擴散,也實現以圖生圖并調整風格、內容和細節。

并且不需要對模型做微調就可直接實現。

另外,DeepFloydIF的優勢還在于,IF-4.3B基礎模型是目前擴散模型中U-Net部分有效參數是最多的。

在實驗中,IF-4.3B取得了最好的FID分數,并達到SOTA。

誰是DeepFloyd

DeepFloydAIResearch是StabilityAI旗下的獨立研發團隊,深受搖滾樂隊平克弗洛伊德影響,自稱為一只“研發樂隊”。

主要成員只有4人,從姓氏來看均為東歐背景。

這次除了開源代碼外,團隊在HuggingFace上還提供了DeepFloydIF模型的在線試玩。

我們也試了試,很可惜的是目前對中文還不太支持。

原因可能是其訓練數據集LAION-A里面中文內容不多,不過既然開源了,相信在中文數據集上訓練好的變體也不會太晚出現。

OneMoreThing

DeepFloydIF并不是StabilityAI昨晚在開源上的唯一動作

語言模型方面,他們也推出了首個開源并引入RLHF技術的聊天機器人StableVicuna,基于小羊駝Vicuna-13B模型實現。

目前代碼和模型權重已開放下載。

完整的桌面和移動界面也即將發布。

DeepfloydIF在線試玩:

https://huggingface.co/spaces/DeepFloyd/IF

代碼:

https://github.com/deep-floyd/IF

StableVicuna在線試玩:

https://huggingface.co/spaces/CarperAI/StableVicuna

權重下載:

https://huggingface.co/CarperAI/stable-vicuna-13b-delta

參考鏈接:

https://deepfloyd.ai/deepfloyd-if

https://stability.ai/blog/deepfloyd-if-text-to-image-model

https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

https://stable-diffusion-art.com/how-stable-diffusion-work/

Tags:STADEEPFLOPFLbitstamp行情DEEPSPACEREDFLOKI幣PFL價格

以太坊交易所
100:87:GPT-4心智碾壓人類!三大GPT-3.5變種難敵

文章來源:新智元 編輯:Aeneas好困 最新研究結果表明,AI在心智理論測試中的表現已經優于真人。GPT-4在推理基準測試中準確率可高達100%,而人類僅為87%.

1900/1/1 0:00:00
深度解讀NFT MEV:NFT交易中的新機遇_NFT:MEV

原文來源:AlanaLevin,?VariantFund原文編譯:Cecilia,?bfrenzDAO MEV,即最大可提取價值,指的是通過重新排序、插入和審查區塊內的交易.

1900/1/1 0:00:00
金色觀察 | Pantera Capital合伙人:全面解析ZK Rollups和Optimistic Rollups_ROL:PARK

作者:PaulVeradittakit,PanteraCapital合伙人;翻譯:金色財經0xnaitive 引言 加密技術的進步讓Polkadot和Solana等公鏈的TPS可以達到數千.

1900/1/1 0:00:00
元宇宙“下行”和“上行”都在加速 可編程社會加速到來_元宇宙:人工智能

AIGC不僅會改變數字世界,也很可能會快速影響現實世界,這一現象,我們可以稱之為“元宇宙下行”.

1900/1/1 0:00:00
PEPE暴漲,誰將成為下一個meme王者?_PEPE:PEPECEO價格

原文作者:Flowie、餅干,ChainCatcherPEPE上幣安了。幣安宣布將在創新區上線Pepe,并將在北京時間今晚24?:?00開放PEPE/USDT、PEPE/TUSD交易對.

1900/1/1 0:00:00
萬字拆解Yuga Labs:從零到 “Web3迪士尼” 只用了兩年_NFT:LABS價格

YugaLabs成功的關鍵在于它堅定不移地致力于為社區提供價值,始終如一地執行精心策劃的戰略和兌現為社區許下的承諾.

1900/1/1 0:00:00
ads