機器之心報道
編輯:陳萍
一種新的集成視覺和檢測Transformer的目標檢測器ViDT。
Transformer在NLP任務中取得不錯的發展,許多研究將其引入到計算機視覺任務中。毫不夸張的說,Transformer正在改變計算機視覺的格局,尤其是在識別任務方面。例如Detectiontransformer是第一個用于目標檢測的、端到端的學習系統,而visiontransformer是第一個完全基于transformer的圖像分類架構。在本文中,一篇被ICLR2022接收的匿名論文集成了視覺和檢測Transformer(VisionandDetectionTransformer,ViDT)來構建有效且高效的目標檢測器。
ViDT引入了一個重新配置的注意力模塊,將SwinTransformer擴展為一個獨立的目標檢測器,之后是一個計算高效的Transformer解碼器,該解碼器利用多尺度特征和輔助技術,在不增加計算負載的情況下提高檢測性能。
Yield Protocol:已從 Euler Finance 遭攻擊影響中完全恢復:6月27日消息,固定利率借貸協議 Yield Protocol 宣布已從 Euler Finance 遭攻擊影響中完全恢復。3 月中旬,Euler Finance 遭到黑客攻擊,損失金額近 2 億美元,之后攻擊者歸還全部盜取資金。由于 Yield 的流動性提供者系統中的一些資金存放在 Euler 中,因此也受到了影響。[2023/6/28 22:04:12]
在MicrosoftCOCO基準數據集上的評估表明,ViDT在現有的完全基于transformer的目標檢測器中獲得了最佳的AP和延遲權衡,其對大型模型的高可擴展性,可達49.2AP。
論文地址:https://openreview.net/pdf?id=w4cXZDDib1H
Modular Capital合伙人:L2完全超過ETH只是時間問題:金色財經報道,Modular Capital合伙人James Ho在社交媒體上稱,Arbitrum的年收入在1億美元以上,目前的凈利潤率為30-40%,在eip-4844/proto-danksharding之后,利潤率將擴大到90-95%。從這個角度看,ETH的年化費用是30-50億美元,Layer 2市場正朝著令人難以置信的盈利方向發展。Optimism也類似,年化費用約為 6000 萬美元(大約是ARB運行率的一半)但目前的兩條鏈都是單序列器,既沒有 OP/ARB 代幣用于支付 gas,也沒有明確的效用。
Arbitrum已經做到了ETH主網現貨dex量的一半(160億美元/月對320億美元)。每天的txns/活躍錢包都是一樣的,在經濟活動中,L2完全超過ETH只是時間問題,單個L2的費用超過10億美元,比許多人想象的要快。[2023/5/8 14:49:08]
ViDT:視覺與檢測Transformer
CZ:已準備好在12-18個月內對業務進行調整,以使其完全合規:金色財經報道,Binance創始人CZ在社交媒體上稱,歐洲議會投票支持實施 MiCA,這意味著世界上最大的市場之一正在引入量身定制的加密法規,以保護用戶和支持創新。細節很重要,但總的來說,我們認為這是對我們共同面臨的挑戰的務實解決方案。對于在歐盟運營的加密貨幣交易所,現在有明確的游戲規則。我們已準備好在未來 12-18 個月內對我們的業務進行調整,以使其完全合規。[2023/4/20 14:16:39]
ViDT架構如下圖2(c)所示:
首先,ViDT引入了一種改進的注意力機制,名為ReconfiguredAttentionModule(RAM),該模塊有助于ViT變體處理附加的和token以進行目標檢測。因此,ViDT可以將最新的帶有RAM的SwinTransformer主干修改為目標檢測器,并利用其具有線性復雜度的局部注意力機制獲得高可擴展性;
Uniswap創始人:Uniswap v2被v3完全取代:Uniswap創始人Hayden Adams表示,Uniswap v2被v3完全取代。Uniswap v3是與以太坊L1和L2上其它所有AMMs競爭。[2021/3/24 19:12:53]
其次,ViDT采用輕量級的無編碼器neck架構來減少計算開銷,同時仍然在neck模塊上啟用額外的優化技術。請注意,neck編碼器是不必要的,因為RAM直接提取用于目標檢測的細粒度表示,即token。結果,ViDT獲得了比neck-free對應物更好的性能;
最后,該研究引入了用于知識蒸餾的token匹配新概念,它可以在不影響檢測效率的情況下從大型模型到小型模型帶來額外的性能提升。
RAM模塊
該研究引入了RAM模塊,它將與和token相關的單個全局注意力分解為三個不同的注意力,即×、×和×注意力。如圖3所示,通過共享和token的投影層,全部復用SwinTransformer的所有參數,并執行三種不同的注意力操作:
犯罪分子偏愛使用比特幣 隱私幣功能未被完全利用:使用加密貨幣進行犯罪活動的人往往要面臨兩個選擇,要么選擇門羅幣這樣的加密貨幣以增強私密性,要么選擇比特幣來增加便利性、可用性和流動性。隨著交易所根據法規將門羅幣這樣的幣種從交易所清除,比特幣經常會獲勝。而人們并沒有完全利用加密貨幣的隱私功能,ZEC上只有14%的交易受部分保護,6%的交易被完全保護。(Ambcrypto)[2020/7/19]
ENCODER-FREEneck結構
為了利用多尺度特征圖,ViDT結合了多層可變形transformer解碼器。在DETR家族中,其neck部分需要一個transformer編碼器,用于將從骨干中提取的用于圖像分類的特征轉換為適合目標檢測的特征;編碼器通常在計算上很昂貴,因為它涉及×注意力。然而,ViDT只保留了一個Transformer解碼器作為其neck,因為帶有RAM的SwinTransformer直接提取適合目標檢測的細粒度特征作為獨立的目標檢測器。因此,ViDT的neck結構在計算上是高效的。
解碼器從帶有RAM的SwinTransformer接收兩個輸入:從每個階段生成的token從最后階段生成的token,如圖2(c)的Neck所示。在每個可變形的transformer層中,首先執行×注意力。對于每個token,應用多尺度可變形注意力以生成一個新的token,聚合從多尺度特征圖
中采樣的一小組關鍵內容:
用于目標檢測的token匹配知識蒸餾
雖然大型模型具有實現高性能的高容量,但在實際使用中它的計算成本可能很高。因此,該研究還提出了一種簡單的知識蒸餾方法,可以通過token匹配從大型ViDT模型中遷移知識。
匹配每一層的所有token在訓練中非常低效,因此,該研究只匹配對預測貢獻最大的token。兩組token直接相關:P:用作多尺度特征圖的token集合,由body中的每個階段生成,D:token的集合,它們是從neck的每個解碼層生成的。因此,基于token匹配的蒸餾損失公式為:
評估
表2將ViDT與DETR(ViT)和YOLOS的AP、FPS等進行了比較,其中DETR(ViT)有兩個變體:DETR和DeformableDETR。
實驗結果表明:ViDT實現了AP和FPS之間的最佳權衡。憑借其高可擴展性,其性能優于1億個參數的Swin-base,在相似的AP的下,FPS比DeformableDETR快2倍。此外,ViDT參數為16M,得到40.4AP,比DETR(swin-nano)和DETR(swin-tiny)高分別高6.3AP、12.6AP。
表3對比了不同空間位置編碼與ViDT的結果。結果表明:pre-addition比post-addition帶來的性能提升更高,即sinusoidalencoding優于learnable編碼;因此,正弦空間編碼的2D歸納偏置在目標檢測中更有幫助。特別是,與不使用任何編碼相比,使用正弦編碼的預加法將AP增加了5.0。
表4總結了使用不同選擇策略進行交叉注意力時的AP和FPS,其中SwinTransformer總共包含四個階段。有趣的是,只要在最后階段激活交叉注意力,所有策略都表現出相似的AP。由于在各個階段中以自下而上的方式提取特征,因此在低級別階段很難直接獲得有關目標對象的有用信息。因此,研究者想要獲得較高的AP和FPS,只使用最后階段是最好的設計選擇,因為token的數量最少。
為了徹底驗證輔助解碼損失和迭代框細化的有效性,該研究甚至對YOLOS等neck-free檢測器進行了擴展。表5顯示了兩種neck-free檢測器YOLOS和ViDT(w.o.Neck)性能。實驗結果證明在ViDT中使用Neck解碼器來提高目標檢測性能是合理的。
下圖表明:教師模型的規模越大,學生模型的收益越大。從系數來看,系數值越大,性能越好。模型蒸餾將AP提高了1.0-1.7,而不會影響學生模型的推理速度。
研究者將所有提議的組件結合起來,以實現目標檢測的高精度和速度。如表8所示,有四個組件:(1)RAM將SwinTransformer擴展為獨立的目標檢測器,(2)neck解碼器利用多尺度特征和兩種輔助技術,(3)從大模型中獲益知識蒸餾,(4)解碼層drop進一步加快推理速度。結果表明:當使用Swin-nano作為其主干時,它僅使用13M參數就達到了41.7AP和合理的FPS。此外,當使用Swin-tiny時,它僅損失了2.7FPS而表現出46.4AP。
河南省濮陽市2022屆高三年級2月摸底考試 語文 考生注意: 1.答題前,考生務必將自己的姓名、考生號填寫在試卷和答題卡上,并將考生號條形碼粘貼在答題卡上的指定位置.
1900/1/1 0:00:00應土耳其總統埃爾多安邀請,阿聯酋阿布扎比王儲穆罕默德24日對土耳其進行了正式訪問。這是穆罕默德王儲自2012年以來首次對土耳其進行正式訪問,也是阿聯酋與土耳其近年來首次高層會晤.
1900/1/1 0:00:00明天就是一月學考了 最后關頭還能怎么提分? 這些蒙題技巧用起來! 溫馨提示:本文只適用于山窮水盡的同學.
1900/1/1 0:00:00來源:媒體滾動 00:32 來源:藍鯨財經 原標題:幣安趙長鵬以近6千億資產登彭博富豪榜,榜單第12名信息曾一度不顯示,目前點對點法幣交易區仍有人民幣兌換服務 1月14日.
1900/1/1 0:00:00在剛剛過去的2021年,“元宇宙”的火熱有目共睹。被資本盯上后,元宇宙賽道更是擠滿了嗅覺敏銳的各行業頭部玩家。元宇宙火出新高度后,唱衰的聲音也隨之而來.
1900/1/1 0:00:00科技圈頂流馬斯克,想退休了?這源于他最新的一則動態——12月10日晚,馬斯克在社交媒體上表示,“我正在考慮辭去我的工作,全職做一個意見領袖(influencer).
1900/1/1 0:00:00