ICRL 2020 會議日程解讀

因疫情影響,The International Conference on Learning Representations(ICLR 2020)遺憾地成為首個線上虛擬學術頂會,而所有被接受的論文都要預先錄製展示視頻。雖然少了與大佬們當面交流的機會,但在家就能坐聽大咖開講也是種不錯的選擇。


ICRL 2020 會議日程解讀


ICLR 2020 共收到了 2594 篇論文投稿,最終共有 687 篇被接收,其中 48 篇 orals、108 篇 spotlights、531 篇 poster;錄取率為 26.5%,相比去年的 31.4% 略有降低。


4 月 27 日,展示 172 篇論文(涵蓋元學習、對抗網絡、多智能體學習、聯邦學習、深度強化學習等主題),包括 14 篇 Oral、32 篇 Spotlight、126 篇 Poster。其中,德克薩斯大學團隊發表的 Meta-Q-Learning,介紹了一種新的元-Q 學習(Meta-Q-Learning,MQL)算法,這是一種新的用於元強化學習的離線策略算法。元-Q 學習借鑑了傾向性估計的思想,從而擴充了用於自適應的可用數據量。在標準連續控制基準上的實驗表明,與最新的元強化學習算法相比,元-Q 學習更具有優勢。


4 月 28 日,展示 170 篇論文(涵蓋強化學習、計算神經科學、貝葉斯元學習、可解釋深度學習、自動編碼機等主題),包括 10 篇 Oral、23 篇 Spotlight、137 篇 Poster。其中,谷歌團隊發表的 SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference,提出了一個能夠擴展到數千臺機器的強化學習架構——SEED RL(Scalable and Efficient Deep-RL,即可擴展且高效的深度強化學習),同時該架構還能夠以每秒數百萬幀的速度進行訓練,計算效率顯著提高。


ICRL 2020 會議日程解讀


4 月 29 日,展示 164 篇論文(涵蓋深度批主動學習、Transformer、時序推理、強化學習、過完備學習、神經網絡模型優化等主題),包括 12 篇 Oral 、26 篇 Spotlight、126 篇 Poster。其中,華為諾亞實驗室發表的 Causal Discovery with Reinforcement Learning 獲得滿分評價。該論文將強化學習應用到打分法的因果發現算法中,通過基於自注意力機制的 encoder-decoder 神經網絡模型探索數據之間的關係,結合因果結構的條件,並使用策略梯度的強化學習算法對神經網絡參數進行訓練,最終得到因果圖結構。該方法在中等規模的圖上的表現優於其他方法,包括傳統的因果發現算法和近期的基於梯度的算法。同時該方法非常靈活,可以和任意的打分函數結合使用。


4 月 30 日,展示 177 篇論文(涵蓋圖神經網絡、神經機器翻譯、圖嵌入表示、問答系統、超網絡優化、強化學習、聯合學習、自然語言生成、神經網絡剪枝等主題),包括 12 篇 Oral、26 篇 Spotlight、139 篇 Poster。其中,南京大學團隊發表的 Mirror-Generative Neural Machine Translation 獲得滿分評價。該論文提出一種鏡像生成式機器翻譯模型:MGNMT(mirror-generative NMT)。MGNMT 是一個統一的框架,同時集成了 source-target 和 target-source 的翻譯模型及其各自語種的語言模型。MGNMT 中的翻譯模型和語言模型共享隱語義空間,所以能夠從非平行語料中更有效地學習兩個方向上的翻譯。此外,翻譯模型和語言模型還能夠聯合協作解碼,提升翻譯質量。實驗表明本文方法確實有效,MGNMT 在各種場景和語言(包括 resource rich 和 low-resource 語言)中始終優於現有方法。


更多會議詳情可移步至會議智圖開放平臺 ICLR 2020 專題全析圖(
www.aminer.cn/conf/iclr2020),一站式查看日程、論文、作者、華人學者、一作華人學生、論文 PPT 和視頻等多維信息,並提供一鍵綜述、論文解讀與討論等功能,是您的參會智能助理。


分享到:


相關文章: