ICRL 2020 會議日程解讀頭條網

ICRL 2020 會議日程解讀

2021-04-08 23:02:12 佚名

因疫情影響，The International Conference on Learning Representations（ICLR 2020）遺憾地成為首個線上虛擬學術頂會，而所有被接受的論文都要預先錄製展示視頻。雖然少了與大佬們當面交流的機會，但在家就能坐聽大咖開講也是種不錯的選擇。

ICLR 2020 共收到了 2594 篇論文投稿，最終共有 687 篇被接收，其中 48 篇 orals、108 篇 spotlights、531 篇 poster；錄取率為 26.5%，相比去年的 31.4% 略有降低。

4 月 27 日，展示 172 篇論文（涵蓋元學習、對抗網絡、多智能體學習、聯邦學習、深度強化學習等主題），包括 14 篇 Oral、32 篇 Spotlight、126 篇 Poster。其中，德克薩斯大學團隊發表的 Meta-Q-Learning，介紹了一種新的元-Q 學習（Meta-Q-Learning，MQL）算法，這是一種新的用於元強化學習的離線策略算法。元-Q 學習借鑑了傾向性估計的思想，從而擴充了用於自適應的可用數據量。在標準連續控制基準上的實驗表明，與最新的元強化學習算法相比，元-Q 學習更具有優勢。

4 月 28 日，展示 170 篇論文（涵蓋強化學習、計算神經科學、貝葉斯元學習、可解釋深度學習、自動編碼機等主題），包括 10 篇 Oral、23 篇 Spotlight、137 篇 Poster。其中，谷歌團隊發表的 SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference，提出了一個能夠擴展到數千臺機器的強化學習架構——SEED RL（Scalable and Efficient Deep-RL，即可擴展且高效的深度強化學習），同時該架構還能夠以每秒數百萬幀的速度進行訓練，計算效率顯著提高。

4 月 29 日，展示 164 篇論文（涵蓋深度批主動學習、Transformer、時序推理、強化學習、過完備學習、神經網絡模型優化等主題），包括 12 篇 Oral 、26 篇 Spotlight、126 篇 Poster。其中，華為諾亞實驗室發表的 Causal Discovery with Reinforcement Learning 獲得滿分評價。該論文將強化學習應用到打分法的因果發現算法中，通過基於自注意力機制的 encoder-decoder 神經網絡模型探索數據之間的關係，結合因果結構的條件，並使用策略梯度的強化學習算法對神經網絡參數進行訓練，最終得到因果圖結構。該方法在中等規模的圖上的表現優於其他方法，包括傳統的因果發現算法和近期的基於梯度的算法。同時該方法非常靈活，可以和任意的打分函數結合使用。

4 月 30 日，展示 177 篇論文（涵蓋圖神經網絡、神經機器翻譯、圖嵌入表示、問答系統、超網絡優化、強化學習、聯合學習、自然語言生成、神經網絡剪枝等主題），包括 12 篇 Oral、26 篇 Spotlight、139 篇 Poster。其中，南京大學團隊發表的 Mirror-Generative Neural Machine Translation 獲得滿分評價。該論文提出一種鏡像生成式機器翻譯模型：MGNMT（mirror-generative NMT）。MGNMT 是一個統一的框架，同時集成了 source-target 和 target-source 的翻譯模型及其各自語種的語言模型。MGNMT 中的翻譯模型和語言模型共享隱語義空間，所以能夠從非平行語料中更有效地學習兩個方向上的翻譯。此外，翻譯模型和語言模型還能夠聯合協作解碼，提升翻譯質量。實驗表明本文方法確實有效，MGNMT 在各種場景和語言（包括 resource rich 和 low-resource 語言）中始終優於現有方法。

更多會議詳情可移步至會議智圖開放平臺 ICLR 2020 專題全析圖（
www.aminer.cn/conf/iclr2020），一站式查看日程、論文、作者、華人學者、一作華人學生、論文 PPT 和視頻等多維信息，並提供一鍵綜述、論文解讀與討論等功能，是您的參會智能助理。

分享到:

關鍵字: Learning 算法錄取率