一周AI最火论文 | 模型遗忘了我删除的数据?这个算法可以评估

一周AI最火论文 | 模型遗忘了我删除的数据?这个算法可以评估

大数据文摘专栏作品

作者:Christopher Dossman

编译:Junefish、Luna、Andy


呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!

AI ScholarWeekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。

每周更新,做AI科研,每周从这一篇开始就够啦!


本周关键词:新冠数据、无监督学习、3D人脸检测


本周最火学术研究


一种评估机器学习模型是否遗忘了数据的方法


考虑以下场景:有几个提供者,正计划为开发深度学习模型来解决分类任务提供数据。突然,提供者之一决定离开并要求删除数据,但更大的问题是,怎么确保该模型“忘记”这份数据。


在本文中,研究人员首次提出了一个具有挑战性的问题:模型是否忘记了数据?他们假设了解查询数据集和模型输出激活的分布情况,并建立了统计方法,将目标的输出与使用不同数据集训练的模型的输出进行比较。


论文贡献:

1.引入数据隐私和保留方面的新问题。

2.提供一种可用于检测模型是否忘记了特定数据的解决方案,包括当数据源有重叠时这样具有挑战性的情况


研究人员将该方法用在了自动心脏诊断挑战赛(ACDC)的中一个心脏病理学的诊断任务上,并试验了几种基准数据集(MNIST,CIFAR-10和SVHN)。他们希望能够鼓励人们调查模型保留的信息,并激发模型在更复杂的环境中的扩展。对细分或回归任务的扩展,计划在未来完成。


阅读论文全文:

https://arxiv.org/pdf/2004.10129v1.pdf


一个面向API的图无监督学习开源Python框架


本文介绍了Karate Club,它是一个结合了30多种先进的图形挖掘算法的Python框架,可以解决无人监督的机器学习任务。该框架由Karate Club设计,有着一致的应用程序界面、可伸缩性、易用性、合理的即用型模型行为、标准化的数据集提取和输出生成等特性。该研究还通过实际示例讨论了框架背后的设计原理。


该软件包的主要目标,是使机器学习研究人员和从业人员可以方便使用社团发现,节点以及整个图向量等算法。


研究人员表明,Karate Club在处理众多现实世界中的聚类问题,分类任务效率很高,而且有很多实验结果支持这个结论。


阅读论文全文:

https://arxiv.org/pdf/2003.04819v2.pdf


探索机器人技术中的进化元学习


为了实现机器人在复杂多变的世界中的自主运行,学习适应性策略至关重要。在本文中,谷歌AI研究人员与哥伦比亚大学合作提出了一种新的元学习方法,该方法可以使机器人快速适应动态变化。


与依赖于二阶梯度估计的元学习算法相比,研究人员引入了更耐噪声的Batch Hill-Climbing适应算子,并将其与基于进化策略的元学习相结合。针对机器人应用中很常见高噪声环境设定,该方法显着改善了动态变化的适应性,。


与基于策略梯度的最新MAML算法相比,该算法具有更高的自适应性能。此外,研究人员在真正的四足机器人上验证了该方法,经过模拟训练的运动策略可以成功地适应两个真实世界的机器人环境,它们之间的动力学有着巨大的不同


阅读论文全文:

https://ai.googleblog.com/2020/04/exploring-evolutionary-meta-learning-in.html


大规模高质量的3D人脸数据集和详细的绑定3D人脸预测


这项新研究提出了一个大规模的详细3D人脸数据集FaceScape,并提出了一种新颖的算法,能够从单张图片预测出精准绑定3D人脸模型。


FaceScape数据集提供了18,760个纹理化3D面部,这些3D面部模型从938个主题中捕获,每个面部都有20种特定的表情,包含经过拓扑统一化处理的毛孔级别的面部几何图形。这些精美的3D面部模型可以表示为适用于粗糙的形状表示的3D可变形模型,还可以表示为用于详细的几何形状的位移图。


利用大规模和高精度数据集,研究人员进一步提出了一种新的算法,该算法通过深度神经网络可以实现学习特定表达式的动态细节。自单个输入的图像起,所学习的关系就成为我们3D人脸预测系统的基础。与以前的方法不同,预测的3D模型可以在不同的表达式下,与高度详细的几何图形进行绑定。这些前所未有的数据集和代码将向公众发布以供研究。


阅读更多:

https://arxiv.org/abs/2003.13989v3


新冠:新冠开源研究数据库


2020年3月16日,艾伦AI研究所(AI2)与白宫科学技术政策办公室(OSTP)、国家医学图书馆(NLM)、陈和扎克伯格基金会(CZI)、微软研究院和Kaggle在乔治敦大学安全与新兴技术中心(CSET)的合作下,一起发布了CORD-19的第一版开源研究数据库,简称CORD-19。


CORD-19旨在通过其丰富的元数据和结构化全文文件,来促进文本挖掘和信息检索系统的开发。自发布以来,CORD-19数据库中的资料已被下载超过75,000次,并已成为许多Covid-19文本挖掘和发现系统的基础。在本文中,研究人员描述了数据集构建的机制、重点介绍了挑战和关键设计方面的决策、概述了如何使用CORD-19、并预览了围绕数据集构建的工具和即将进行的共享任务。


他们希望该资源将继续使计算界、生物医学专家和决策者聚集在一起,来共同寻求针对Covid-19的有效治疗和管理政策。


下载CORD-19数据库:

https://www.semanticscholar.org/

阅读论文全文:

https://arxiv.org/pdf/2004.10706v1.pdf


其他爆款论文


YOLOv4:目标检测的最佳速度和准确性

https://github.com/AlexeyAB/darknet


新冠病毒信息是如何在社交媒体中被误传的

https://usc-melady.github.io/COVID-19-Tweet-Analysis/


端到端的视觉机器人操纵的高效适应:曾经学习的行为可以适应全新的现实世界吗?

https://sites.google.com/view/efficient-ft/home


如何使用单视图合成具有多平面的图像

https://single-view-mpi.github.io/


数据集


Yoga-82: 人类姿势细分类的新数据集

https://arxiv.org/abs/2004.10362v1


学习资源


五门你不能错过的机器学习免费课程

https://www.technotification.com/2019/02/websites-to-learn-machine-learning.html?fbclid=IwAR0GKAkdHKjSbhFnTC2pMDbuV10OWBFsOHucpFEgm2HIqXdLBMGHICGvOq0


AI大事件


Facebook和亚马逊合作发布了两个用于部署的新PyTorch库:TorchServe和TorchElastic

https://ai.facebook.com/blog/facebook-ai-aws-partner-to-release-new-pytorch-libraries-


医生用AI给19位新冠病毒患者分类

https://www.technologyreview.com/2020/04/23/1000410/ai-triage-covid-19-patients-health-care/


PyTorch 1.5带着全新和升级的库来啦,这里还有与Python配合使用的C ++前端API

https://pytorch.org/blog/pytorch-1-dot-5-released-with-new-and-updated-apis/


AI助力COVID19:预测病床和呼吸机需求

https://www.zdnet.com/article/this-ai-tool-helps-hospitals-predict-covid-19-bed-and-ventilator-demand/


分享到:


相關文章: