Deepfake(假货)与真实的战争


Deepfake(假货)与真实的战争

随着Deepfake的问世,将真理与小说区分开来变得越来越困难。Deepfake可能破坏几乎所有针对他们的目标-2020年的政治运动,本地或国际新闻以及时事,甚至有人离婚程序。几乎每个从事视频工作的新闻机构,社交媒体平台和技术公司都在探索如何检测和抵制深度欺诈,但是当我们开始研究本文时,发现很少有人愿意谈论它。

“如果技术可以创造的东西,技术应该能够检测它是否是一个真实的视频或是否已经被编辑,”切赫说Peterka ,在首席技术官RadioMobile以及Verimatrix的前CTO,他专注于反盗版和法医视频安全。

彼得卡说:“ Deepfakes拍摄了真实的图像,知道了当您发出不同声音时嘴唇应该如何运动,然后像CGI图形一样人为地制造了嘴唇的运动,使其听起来像您在说些什么。” 。“音频也会发生同样的事情。如果有人分析了您的声音,那么他们就可以合成您所说的具有声音语调,口音和其他所有内容的东西。”

这是一个新兴领域,但原则上,内容安全业务Peterka以前曾有过非常相似的问题需要解决。“我知道一些视频捕获,编辑和压缩技术,因此必须找到一种检测方法。”

Deepfake的令人担忧的蔓延

根据“ The Deepfakes The State of Deepfakes ” 的说法,Deepfakes主要用于吸引著名的女艺人,并将自己的脸庞放在色情制品上“由Deeptrace进行的一项研究,该公司负责检测和监控合成视频。

“我们的研究显示,该deepfake现象正在迅速成长的在线,与deepfake视频增加近一倍,在过去七个月14678的数量,” 写道: Deeptrace创始人,首席执行官兼首席科学家Giorgio Patrini于2019年9月发布。

“这种增长得益于工具和服务的日趋商品化,这降低了非专家制造深造产品的障碍。” 该公司的研究确定了多个论坛,开放源代码,应用程序和平台,以进行Deepfake内容创建。根据该报告,一项服务需要250张图像和两天的处理时间才能创建真实的Deepfake。

Deeptrace在网上发现的Deepfake影片中,多达96%是色情影片,前四大网站的观看次数超过1.34亿。其余4%的Deepfake视频在YouTube上找到,从政客到企业人物不等。当前许多伪造品的质量,包括操纵内容使其看起来像南希·佩洛西,唐纳德·特朗普,巴拉克·奥巴马的内容(特别是在BuzzFeed制作的视频中)(如本文的开头图片所示),马克·扎克伯格(Mark Zuckerberg)等人则可怜,以至于有些人将其称为“便宜货”。不过,令人担忧的是,该技术的发展速度如此之快,以至于很难将一道假货与真实的东西区分开。

那不是真正的猫,也不是真正的人

术语“ deepfake”来自“深度学习”和“伪造”。AI领域与创建深造假相关,其根源是一类称为生成对抗网络(GAN)的机器学习,在该机器学习中,神经网络通过从训练集中获取数据并生成新内容来相互竞争。

芬兰公司Valossa Labs首席执行官/首席技术官Mika Rautiainen博士说:“这完全取决于人工神经网络捕获实际实体,学习表示形式甚至学习数据的样式表示形式并对该信息进行编码的能力。”。“这些信息(用于创建)生成模型,基本上可以创建新内容。”

Valossa开发了图像识别软件,以识别视频内容中的人物,物体和情感,并提取此元数据来描述正在发生的事情或用于亮点提取。Rautiainen说:“ Deepfakes已成为公司的附带利益,我们正在研究其技术和开发方法。”

Deepfake(假货)与真实的战争

为了开发新内容,无论是图像,视频还是音频,机器学习都需要训练数据。要了解猫的外观,必须向系统展示足够的猫,以使该系统学习猫的所有排列方式-躺下,睡觉,打架,坐着,站立以及不属于猫的东西。为了制造既有的人做他们未曾说过的话,或者创建一个综合的人,系统需要数据来学习。早期的工作不是很现实(如左图所示)。

Thispersondoesnotexist.com是由Phillip Wang建立的模拟人物档案。该网站显示了假人的高分辨率图像,并已被浏览超过5000万次。“我们已经找到了一种方法,使计算机可以解开数据集,了解其下的所有模式,然后能够重建和生成与训练数据没有区别的新数据。在这种情况下,它是面孔,但可能是任何东西。您可以拥有架构图或牙科植入物。”

“高分辨率非常重要。数据质量越好,这种特定体系结构的输出就越好,因为它们还有很多工作要做。” Thispersondoesnotexist.com使用来自Flickr开源数据集的70,000张高分辨率图像在八个GPU上进行了为期一周的培训。Wang说:“视频还没有像图像那样令人震惊。” “由于计算上的限制,并且随着时间的流逝,[手段]每帧都需要保持一致。”

Wang说:“我认为解决假图像问题可能是解决大型视频问题的一种代理。视频只是图像帧的集合,因此属于同一研究领域。” “我认为,如果您在每个框架上进行取证,肯定会有不同的说法,您可以找出是否已被修改。”

Deepfake(假货)与真实的战争

恰当命名的网站“此人不存在”中的数百个AI生成的Deepfake图像之一。

获取培训数据

对抗Deepfake的第一步是确定什么是Deepfake。Facebook的首席技术官Mike Schroepfer在博客文章中说:“该行业没有检测[deepfakes]的强大数据集或基准。”。“我们希望在这一领域进行更多的研究和开发,并确保有更好的开源工具来检测深造。这就是为什么Facebook,人工智能伙伴关系,微软以及康奈尔技术,麻省理工学院,牛津大学,加州大学伯克利分校的学者,马里兰大学,学院公园大学和奥尔巴尼-SUNY大学一起建立了Deepfake检测挑战赛 (DFDC)。”

参与者将竞争创造检测和防止被操纵媒体的新方法。Facebook正在为此提供超过1000万美元的资金,并且正在使用付费演员,而不是Facebook用户数据。亚马逊还加入了DFDC,并捐赠了AWS积分和技术支持。“被Facebook所产生的新的数据集,包括成千上万的视频。例如,无论真假,竞争对手将使用此数据集设计,能检测出真正的或假的视频新颖算法,” 写道: AWS机器学习解决方案实验室副总裁Michelle Lee。

“他们正在使用演员来制作深造视频,因此研究团体可以尝试找到以像素级粒度剖析媒体的方法,并使用不同的方法和方法来解码或预测媒体是真实的还是假的。 ”,Rautiainen说。

问题是使用角色是否会创建足够好的数据集?一家名为Dessaus的加拿大公司在Google中引用了使用付费演员制作的合成视频。纽约时报 报道使用参考数据失败了40%。当Dessa从其他现实生活场景中挑选其他内容进行培训时,它能够提高成功率。

我们肯定知道什么?

为了发现某些东西,了解共同特征是必不可少的。当今的假货以“轻微的迹象表明音频和视频的运动不同步或不连续。在面部和头部的运动之间可能存在不相交的区域,颜色或光照差异(背景和背景之间的平均照明颜色)。前景),” Rautiainen说。“通过仔细分析口述音轨,您可以映射信息并尝试查找视频中的相关性或相关性。”

一个问题是检测和操纵器都在寻找相同的东西。如果检测工具正在寻找人们微笑时鱼尾纹的外观,那么我们知道,深造者正在考虑同一件事。Brightcove首席产品官Charles Chu说:“没有人想出一种通用的扫描仪来检查所有不同的技术……以我们今天对病毒检测的看法来看。”。

一种潜在的检测方法类似于当今用于内容保护的方法。“如果我在视频上应用水印或应用数字签名,则任何试图更改该视频的人都可能会损坏签名或损坏水印,这会提示我该视频存在问题, ”彼得卡说。


分享到:


相關文章: