线上|MIT在读博士生赵行:像素之声—图像和声音的跨模态自监督学习

线上|MIT在读博士生赵行:像素之声—图像和声音的跨模态自监督学习

温馨提示:由于嘉宾在美国,本次分享时间的时间调整为北京时间6月6日晚上9点

活动信息

主题:像素之声—图像和声音的跨模态自监督学习

时间:北京时间6月6日(周三)21:00

地点:将门创投斗鱼直播间

分享提纲

深度学习的出现使得利用不同模式信号之间的学习变得容易。但同时,由于神经网络对数据量的需求,标注大量的跨模态的数据非常困难。在最近的工作中,我们利用视频中图像和声音的内在关联性,进行一系列的自监督学习。主要的应用有特征学习,声音识别,声音分离,声源在图像中的定位等。

本次分享主要分为以下三个内容:

  • 声音分离:通过自监督学习,分离出视频中的物体的声音

  • 背景:声音信号的分析

  • 背景:自监督学习

  • 声音分类与特征学习:利用已有的图像分类网络,帮助声音分类网络进行特征学习

  • 声源定位:通过自监督学习,找到视频中声音的来源

嘉宾介绍

线上|MIT在读博士生赵行:像素之声—图像和声音的跨模态自监督学习

赵行

MIT在读博士生

本科毕业于浙江大学,于麻省理工媒体实验室完成硕士论文,现为麻省理工计算机与人工智能实验室博士生。主要研究方向为场景解析,视频识别,和跨模态学习。

观看直播或加群

-The End-

将门是一家专注于发掘、加速并投资技术创新激活商业价值的创业公司的新型创投机构,旗下设有将门创新服务、将门技术社群以及将门投资基金。

将门创新服务专注于使创新的技术落地于真正的应用场景,激活和实现全新的商业价值,服务于行业领先企业和技术创新型创业公司。

将门技术社群专注于帮助技术创新型的创业公司提供来自产、学、研、创领域的核心技术专家的技术分享和学习内容,使创新成为持续的核心竞争力。

将门投资基金专注于投资通过技术创新激活商业场景,实现商业价值的初创企业,关注技术领域包括机器智能、物联网、自然人机交互、企业计算。在两年的时间里,将门投资基金已经投资了包括量化派、码隆科技、禾赛科技、伟景智能、杉数科技、迪英加科技等数十家具有高成长潜力的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”: [email protected]

线上|MIT在读博士生赵行:像素之声—图像和声音的跨模态自监督学习

点击右上角,把文章朋友圈

将门创投

让创新获得认可!

[email protected]


分享到:


相關文章: