温馨提示:由于嘉宾在美国,本次分享时间的时间调整为北京时间6月6日晚上9点。
活动信息
▼
主题:像素之声—图像和声音的跨模态自监督学习
时间:北京时间6月6日(周三)21:00
地点:将门创投斗鱼直播间
分享提纲
▼
深度学习的出现使得利用不同模式信号之间的学习变得容易。但同时,由于神经网络对数据量的需求,标注大量的跨模态的数据非常困难。在最近的工作中,我们利用视频中图像和声音的内在关联性,进行一系列的自监督学习。主要的应用有特征学习,声音识别,声音分离,声源在图像中的定位等。
本次分享主要分为以下三个内容:
声音分离:通过自监督学习,分离出视频中的物体的声音
背景:声音信号的分析
背景:自监督学习
声音分类与特征学习:利用已有的图像分类网络,帮助声音分类网络进行特征学习
声源定位:通过自监督学习,找到视频中声音的来源
嘉宾介绍
▼
赵行
MIT在读博士生
本科毕业于浙江大学,于麻省理工媒体实验室完成硕士论文,现为麻省理工计算机与人工智能实验室博士生。主要研究方向为场景解析,视频识别,和跨模态学习。
观看直播或加群
▼
-The End-
将门是一家专注于发掘、加速并投资技术创新激活商业价值的创业公司的新型创投机构,旗下设有将门创新服务、将门技术社群以及将门投资基金。
将门创新服务专注于使创新的技术落地于真正的应用场景,激活和实现全新的商业价值,服务于行业领先企业和技术创新型创业公司。
将门技术社群专注于帮助技术创新型的创业公司提供来自产、学、研、创领域的核心技术专家的技术分享和学习内容,使创新成为持续的核心竞争力。
将门投资基金专注于投资通过技术创新激活商业场景,实现商业价值的初创企业,关注技术领域包括机器智能、物联网、自然人机交互、企业计算。在两年的时间里,将门投资基金已经投资了包括量化派、码隆科技、禾赛科技、伟景智能、杉数科技、迪英加科技等数十家具有高成长潜力的技术型创业公司。
如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”: [email protected]
点击右上角,把文章朋友圈
将门创投
让创新获得认可!
閱讀更多 將門創投 的文章