学术交流

基于学习的计算机视觉进展论坛(二)

题目:基于学习的计算机视觉进展论坛(二)

主讲:中科院深圳先进技术研究院 喻之斌 研究员,北京科技大学 马惠敏 教授,

         北京工业大学 毋立芳 教授,北京邮电大学 马占宇 教授

日期:2020年12月21日(星期一)

时间:14:00 - 17:00

地点:计算机学院 A101会议室

主持:谢晓华 副教授


题目一:基于AI的体系结构与系统设计优化

报告人:喻之斌(中科院百人、中科院先进院数字所副所长、华为云软硬协同创新实验室首席科学家)

时间:14:00-14:50

摘要:处理器和其承载的应用程序正变得越来越复杂,且软件与硬件之间的交互作用也变得越来越难以理解。在处理器设计早期通常依赖于微体系结构软件模拟器来验证微体系结构设计的性能。然而,一方面,微体系结构软件模拟的速度通常比所对应的硬件慢4~6个数量级;另一方面,微体系结构设计空间巨大。这导致仅仅依赖软件模拟器难以找到优化的设计方案。我们认为,利用机器学习和软件模拟的方法是找到更优设计方案的有效途径,且有利于我们发现有趣的规律。例如,我们在基于AI的GPGPU的体系结构优化设计研究中发现了许多有趣的现象。例如,对IPC最重要的两个微体系设计参数是核的频率和核所能承载的最大线程块数目。又如,微体系结构重要的参数交互性强的参数对数目不超过5对。这给了我们高效设计芯片微体系结构有益的启示。


题目二:视觉认知与驾驶行为预测

报告人:马惠敏(北京科技大学计算机与通信工程学院物联网与电子工程系主任、人工智能研究院副院长,现任中国图象图形学学会副理事长兼秘书长,北京市“三八红旗奖章”获得者)

时间:15:00-15:50

摘要:驾驶员驾驶行为预测是人机共驾中的关键技术之一,高级辅助驾驶系统(Advanced Driver Assistance Systems,ADAS)中的一些与驾驶行为相关的应用可以显著提高驾驶的安全性。本报告从认知驱动的角度和数据驱动的角度出发,将视觉认知和驾驶场景目标检测结合,提出了以Thinking in 3D为核心的MV3D目标检测深度学习算法;将视觉认知和驾驶员行为预测结合,依据驾驶员的感知-反应时间以及驾驶环境和驾驶员之间的交互关系,提出了以视觉惯性为核心的CF-RNN模型和Predictive-Bi-LSTM-CRF驾驶行为预测算法。认知科学与计算机视觉的结合,为提高机器智能的水平提供了一条新的途径。


题目三: 融合知识与视觉信息的图像情感分析

报告人:毋立芳 (北京工业大学教授,博士生导师,CCF高级会员,CCF计算机视觉专委会常务委员兼副秘书长,CSIG视觉大数据专委会常务委员。CCF多媒体技术专委会委员,CSIG多媒体技术专委会、机器视觉专委会委员)

时间:15:40-16:20

摘要:深度学习在计算机视觉领域取得的长足的进步,产生了很多实际应用系统,但依然有一些挑战性的问题需要解决。近年来,社交网络逐渐成为人们发表意见、表达自我的重要平台,随着视觉社交网络的普及,通过分析社交网络的图像或文字进行意见收集和用户情感分析对于分析事件发展趋势、研究用户兴趣类型等具有重要意义。报告将介绍常见情感模型、已有情感数据库,结合知识与视觉信息的图像情感分析,以及一些可能的应用。


题目四:细粒度图像分类

报告人:马占宇(北京邮电大学教授、博士生导师,IEEE高级会员,中国图象图形学学会高级会员、理事、副秘书长,中国计算机学会高级会员、计算机视觉专委会秘书长)

时间:16:20-17:00

摘要:细粒度图像分类是指对属于同一父类的子类进行识别(如车的型号,鸟的种类等),与传统分类任务比,因分类目标存在较大的类内差异和较小的类间差异,细粒度图像分类一直是模式识别与计算机视觉领域的研究难点和热点。本次报告将重点从数据增广策略、网络结构设计、损失函数优化等方面介绍课题组的近期工作,针对如何解决细粒度图像分类中的关键问题进行阐述。