
师简介:
刘阳,副教授,硕士生导师,博士毕业于西安电子科技大学,大数据所专任教师党支部副书记。主要研究方向为具身智能、多模态空间感知与推理、因果推断。已累计发表论文40余篇,包括TPAMI,TIP,TMECH,TKDE,CVPR,ICCV,ACM MM,NeurIPS等,4篇会议论文入选Oral/Highlight,4篇期刊论文入选ESI高被引,2篇期刊论文进入影响因子贡献度前十。出版专著《多模态大模型:新一代人工智能技术范式》,销量过万,获得电子工业出版社年度优秀作者。主持国家自然科学基金面上项目、青年(C类)项目、重点项目(课题负责人)、鹏城实验室“揭榜挂帅”、华为企业合作等项目十余项。作为联合主席组织了ICPADS 2025(CCF-C类国际会议)的AIGC与多智能体并行计算Track和ICDAR 2025的多模态数学推理研讨会。获得2023广东省第三届计算机科学青年学术秀一等奖,指导学生获得2023中国软件大会机器人大模型与具身智能挑战赛优胜奖。
招生信息:团队拥有充足计算资源和机器人硬件设备,支撑具身智能体的软硬件研发,请通过liuy856@mail.sysu.edu.cn联系。
招生要求:对科研有浓厚兴趣,具备独立思考能力,自驱力强,品行端正,身心健康的学生。
研究领域:
具身智能:三维空间推理、视觉语言导航、机器人操控、机器人系统集成
多模态推理:数学题推理、视觉问答、医学报告生成
因果推理:因果表征学习、因果强化学习、反事实推理



获奖及荣誉:
电子工业出版社年度优秀作者,2024
广东省第三届计算机科学青年学术秀一等奖,2023
中国软件大会机器人大模型与具身智能挑战赛优胜奖(指导老师),2023
科研项目:
1. 国家自然科学基金面上项目,具身智能体可信空间推理与自适应交互关键技术,2026.01-2029.12,主持
2. 国家自然科学基金重点项目,基于神经符号系统的数学推理研究,2025.01-2029.12,课题负责人
3. 鹏城国家实验室“揭榜挂帅”项目,基于鹏城脑海大模型的老年人陪伴系统,2025.05-2026.05,主持
4. 华为技术合作项目,具身程序化数据生成,2025.06-2026.06,联合主持
5. 广东省自然科学基金面上项目, 因果关系驱动的可解释问答推理与定位,2025.01-2027.12,主持
6. 国家自然科学基金青年项目(C类),基于多模态传感器知识迁移与融合的人体行为识别关键技术,2021.01-2023.12,主持
7. 广东省自然科学基金面上项目, 基于跨模态因果关系推理的事件级视觉问答,2023.01-2025.12,主持
8. 广东省自然科学基金面上项目,基于自适应知识蒸馏的多模态人体行为识别关键技术,2021.01-2023.12,主持
9. 广州市科技计划项目,基于时域对比图的自监督视频表征学习,2023.04-2025.04,主持
10. 博士后自然科学基金面上项目,基于视觉和可穿戴传感器知识迁移与融合的多模态人体行为识别,2020.08-2022.08,主持
教授课程:
高等代数(本科生核心课程、专业必修课)
主要学术兼职:
广东省图象图形学会视觉专委会 副秘书长
广东省图象图形学会青工委委员
中国图学学会可视化与认知计算专委会委员
中国自动化学会具身智能专委会委员
中国图象图形学学会多媒体专委会委员
中国图象图形学学会视觉大数据专委会委员
ACM广州分会执行委员会委员
代表性论著:
- [专著-24] 刘阳, 林倞;《多模态大模型:新一代人工智能技术范式》,电子工业出版社,2024. [畅销书,销量过万]
- [ROBOT-25] 刘阳,柏永杰,林倞,面向人机物高效融合与协作的具身智能技术体系,机器人,2025. [中国科协学术年会论文]
- [TMECH-25] Yang Liu, Weixing Chen, Yongjie Bai, Xiaodan Liang, Guanbin Li, Wen Gao, Liang Lin; Aligning cyber space with physical world: A comprehensive survey on embodied ai, IEEE/ASME Transactions on Mechatronics (TMECH), 2025. [中科院一区] [入选TMECH期刊Popular榜单Top-3]
- [TPAMI-23] Yang Liu, Guanbin Li, Liang Lin; Cross-Modal Causal Relational Reasoning for Event-Level Visual Question Answering, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023. [CCF-A] [ESI高被引]
- [TKDE-25] Yang Liu, Binglin Chen, Yongsen Zheng, Lechao Cheng, Guanbin Li, Liang Lin, ODMixer: Fine-grained Spatial-temporal MLP for Metro Origin-Destination Prediction, IEEE Transactions on Knowledge and Data Engineering (TKDE), 2025. [CCF-A]
- [TIP-25] Weixing Chen(指导的博士生), Yang Liu*, Ce Wang, Jiarui Zhu, Guanbin Li, Cheng-Lin Liu, Liang Lin, Cross-Modal Causal Intervention for Radiology Report Generation, IEEE Transactions on Image Processing (TIP), 2025. [CCF-A]
- [ACM MM-25] Zeming Wei#(指导的本科生), Junyi Lin#(指导的本科生), Yang Liu*, Weixing Chen, Jingzhou Luo, Guanbin Li, Liang Lin; 3DAffordSplat: Efficient Affordance Reasoning with 3D Gaussians, ACM International Conference on Multimedia (ACM MM), 2025. [CCF-A] [Oral]
- [ICCV-25] Kaixuan Jiang(指导的硕士生), Yang Liu*, Weixing Chen, Jingzhou Luo, Ziliang Chen, Ling Pan, Guanbin Li, Liang Lin; Beyond the Destination: A Novel Benchmark for Exploration-Aware Embodied Question Answering, IEEE/CVF International Conference on Computer Vision (ICCV), 2025. [CCF-A]
- [CVPR-25] Xinshuai Song#(指导的硕士生), Weixing Chen#(指导的博士生), Yang Liu*, Weikai Chen, Guanbin Li, Liang Lin; Towards Long-Horizon Vision-Language Navigation: Platform, Benchmark and Method, IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025. [CCF-A]
- [CVPR-25] Jingzhou Luo(指导的硕士生), Yang Liu*, Weixing Chen, Zhen Li, Yaowei Wang, Guanbin Li, Liang Lin; DSPNet: Dual-vision Scene Perception for Robust 3D Question Answering, IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025. [CCF-A]
- [CVPR-25] Weixing Chen(指导的博士生), Yang Liu*, Binglin Chen, Jiandong Su, Yongsen Zheng, Liang Lin; Cross-modal Causal Relation Alignment for Video Question Grounding, IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025. [CCF-A] [Highlight]
- [ICCV-23] Hong Yan(指导的硕士生), Yang Liu*, Yushen Wei, Zhen Li, Guanbin Li, Liang Lin; SkeletonMAE: Graph-based Masked Autoencoder for Skeleton Sequence Pre-training, IEEE/CVF International Conference on Computer Vision (ICCV), 2023. [CCF-A]
- [TII-23] Yuying Zhu(指导的硕士生), Yang Zhang(指导的硕士生), Lingbo Liu, Yang Liu*, Guanbin Li, Mingzhi Mao, Liang Lin; Hybrid-Order Representation Learning for Electricity Theft Detection, IEEE Transactions on Industrial Informatics (TII), 2023. [中科院一区]
- [INS-23] Kuo Wang(指导的博士生), Lingbo Liu, Yang Liu*, Guanbin Li, Liang Lin; Urban Regional Function Guided Traffic Flow Prediction, Information Sciences (INS), 2023. [中科院一区]
- [ACM MM-23] Yushen Wei#(指导的硕士生), Yang Liu#, Hong Yan, Guanbin Li, Liang Lin; Visual Causal Scene Refinement for Video Question Answering; ACM International Conference on Multimedia (ACM MM), 2023. [CCF-A] [Oral]
- [IJCAI-23] Junfan Lin(指导的博士生), Yuying Zhu, Lingbo Liu, Yang Liu*; Guanbin Li, Liang Lin; DenseLight: Efficient Control for Large-scale Traffic Signals with Dense Feedback, International Joint Conference on Artificial Intelligence (IJCAI), 2023. [CCF-A]
- [MIR-22] Yang Liu, Yushen Wei, Hong Yan, Guanbin Li, Liang Lin; Causal Reasoning Meets Visual Representation Learning: A Prospective Study, Machine Intelligence Research (MIR), 2022. [JCR Q1]
- [TIP-22] Yang Liu, Keze Wang, Lingbo Liu, Haoyuan Lan, Liang Lin; TCGL: Temporal Contrastive Graph for Self-supervised Video Representation Learning, IEEE Transactions on Image Processing (TIP), 2022. [CCF-A][ESI高被引]
- [TIP-21] Yang Liu, Keze Wang, Guanbin Li, Liang Lin; Semantics-aware Adaptive Knowledge Distillation for Sensor-to-Vision Action Recognition, IEEE Transactions on Image Processing (TIP), 2021. [CCF-A]
- [TIP-20] Yang Liu, Zhaoyang Lu, Jing Li, Tao Yang, Chao Yao, Deep Image-to-Video Adaptation and Fusion Networks for Action Recognition, IEEE Transactions on Image Processing (TIP), 2020. [CCF-A]
- [TCSVT-19] Yang Liu, Zhaoyang Lu, Jing Li, Tao Yang; Hierarchically Learned View-Invariant Representations for Cross View Action Recognition, IEEE Transactions on Circuits and Systems for Video Technology (TCSVT), 2019. [中科院一区]
- [SPL-18] Yang Liu, Zhaoyang Lu, Jing Li, Tao Yang, Chao Yao; Global Temporal Representation based CNNs for Infrared Action Recognition, IEEE Signal Processing Letters (SPL), 2018. [中科院二区]