2026年4月26日晚,由中国图学学会主办,中国图学学会青年工作委员会和中国图学学会可视化与认知计算专业委员会联合承办的中国图学学会“奋发图强”博士生Workshop 2026年度第二期(总第28期)在线上成功举办。本次Workshop以“开放世界三维智能:生成、理解与高效推理”为主题,围绕开放世界三维场景生成、跨域多任务点云理解、具身智能交互环境构建以及自动驾驶多模态大模型高效推理等前沿方向展开交流。活动以腾讯会议的形式举办,并在哔哩哔哩“图学大讲堂”、微信视频号同步直播,吸引了相关领域师生和研究人员720人的关注与参与。
本次Workshop由第十届中国科协青年人才托举工程入选者、华东师范大学计算机科学与技术学院青年研究员谭鑫主持。

学术报告环节,三位优秀博士生围绕各自研究方向分享了最新研究进展;
第一位报告人是来自清华大学的石瑜恺同学,他作了题为《走向开放世界的3D场景生成框架SceneMaker》的报告。介绍了开放世界3D场景生成的研究背景与应用需求,但现有方法在“严重遮挡”和“开放世界物体”场景下,往往难以同时保证高质量几何形态和准确物体位姿。针对上述问题,他分享了SceneMaker框架的核心思路:将场景生成任务解耦为三个独立子任务,分别面向3D物体生成、3D物体生成与位姿估计,并结合海量2D图像数据集、3D物体数据集和3D场景数据集进行针对性训练。该工作为开放世界三维场景生成提供了新的技术路径,也展示了三维生成技术在复杂真实场景中的应用潜力。

第二位报告人是来自英国伯恩茅斯大学国家动画中心的的姜金岑同学,他作了题为《跨域多任务点云理解:统一建模与泛化》的报告。报告内容围绕点云理解中的跨域、多任务和泛化问题展开。因为点云理解是三维视觉中的核心问题,现有方法通常建立在相对封闭且静态的数据分布假设之上,当模型面对未见目标域、跨传感器和跨场景带来的域偏移时,容易出现显著性能退化。因此报告介绍了围绕统一建模、跨域泛化、鲁棒适应和长期效率提升等方面的一系列研究工作,并探讨了如何在多任务场景下实现稳定的跨域迁移与鲁棒适应,为复杂开放环境中的三维理解提供了有益思路。

第三位报告人是来自伊利诺伊大学厄巴纳-香槟分校 (UIUC) 的夏鸿驰同学,他作了题为《为具身智能构建物理真实的可交互三维世界》的报告。考虑到具身智能的发展迫切需要高质量仿真环境作为支撑,理想的训练与测试环境应同时具备三维物理性、物理真实性、视觉与语义逼真性以及可交互性。围绕这一目标,他介绍了三项系统性研究成果:在数字孪生方向,通过真实场景图像重建具有关节结构的高保真数字孪生;在动态三维交互世界生成方向,从单段视频自动生成仿真就绪的三维交互世界;在生成式场景构建方向,提出可扩展的智能体驱动三维场景生成框架。相关工作共同构建了从真实世界数据采集到多样化场景生成的技术链路,为具身智能的大规模训练与评测奠定基础。

在经验分享环节,来自同济大学工程智能研究院的汤凯华副教授作了题为《面向自动驾驶的多模态VLA大模型高效推理方法研究》的报告。汤老师围绕自动驾驶场景下多模态VLA大模型的高效推理问题,介绍了相关技术挑战与研究进展。随着自动驾驶技术持续发展,多模态视觉-语言-动作大模型正在成为支撑复杂环境感知与决策的重要范式,但自动驾驶系统对实时性和响应速度要求极高,传统大模型推理中的高算力开销、延迟高等问题制约了其实际部署。报告重点介绍了面向推理阶段的加速方法,包括KV Cache共享机制、Token裁切策略以及HiF4低比特特征量化方法等,并分享了相关方法在自动驾驶VLA模型中的应用效果。

中国图学学会长期以来一直把青年人才的培养作为重中之重!2017年开始,承办了“中国科协第339次青年科学家论坛”;2018年开始,为了深入贯彻落实中国科协对青年人才培养的新要求,创办学会自己的青年人才学术交流活动品牌——“奋发图强”。“奋发图强”意在“图学研究当自强,奋发有为靠青年!”希望能通过学会的努力,为图学界的青年人才们营造出一方施展才华、交流学习、快速成长的沃土!“奋发图强”青年人才学术交流活动由中国图学学会青年工作委员会负责牵头组织实施。2022年新增设了“博士生Workshop”,2024年新增设了“前沿技术云讲堂”。至此,学会的“奋发图强”青年人才学术交流活动由“青年科学家论坛”“青年人才学术沙龙”“博士生Workshop”和“前沿技术云讲堂”四部分组成:论坛自2018年至今已举办了八届;沙龙自2019年至今已举办了34期;博士生Workshop至今已举办了28期;前沿技术云讲堂至今已举办了7期。