2024年9月1日,由中国图学学会动漫图学工程专业委员会主办的“博漫共创”博士生研讨会第二期以腾讯会议+中国图学学会哔哩哔哩官方账号“图学大讲堂”和中国图学学会微信视频号在线直播的方式举办,在线观看人数近700人。本次研讨会以“三维可泛化重建与生成”为主题,致力于为图学领域研究该方向的在校博士研究生提供一个高质量的学术交流与知识分享的平台。
三维与生成模型的结合、可泛化的高质量三维重建等领域,已经成为计算机图学研究的重要且持续的焦点。本次研讨会邀请了上海科技大学张龙文博士、香港中文大学深圳未来智联网络研究院的吴毓双博士、华中科技大学的井贝贝博士、浙江大学的闵致远博士进行专题探讨,他们分别针对三维数字资产的生成、三维数据和可泛化重建技术、极线信息引导的可泛化NeRF学习、文本驱动的人体动作合成等热点问题分享最新的研究进展。研讨会由浙江大学“百人计划”研究员、中国图学学会动漫图学工程专业委员会秘书长罗亚威研究员主持,中国图学学会动漫图学工程专业委员会委员杨卫研究员开篇致辞,他对各位专家及线上听众的到来表示热烈欢迎,同时介绍了中国图学学会动漫图学工程专业委员会以及本次研讨会的基本情况。

中国图学学会动漫图学工程专业委员会秘书长罗亚威主持会议

中国图学学会动漫图学工程专业委员会委员杨卫研究员致辞
研讨会正式开始后,首先,由上海科技大学博士生、影眸科技联合创始人张龙文作题为《CLAY-多模态条件下的三维资产生成》的学术报告。他详细解析了CLAY如何处理多种输入模态,从概念图像、体素、稀疏点云到多视图图像,生成细致且实用的三维资产。通过多个应用实例展示,探讨了CLAY在游戏开发、电影制作等领域的广泛应用潜力与实际效果。

上海科技大学博士生、影眸科技联合创始人张龙文作报告
其次,香港中文大学深圳未来智联网络研究院博士生吴毓双作了题为《真实物体的可泛化三维重建》的报告。他结合实际应用,从三维数据获取、隐式场学习、点云扩散等方面,阐述了当前真实物体三维重建的最新进展以及所在实验室的相关研究成果MVImgNet等大规模多视角物体图像三维数据集以及IPoD单目RGBD物体重建方法,并初步展望了可泛化三维重建技术在虚拟现实、增强现实及制造业等领域的未来发展趋势。

香港中文大学深圳未来智联网络研究院博士生吴毓双作报告
华中科技大学智能媒体计算与网络安全实验室博士生井贝贝作了题为《文本驱动的人体动作合成研究》的报告,他结合实际应用,从扩散模型、矢量量化变分自编码器、自回归动作生成器等方面,阐述了当前人体动作生成的最新进展以及课题组的相关研究成,展示了该模型在多样化动作生成中的优越性能并展望了广泛的应用前景。

华中科技大学智能媒体计算与网络安全实验室博士生井贝贝作报告
最后,浙江大学软件学院博士生闵致远作了题为《基于极线和视角信息纠缠聚合的泛化性NeRF》的报告。他介绍了神经辐射场(NeRF)领域的最新进展,重点讲解了其在CVPR 2024上发表的EVE-NeRF模型。该模型创新性地通过协同整合外观连续性和几何一致性先验,显著提升了3D场景表示的泛化能力,并展示了该技术在多个评估基准上取得的优异表现,展望了其在新视图合成和3D重建领域的广泛应用前景。

浙江大学软件学院博士生闵致远作报告
本次研讨会受到了相关高校及学生们的广泛关注和积极参与,会议如期圆满结束。