【实习】3D Gaussian 场景编辑与新视角合成(自动驾驶/闭环仿真/World Model Diffusion)
岗位职责
基于 3D Gaussian Splatting 的场景表示,完成自动驾驶数据(多相机/多帧)下的高斯植入、新视角合成 (NVS) 与渲染管线搭建与优化。
面向动态驾驶场景,探索前馈式(feedforward)4D重建/重渲染思路:支持更长序列、更稀疏输入与更快推理,并提升时序一致性与减少伪影(拖影、重影、遮挡恢复问题)。
将新视角合成与编辑结果接入闭环仿真:构建可评测流程,支持策略/规划模块在渲染世界中的回放与干预实验,并定义关键指标(稳定性、碰撞率、偏航/横向误差等)。
引入Diffusion/world model相关技术做渲染后处理或联合建模,提升稀疏视角/遮挡区域的生成质量,降低插值与运动伪影,并形成可复现的对比实验与报告。
任职要求(必须)
熟练使用 Python,具备 PyTorch 深度学习训练/推理经验,能够独立复现论文级代码并进行二次开发。
具备 3D 表示学习经验之一:NeRF/3DGS/点云/体素/Occupancy/SLAM 或多视图重建。
有良好的工程习惯:Git、实验记录、可复现训练脚本与评测脚本。
加分项(优先)
有 3D Gaussian Splatting 相关项目经验(编辑、动态场景、实时渲染、CUDA/自定义算子)。
有自动驾驶数据经验:Waymo / nuScenes / Argoverse2 / 自采多相机数据处理与评测。
了解或实践过 pose free 前馈式重建、动态分解与时序一致性机制(例如寿命/可见性建模、动态头、运动估计等)。
了解 diffusion / video diffusion / world model,用于新视角合成的细节补全、遮挡恢复与伪影抑制。
有闭环仿真经验(CARLA/Apollo/自研仿真),或了解规划控制与评测指标体系