3D 高斯 (3D Gaussian Splatting)
概述
3D Gaussian Splatting 是一种新型的 3D 场景表示与渲染技术,使用大量 3D 高斯椭球表示场景,通过可微分光栅化实现实时高质量渲染。2023 年由 INRIA 等机构提出后迅速成为 3D 重建与神经渲染领域的重要方向。相比 NeRF 的隐式表示,3D 高斯采用显式表示,在渲染速度、训练效率、编辑灵活性上具有显著优势。
核心原理
每个 3D 高斯由位置(均值)、协方差矩阵(形状与方向)、不透明度与球谐系数(颜色)定义。协方差矩阵决定椭球是球形、扁盘状还是长条状,并可旋转;球谐系数支持视角相关的反射效果。场景由数十万至数百万个高斯组成,渲染时将每个高斯投影到 2D 图像平面,按深度排序后从远到近进行 Alpha Blending,得到最终像素颜色。
可微分光栅化使整个投影与混合过程可微,梯度可反向传播到高斯参数。通过比较渲染结果与真实图像的光度损失(如 L1、SSIM),可迭代优化场景表示。自适应密度控制(分裂、克隆、剪枝)在训练中动态调整高斯分布,使表示更贴合场景几何。
关键技术
场景表示:从 SfM(如 COLMAP)获得的稀疏点云初始化高斯;每个高斯可独立控制位置、形状、不透明度与颜色。可微分 Splatting:将 3D 高斯投影为 2D 椭圆(或近似矩形),按深度排序后 Alpha Blending;投影与混合的 Jacobian 可解析计算,支持高效反向传播。自适应密度控制:根据梯度或几何误差对高斯进行分裂(覆盖更多细节)、克隆(增加密度)或剪枝(移除冗余),平衡表示精度与紧凑性。
训练流程:初始化稀疏点云;迭代渲染多视角、计算光度损失、反向传播;自适应调整高斯分布;通常数分钟至十几分钟即可收敛。4D 扩展:4D Gaussian Splatting 增加时间维度,支持动态场景、人体动作等时序变化。
代表性工作
| 模型/方法 | 类型 | 主要贡献 |
|---|---|---|
| 3D Gaussian Splatting | 原始方法 | 显式高斯表示,可微分光栅化,实时渲染 |
| 4D Gaussian Splatting | 动态场景 | 4D 高斯建模时序变化,支持动态重建 |
| GaussianAvatar | 数字人 | 高质量人体与面部 3D 建模,实时驱动 |
| MGS | 可移动高斯 | 支持场景编辑与物体移动 |
| Scaffold-GS | 稀疏表示 | 稀疏体素 + 高斯,降低内存与计算 |
| LGM | 生成式 3DGS | 从单张图像生成 3D 高斯场景 |
应用场景
- 虚拟旅游与文化遗产:用无人机或手机拍摄古迹,快速生成可 360° 浏览的 3D 场景,用于线上展览与教育。
- 电商:商品 3D 展示,用户可旋转、缩放查看细节,提升购买决策体验。
- 自动驾驶:从车载相机重建周围环境,用于仿真测试与高精地图构建。
- 数字人与虚拟偶像:高质量人体与面部 3D 建模,支持实时驱动与渲染。
- 游戏与 AR:快速场景建模与实时渲染,支持 VR/AR 应用。
- 数字孪生:工厂、建筑等场景的数字化复现,用于远程监控与仿真。
发展趋势
- 动态场景:4D Gaussian Splatting 及其变体,建模运动、变形、人体动作等时序变化。
- 生成式 3DGS:从文本或单张/多张图像生成 3D 高斯场景,无需多视角拍摄。
- SLAM 集成:基于高斯的实时同步定位与建图,用于机器人、AR 等场景。
- 压缩与优化:减少高斯数量、量化参数、蒸馏到更小表示,降低存储与带宽。
- 物理仿真:基于高斯的可微分物理模拟,支持碰撞、流体等。
- 可编辑性:支持场景分割、物体移动、材质编辑等交互操作。
推荐资源
- 论文:3D Gaussian Splatting for Real-Time Radiance Field Rendering
- 项目:gaussian-splatting (GitHub)
- 教程:3DGS 入门教程
- 工具:COLMAP(SfM)、CUDA 加速的 3DGS 实现