基于富文本的三维高斯生成与色彩编辑
3DGS Generation and Color Editing with Rich Text
-
摘要: 三维高斯溅射凭借其渲染效率与质量, 已经成为了生成式三维模型的主流表示. 然而, 现有三维高斯的语义编辑方法仍面临效率低、一致性差等挑战. 基于优化的方法依赖耗时的高斯参数微调, 而基于二维扩散的编辑方法容易产生三维不一致、颜色渗漏等问题. 本文提出一种基于富文本引导的三维高斯语义编辑框架, 聚焦色彩编辑任务, 通过结构化富文本解耦语义与颜色信息, 并设计三维自注意力图引导的分割机制, 实现高效精准的语义驱动编辑. 具体而言, 首先利用跨视角注意力图提取三维一致的词组掩码, 建立富文本词组与目标编辑区域的关联; 其次, 设计基于区域的扩散降噪过程, 通过噪声混合逐步引导编辑区域的色彩向目标色彩逼近. 实验表明, 本方法在保持三维一致性的前提下, 将单次编辑时间从基于优化方法的约10分钟缩短至25秒, 同时避免颜色渗漏, 获得了更自然的编辑结果.
下载: