过去的 3D diffusion,大多在高维几何表示上做 denoising: 无论是体素、网格、点采样,还是隐式场,本质上都需要处理大量几何状态。 我们在 ICML 2026 新工作 Rethinking 3D Shape Generation: Diffusion over Superquadrics 中提出了一个不同的方向: 3D 生成不一定要扩散密集几何, 也可以直接扩散结构化的几何基元。 我们提出 DoSs: Diffusion over Superquadrics,把一个 3D shape 表示成一组可解释的 superquadric tokens。每个 token 对应一个几何部件,包含位置、姿态、尺寸、形状和存在性。这样,模型只需要在紧凑的 primitive space 中生成,而不是在高维 dense geometry 中反复去噪。论文中报告 DoSs 使用约 7KB diffusion state,并能在约 0.6 秒生成一个 3D shape,同时支持任意分辨率采样、部件级编辑和几何约束设计。#3D生成 #世界模型 #AI #Diffusion#3D 论文链接:https://arxiv.org/pdf/2606.08957