8个主流具身智能3D世界构建包
这篇文章涵盖了当今可用于为机器人训练构建3D世界和模拟就绪资产的每个工具。使用上面的对比表找到适合你设置和预算的工具然后跳转到你感兴趣的工具部分。1、World Labs Marble制造者World Labs链接https://marble.worldlabs.aiMarble是一个基于Web的生成式世界模型可以从文本、图像、360度全景或视频创建逼真的3D环境。它输出用于视觉渲染的高斯 splat 和用于物理的单独碰撞器网格。生成不需要本地GPU。最适合导航测试和领域随机化。不适合操作研究因为单个物体无法作为独立刚体交互。注意事项默认导出格式是SPZ不是PLY。3DGRUT转换只接受PLY。下载前手动切换。在Isaac Sim中选择OpenGL作为坐标系会导致场景倒置导入。改用OpenCV。USDZ文件是zip压缩包。在Isaac Sim中打开前先解压。文档https://docs.worldlabs.aiMarble Isaac Sim工作流NVIDIAhttps://developer.nvidia.com/blog/simulate-robotic-environments-faster-with-nvidia-isaac-sim-and-world-labs-marble/2、BlenderMCP制造者Siddharth Ahuja链接https://github.com/ahujasid/blender-mcpBlenderMCP通过模型上下文协议将Claude AI连接到Blender。用 plain language 描述场景Claude自动执行Blender Python命令。集成Poly Haven、Hyper3D Rodin、Hunyuan3D和Sketchfab。最适合无需Blender专业知识的快速场景原型设计。文档https://github.com/ahujasid/blender-mcp3、SceneSmith制造者MIT CSAIL和Toyota Research Institute链接https://scenesmith.github.ioSceneSmith接收文本提示通过分层VLM智能体管道生成完全家具化、物理就绪的室内场景。每个物体获得碰撞几何、估计质量、摩擦力和关节。1,284个场景的预生成数据集在HuggingFace上免费提供无需运行管道即可使用。最适合需要密集物体布置和家具关节的操作研究。注意事项运行管道最少需要32到45GB显存。消费级硬件无解。文档https://github.com/nepfaff/scenesmith数据集https://huggingface.co/datasets/nepfaff/scenesmith-example-scenes4、Infinigen制造者Princeton Vision and Learning Lab链接https://infinigen.orgInfinigen是一个完全程序化3D生成器使用数学Python代码和Blender。零AI。它生成户外自然场景、室内环境和模拟就绪的关节物体自动烘焙PBR纹理和真实值标注。生成仅需CPU渲染仅需2GB显存。最适合生成大规模多样化训练数据集自动获取深度、法线、分割和光流。注意事项约束求解器在某些seed上会崩溃。尝试不同的seed并始终添加fast_solve.gin。整个场景的USD导出器会剥离所有关节。对于关节物体单独使用spawn_sim_ready_asset.sh。文档https://github.com/princeton-vl/infinigen5、EmbodiedGen制造者HorizonRobotics链接https://github.com/HorizonRobotics/EmbodiedGenEmbodiedGen将单个图像或文本提示转换为物理就绪的3D物体具有碰撞几何、质量和摩擦力同时导出到USD、URDF、MJCF、GLB和OBJ。最适合将真实物体数字化为用于操作任务的模拟就绪资产。文档https://github.com/HorizonRobotics/EmbodiedGen6、fVDB Reality Capture制造者NVIDIA链接https://fvdb.ai/reality-capturefVDB Reality Capture从照片重建真实物理环境到高斯splat和三角网格直接USDZ导出到Isaac Sim。由NVIDIA构建Apache 2.0开源。最适合创建真实设施的数字孪生用于模拟到真实迁移。注意事项16GB显存足以进行高斯splat重建但不足以进行生产级网格提取。文档https://fvdb.ai/reality-capture7、LiteReality制造者剑桥大学、香港大学、慕尼黑工业大学。NeurIPS 2025链接https://github.com/LiteReality/LiteRealityLiteReality通过检索艺术家制作的模型并在其上绘制完整PBR材质将LiDAR iPhone扫描转换为图形就绪的3D场景。输出是真实的可编辑几何而非高斯splat。最适合构建具有高材质保真度的结构化室内数字孪生的研究实验室。注意事项最少24GB显存。RTX 5080及以下硬阻塞。需要200GB材质数据库下载。非可选。扫描需要带LiDAR的iPhone Pro。不支持Android和标准网络摄像头。文档https://github.com/LiteReality/LiteReality8、SAGE / SAGE-10k制造者NVIDIA、UIUC、康奈尔大学、斯坦福大学链接https://nvlabs.github.io/sage数据集https://huggingface.co/datasets/nvidia/SAGE-10kSAGE是一个智能体管道使用视觉评判和物理评判在循环中运行Isaac Sim为Isaac Sim生成经过物理验证的家具化室内场景。SAGE-10k是随附的免费数据集包含HuggingFace上10,000个预生成场景可在几分钟内加载无需运行管道。最适合需要在GPU集群上大规模物理验证环境的团队。对于其他人SAGE-10k是实际的入口点。注意事项完整管道需要在8个GPU上90GB显存。任何单GPU设置完全阻塞。文档https://github.com/NVlabs/sage9、结束语这个工具包涵盖了从快速原型到生产级模拟的完整3D世界构建流程。选择适合你的工具开始构建具身AI的未来。原文链接8个主流具身智能3D世界构建包 - 汇智网