豆包3D模型1.0发布 支持一张图生成高精度3D模型

田宁
2025-10-26 15:20

10月26日消息,火山引擎发布豆包3D模型1.0 (Doubao-Seed-3D-1.0),实现从单张图像到高质量仿真级3D模型的端到端生成。Seed3D 1.0基于创新的Diffusion Transformer架构,通过大规模数据训练完成,可生成包括精细几何、真实纹理和基于物理渲染(PBR)材质的完整3D模型,并可实现多视角一致性和材质真实感。

通过Seed3D 1.0生成的3D模型能够无缝导入Isaac Sim等仿真引擎,仅需少量适配工作即可支持具身智能大模型训练。此外,通过分步的场景生成,Seed3D 1.0可从单个物体生成,拓展至构建完整的3D场景。

在与现有3D生成模型的对比中,Seed3D 1.0展现出优势:其纹理与材质生成性能超过此前的开源及闭源模型,几何生成性能超过业界更大参数规模的模型,综合能力达到行业领先水平,目前Seed3D 1.0已正式上线火山方舟体验中心对外提供API服务。

为全面评估Seed3D 1.0生成效果,团队邀请了14名评估员基于43张输入图像,对不同模型的生成质量进行多维度评估,打分指标包括视觉清晰度、还原度、几何质量、透视与结构、材质与纹理、细节丰富度。

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:火山引擎公众号

评估结果显示,Seed3D 1.0在六个维度均获得较好的评分。在几何生成方面,Seed3D 1.0在几何质量与透视结构上优于其他基线模型;在材质与纹理方面表现尤为突出,在输入图片保持、视觉清晰度及细节丰富度上均大幅领先,整体达到SOTA(当前最优)水平。

尽管Seed3D 1.0展现了良好性能,要基于3D生成模型搭建世界模型仍面临着生成精度和泛化性等挑战。大规模、自动化的高质量3D场景生成,依然处于探索的初期阶段。未来,团队将尝试引入多模态大语言模型(MLLM)来提升3D生成的质量和鲁棒性,并推动3D生成模型在世界模拟器中的大规模应用。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
豆包3D模型1.0发布
10月26日消息,火山引擎发布豆包3D模型1.0 (Doubao-Seed-3D-1.0),实现从单张图像到高质量仿真级3D模型的端到端生成。Seed3D 1.0基于创新的Diffusion Transformer架构,通过大规模数据训练完成,可生成包括精细几何、真实纹理和基于物理渲染(PBR)材质的完整3D模型,并可实现多视角一致性和材质真实感。
8月26日消息,字节的豆包内部正在研发测试名为“3D Model Generator”的3D模型生成工具。该工具致力于可控大规模生成模型,为创建高质量3D资产提供有力支持,尤其在游戏中的3D建模领域。该工具或不久后对外开放使用。
7月30日消息,火山引擎宣布,豆包·图像编辑模型SeedEdit 3.0正式登陆火山方舟。该模型基于文生图模型Seedream 3.0,可支持1K以上高清图像的生成与处理。
12月18日消息,抖音豆包概念探底回升,遥望科技走出4天3板,紫天科技、视觉中国、天娱数科、汉得信息等跟涨。消息面上,12月19日,火山引擎冬季FORCE原动力大会的开发者论坛将开启,聚焦火山引擎在大模型开发、应用与落地方面的实践;包含从火山方舟平台背后的技术理念和原理,到豆包MarsCode、扣子等大模型应用如何拓展AI应用边界;此外,火山引擎也将和乐鑫及ToyCity发布AI+硬件智跃计划。
3月28日消息,豆包近日测试新版“深度思考”功能。开启深度思考模式后,豆包在思考过程中可以基于推理多次调用工具、搜索信息,提供更全面,更丰富、准确性更高的结果。AI搜索此前多是“先搜后想”模式,模型根据用户需求先全面搜索信息后,根据统一的搜索结果进行思考。但对于涉及多维度分析、动态信息整合的复杂问题,单一搜索难以覆盖所有变量。
3月19日消息,豆包官微宣布,AI编程功能迎来三项升级,包括HTML预览、Python运行、生成完整项目。目前豆包支持HTML代码实时预览和交互,可以更加直观地制作各类小游戏和网页。豆包目前支持Python代码直接运行,报错可一键修复。最后,豆包还支持生成完整的项目代码再也不用分别生成前后端逻辑后复制粘贴。
3月4日消息,豆包模型团队近日开源SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。该数据集构建了覆盖285个研究生级学科、包含26529道专业问题的评估体系,不仅涵盖主流学科,更将轻工业、农业、服务科学等长尾学科纳入其中,展现出全面学科的覆盖广度,填补了长尾知识评估领域的空白。
3月5日消息,据媒体消息,抖音App于近期测试接入豆包App的AI能力,并且在抖音App内为豆包App开放了两个超级入口,一个位于短视频界面,与点赞、评论、转发等功能处于同一竖列;另外一个入口则位于抖音App的消息列表内。对此,抖音相关负责人表示,相关能力测试中,主要是希望为用户提供更丰富的AI服务。
6月11日消息,豆包发布视频生成模型Seedance 1.0 pro,价格0.015元/千tokens,制作5秒的1080p视频约3.67元/个。同时,豆包的实时语音模型全量上线。