Text-to-3D 模型 AI 生成工具效果对比
在AI类产品中,不少产品都有自己独特的能力和表现。本文评测了6款AI 生成 3D 内容工具,从表现来看,他们各自的能力如何。
AI 生成 3D 内容工具正在迅速发展,用户可以通过文本描述、图像、视频生成高质量的 3D 模型和动画。7月初,Meta 推出快速流水线技术 3D Gen,实现一分钟内生成高质量3D资产,支持PBR,还允许用户通过文本重绘3D纹理,再次引发行业关注,我们期待该技术可以应用于游戏、设计、空间计算等领域,进一步提高 3D 内容的生产效率:
本文我们将介绍并对比目前可用的文生 3D(Text to 3D)工具平台,并综合测试对比生成 3D 模型的效果和质量。其中测试工具如下:
- Luma AI – Genie(https://lumalabs.ai/genie)
- Tripo 3D(https://www.tripo3d.ai/)
- Meshy(https://www.meshy.ai/)
- Rodin(https://hyperhuman.deemos.com/rodin)
- CSM(https://3d.csm.ai/)
- sudoAI(https://www.sudo.ai/3dgen)
我们将使用相同的提示词(如下),尝试生成一个「头戴滑雪镜的复活节岛石像」3D 模型,并导出 USDZ 格式文件,在 MacBook 和 Apple Vision Pro 中对比生成模型的效果。
Moai statue wearing ski goggles, photorealistic, 4K, HD
01 Luma AI – Genie
Genie 采用直接由文本生成 3D 模型的方式,先生成 4 组地分辨率模型样图,再由用户选择满意的模型进行精细化生成(Make Hi-Res)。
从生成结果来看,首先能够正确理解文本描述,其次生成的模型和贴图也比较合理,唯一不足在于最终模型的精细程度稍有欠缺,尤其在轮廓过渡的位置。
02 Tripo 3D
Tripo3D 除了支持文本外,还可以直接上传图片生成 3D 模型;同样是先生成 4 个地分辨率模型,再由用户选择满意的模型进行精细化生成,而且还支持模型动画、风格化生成:
最终生成的模型精度效果还可以,不过贴图存在较明显的“拉扯”现象:
03 Meshy
Meshy 支持在生成模型的时候先选择不同的艺术风格,针对精细化生成的模型,还可以查看模型在不同光照设置、不同渲染材质的效果。特别是针对我们要生成的石像模型,如果预先选择了雕塑风格,获得的模型效果在所有工具中是最好的!
唯一不足之处是对文本提示词的语义理解有所偏差,只生成了石像而没有眼镜。也许可以通过直接上传图片的方式加以改善。
04 Rodin
为了解决文本理解的问题,Rodin 采用先由文本生图让用户确定要生成的模型符合需求,然后分两步生成模型几何(Geometry)和贴图(Material),以确保每一步都符合用户需求:
最终生成的模型精细度和效果都仅次于 Meshy,而且文本理解的准确性显然要更好。
05 sudoAI & CSM
最后两个 sudoAI 和 CSM(手机 App – Cube),前者文本生成的模型在准确性、模型几何精细度、贴图精细度等各方面都远不如前三款;后者目前免费版本已经不支持精细化模型生成,从粗略模型效果上看,也并没有明显优势。
总结
以上就是 6 款 Text-to-3D 模型 AI 生成工具的效果对比,不过要注意的是这些 AI 工具都还在非常快速地升级迭代过程中,很可能下一个版本升级就会有更准确、更精准的模型效果,如有 3D 模型生成需求可以关注 Ai 斯基,持续跟进最新动态!
作者:Ai斯基,公众号:Ai斯基
本文由 @V2XR 授权发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!