Ideogram 发布新的人工智能图像模型,与 Flux、MidJourney 竞争

2024-08-21 21:10:18 UTC | defi.io/t22
Ideogram 发布新的人工智能图像模型,与 Flux、MidJourney 竞争

Ideogram 2.0增强了逼真度,并增加了一些功能,这可能会使该公司重回巅峰。

Ideogram AI公司周三发布了Ideogram 2.0。其下一代文本到图像模型旨在挑战生成式人工智能领域老牌公司的主导地位。

就在发布前几天,Flux.1 作为 Grok on X(又名 Twitter)的主要图像生成器,备受瞩目,此举巩固了 Flux.1 在后稳定扩散 XL(SDXL)时代作为强大、多用途竞争者的地位。其他竞争者包括 Auraflow、KwaiKolors、Hunyuan、Lumina 和 Kandinsky 3。

"该公司在其官方公告中说:"Ideogram 2.0 在许多质量指标上都明显优于其他文本到图像模型,包括图像-文本对齐、整体主观偏好和文本渲染准确性。

在推出新模型的同时,Ideogram 还推出了一系列新功能,使整个套件更具竞争力。这些功能包括 iOS 应用程序和面向开发者的 API。

Ideogram 由前谷歌校友创立,在将文本生成功能融入图像模型方面一直处于领先地位。它与 Stability AI 公司一项鲜为人知的实验--Deep Floyd IF--一起,成为第一个做到这一点的模型。

随着 Ideogram 2.0 的发布,该公司提高了其模型输出的整体质量,使其速度更快、功能更强、用途更广,这要归功于五种不同预设的新选项:写实、绘图、3D、动漫和通用实现。

更新还引入了调色板,让用户对美学和构图有更多控制。

Ideogram 2.0 中的 "写实 "风格可以让用户创建看起来像真实照片的图像。"Ideogram表示:"纹理明显增强,人的皮肤和头发看起来栩栩如生。另一方面,"设计 "预设侧重于准确而艺术化的文本生成。"这让你能够为贺卡、按需印刷、海报、插图、市场营销和社交媒体内容创建具有长篇风格化文本的优质图形设计。

除了这两种风格外,"3D "预设侧重于生成模仿计算机渲染的图像,"动漫 "预设是与 MidJourney 的 Niji 风格的有力竞争者,可用于受日本漫画启发的创作,而 "通用 "预设则是一种一刀切的通用设置,可根据提示调整输出。

社交媒体用户的初步反应总体上相当积极,许多人分享了他们通过 Ideogram 生成的作品,这些作品展示了该模型在逼真度和名人渲染方面的卓越能力。我们的首次测试结果令人满意,尤其是在使用 "现实主义 "预设时,乍一看似乎与 Flux.1 的性能相当。

不过,对于想要免费测试的高级用户来说,这可能不是最好的选择。Ideogram 2.0 的免费版本每天限制使用 20 张图片(5 批 4 张),付费计划每月 8 美元起,无限慢速生成计划每月 20 美元。不过,与 MidJourney 相比,它仍然具有竞争力,后者的最低级别收费为 10 美元,无限慢速生成计划的月收费为 30 美元。

Ideogram 的产品被定位为 MidJourney 更方便的替代方案,因为该模式的自然语言处理能力可以提供更直观、更简化的提示体验,类似于 ChatGPT 提供的 Dall-E 3,而 MidJourney 则依赖于传统的 "SDXL "提示风格,带有特定的关键字和命令。

如果钱不是问题,用户可能会更看重功能而不是输出质量,因为这两款产品都很有竞争力。MidJourney 提供了非常强大的个性化功能,用户可以创建自己的风格。它还有一个功能强大的图像编辑器,可以对生成的图像进行高水平的调整。

相比之下,Ideogram 2.0 能让用户对自己的世代进行大量控制,而无需依赖提示工程或额外的工具,如样式转移、LoRAs 或 IPAdapter。调色板选项和预设可能是获得个性化结果的好方法,尤其是对新用户而言。

编辑:Ryan Ozawa

Source: decrypt.co

Related News

More News

© 2025 DeFi.io