ChatGPT 的新图像 2.0 模型在生成文本方面表现出人意料地出色

TechCrunch
OpenAI 推出的全新 Images 2.0 模型在人工智能生成图像中的文字渲染与复杂视觉细节处理方面取得了显著进步。

内容摘要

OpenAI 发布了 ChatGPT Images 2.0,这是一款在渲染精确文本方面表现卓越的全新图像生成模型,解决了以往扩散模型在处理文字时的技术难题。通过所谓的“思维能力”,该模型能够更有效地遵循复杂指令,支持包括日语和印地语在内的多种非拉丁脚本,并能生成多格漫画或市场营销素材。尽管 OpenAI 未披露其底层架构,但该模型在处理细节、小字体以及高达 2K 分辨率内容方面的出色能力,标志着生成式 AI 在视觉质量上的重要提升。

(来源:TechCrunch)