GPT Image 1.5排名第一，网友吐槽OpenAI作弊

2025-12-17

关注CAIE，国内头部AI人才认证、培训体系，助你在职场升职加薪。

CAIE注册人工智能工程师

公众号作者

CAIE，全称 Certifed Artifcial Intelligence Engineer（人工智能工程师），简称 CAIE（赛一），是人工智能领域的技能等级认证。旨在评估和培养具备人工智能理论基础与实战能力的职业人士。

知名AI分析平台Artificial Analysis公布了,今天凌晨2点OpenAI发布的最新文生图模型GPT Image 1.5测试情况。

结果显示，GPT Image 1.5同时拿下文本生成图像和图像编辑双项第一，性能超越Nano Banana Pro。

谷歌最新发布的Nano Banana Pro降到了第二名，黑马实验室开源的FLUX.2 Max和Pro版本分别位列三、四名。

而字节跳动的Seedream 4.0则排名第五。

对于这个测试结果，网友纷纷不服表示，OpenAl在这个基准测试中作弊了。看起来他们生成的图像虽然不够逼真，但却更讨人喜欢，可能是通过运用 HDR 和饱和度来实现的。

以我的经验来看，这种方法的准确性几乎总是更差，但他们利用的是众包意见。结果对评委的提示方式非常敏感。虽然 Artificial Analysis 的工作值得高度赞扬，但我们看到 LLM Arena 中发生的基于氛围的转变正在重演。

为了提高准确性，改进评判标准是明智之举，或许可以通过多样化或轮换题目的措辞，以及优先考虑技术上的准确性而非流行度？

1.5 版本是怎么夺冠的？就连单次执行项目下的示例，1.5版本也赢了。

为什么感觉 OpenAI 在追着基准测试跑？在很多图像生成场景里，Gemini 3.0 Pro 都处于领先，而 Flux 2 生成的图像也比 1.5 版本更好。

总觉得哪里不对劲，在这个帖子里的大多数图像中，1.5 版本看起来并没有更出色。它似乎是在图像上添加了一些鲜艳的色彩，这可能会误导用户喜欢上它。

色调偏黄、分辨率又低，我从没见过这么差的效果，而且它处理文字的问题还没解决。这怎么可能比Nanobanana还强，更别提增强版了？我觉得这结果肯定是造假的。

也有网友通过同样提示词对GPT Image 1.5和Nano Banana Pro进行了综合对比：一张超写实的无人机航拍广角镜头，展现一个体型庞大的男人随意地坐在伦敦街头，单膝跪地，一只手搭在膝盖上。

他身穿海军蓝大衣、针织衫、深色长裤、靴子，头戴一顶极简风格的毛线帽。在他周围，小巧的汽车、公交车、自行车和行人穿梭往来，经典的伦敦红砖建筑、黑色路灯和鹅卵石街道在他身形的映衬下显得格外渺小。

左面是GPT Image 1.5，右面Nano Banana Pro生成的图片。没有使用任何参考图。

对于这个结果，网友表示，根本无法相提并论。Nano Banana Pro完全是另一个档次，比GPT Image 1.5好很多。

也有人指出，GPT Image 1.5生成的道路变形了！所以觉得 Nano Banana Pro在这项测试中胜出。

我看过不少生成成果了，到目前为止，Nano Banana Pro的表现显然更出色。大家都是这么认为的吗？

恭喜你顺利通过CAIE 注册人工智能工程师认证！你的 AI 专业能力已获官方认可。愿你继续在智能时代保持领先，持续进步、不断升级。