GPT Image 1.5排名第一,网友吐槽OpenAI作弊

2025-12-17

关注CAIE,国内头部AI人才认证、培训体系,助你在职场升职加薪。
CAIE注册人工智能工程师
CAIE注册人工智能工程师
公众号作者
CAIE,全称 Certifed Artifcial Intelligence Engineer(人工智能工程师),简称 CAIE(赛一) ,是人工智能领域的技能等级认证。旨在评估和培养具备人工智能理论基础与实战能力的职业人士。

知名AI分析平台Artificial Analysis公布了,今天凌晨2OpenAI发布的最新文生图模型GPT Image 1.5测试情况。

结果显示,GPT Image 1.5同时拿下文本生成图像和图像编辑双项第一,性能超越Nano Banana Pro

谷歌最新发布的Nano Banana Pro降到了第二名,黑马实验室开源的FLUX.2 MaxPro版本分别位列三、四名。

而字节跳动的Seedream 4.0则排名第五。

对于这个测试结果,网友纷纷不服表示,OpenAl在这个基准测试中作弊了。看起来他们生成的图像虽然不够逼真,但却更讨人喜欢,可能是通过运用 HDR 和饱和度来实现的。

以我的经验来看,这种方法的准确性几乎总是更差,但他们利用的是众包意见。结果对评委的提示方式非常敏感。虽然 Artificial Analysis 的工作值得高度赞扬,但我们看到 LLM Arena 中发生的基于氛围的转变正在重演。

为了提高准确性,改进评判标准是明智之举,或许可以通过多样化或轮换题目的措辞,以及优先考虑技术上的准确性而非流行度?

1.5 版本是怎么夺冠的?就连单次执行项目下的示例,1.5版本也赢了。

为什么感觉 OpenAI 在追着基准测试跑?在很多图像生成场景里,Gemini 3.0 Pro 都处于领先,而 Flux 2 生成的图像也比 1.5 版本更好。

总觉得哪里不对劲,在这个帖子里的大多数图像中,1.5 版本看起来并没有更出色。它似乎是在图像上添加了一些鲜艳的色彩,这可能会误导用户喜欢上它。

色调偏黄、分辨率又低,我从没见过这么差的效果,而且它处理文字的问题还没解决。这怎么可能比Nanobanana还强,更别提增强版了?我觉得这结果肯定是造假的。

也有网友通过同样提示词对GPT Image 1.5Nano Banana Pro进行了综合对比:一张超写实的无人机航拍广角镜头,展现一个体型庞大的男人随意地坐在伦敦街头,单膝跪地,一只手搭在膝盖上。

他身穿海军蓝大衣、针织衫、深色长裤、靴子,头戴一顶极简风格的毛线帽。在他周围,小巧的汽车、公交车、自行车和行人穿梭往来,经典的伦敦红砖建筑、黑色路灯和鹅卵石街道在他身形的映衬下显得格外渺小。

左面是GPT Image 1.5,右面Nano Banana Pro生成的图片。没有使用任何参考图。

对于这个结果,网友表示,根本无法相提并论。Nano Banana Pro完全是另一个档次,比GPT Image 1.5好很多。

也有人指出,GPT Image 1.5生成的道路变形了!所以觉得 Nano Banana Pro在这项测试中胜出。

我看过不少生成成果了,到目前为止,Nano Banana Pro的表现显然更出色。大家都是这么认为的吗?

确定要退出登录吗?
确定 取消
推广有奖