2026-02-11
阿里巴巴通义千问团队开源了最新图像模型Qwen-Image-2.0。
说实话,看完他们的发布内容,我最大的感受就是这回AI终于学会怎么像人类一样画图了。
特别是处理那些密密麻麻的超1000文字提示词时,简直强得离谱一点不比谷歌的Nano banana差。
最最最重要的是,Qwen-Image-2.0是可以免费体验使用的。

免费体验地址:https://chat.qwen.ai/?inputFeature=t2i
先说说它最让我惊喜的地方,就是那个专业文字排版渲染的能力。现在能一口气吃下1000 个token的提示指令。
这就像你在跟一个特别听话且记忆力超好的设计师沟通,你把所有的细节一股脑倒给它,全都能接住。
比如你想做个复杂的 A/B 测试汇报图表,里面全是数据、表格、箭头、进度条,甚至还有中英文混杂的专业术语,只要你描述得够清楚,它就能给你原原本本地画出来。
这可不是简单的把字贴在图上,而是让文字和画面完美融合,排版看着就舒服,完全不输人工设计的效果。
咱们直接看效果吧,提示词太长了,就贴图片了。


效果图一次生成的,真的是强的离谱,丝毫不差。就算真人设计这个图表最快也要半小时吧,而AI只用了10秒不到时间。
再试一个复杂的,提示词:
春日里江南水乡的街头,两间相邻的传统茶馆和手工艺品店坐落在河畔,建筑外观保留了典型的白墙黑瓦风格,每家店铺前都悬挂着印有水墨画图案的灯笼,在微风轻拂下轻轻摇曳。
左侧的茶馆牌匾上书“清香悠远”四字,采用古朴篆刻;窗户上贴有手写的菜单:“传统名茶\现代咖啡\特色糕点”,落款印章写着“文墨飘香”。店内墙壁上挂着三幅水墨画卷,依次描绘着“阿里巴巴”、“千问大模型”、“图像生成”的意境。
一位中年男子正站在一幅画前凝视。右侧的手工艺品店则展示了各种精美的竹编、瓷器和丝绸制品,其牌匾是由不同色彩的丝线编织而成的“巧手匠心”。
门口放置了一个圆形标识,上写“4k clarity”,旁边有一个小型LED屏幕滚动播放“细节捕捉 静物 生态 景观”。两家店铺之间有一条小船系在岸边,船上立了一块旧木板,上面用鲜艳的颜色写着“Qwen-Image-2.0 正式发布”。

一次成图,几乎所有描述的元素都写上了,图像布局也不错。

咱们再生成一个超复杂的山水画:

这生成完基本是可以拿到打印社直接出图的效果了。

除了画得准,Qwen-Image-2.0还有一个杀手锏,就是语义理解能力特别强,原生支持 2K 分辨率。
就是它能画那种特别真实的场景,不管是指纹细节、皮肤纹理,还是光线反射,都细腻得吓人。
你让它画个眼睛特写,连里面的血丝和光斑都能给你整得明明白白。而且它把图像生成和编辑这两个功能给合二为一了,以前可能需要两个模型分别干活,现在一个模型就能搞定,从生成到修改一气呵成,既省事效率又高。
咱们看下效果:


眼睛的效果相当精细了。还能修改,直接说帮我把上面的眼睛颜色改成蓝色。
登录/注册后继续阅读
立即登录/注册 >