文章详情

专注互联网科技,赋能企业数字化发展

Qwen-Image-2.0:长文、复杂指令均大幅提升

作者:Qwen-Image-2.0:长文、复杂指令均大幅提升

没等来Qwen3.5,先等来了Qwen-Image-2.0。 昨天刷到Qwen-Image-2.0更新, 在长文渲染和复杂指令遵循上都有大幅提升, 同时将文生图和图生图融合成了一个模型,输入的提示词长度扩大到1K 比如生成一张年初我汇报的PPT,汇总25年关键发展动态,见图2。 这里主要在提示词中描述了智谱&Mimimax IPO,Manus收购、豆包手机、Sora2、NonaBanana等一系列事情, 在图套图”这种结构,相较于之前有很大的提高,关键要素和内容均能画出来。 对长指令的遵循也很好,比如生成一个五黑犬的复古风格鉴定海报,图3, 提示词中给到,五黑犬的特色,可以很好的表现出来。 还有书法渲染,把古诗词的意境渲染出来,同时配上书法内容,图4。 总体来说,效果很不错,不过相较于nona banana pro还是有点差距, 但有自己的特色, 期待开源~ 对了,现在是在qwen.ai上能用,图5。 #大模型 #ai #文生图 #qwen #千问 #QwenImage

返回新闻列表