Wan2.7-Image生图模型实测,阿里又行了?
4月1日愚人节,阿里没开玩笑,发布了万相系列的AI生图模型:Wan2.7-Image,卖点是千人前面,精准控色。
熟悉老马的老粉都知道,作为一个AI生图爱好者,尤其喜欢生成一些艺术作品,比如跟几百个日本艺术圈女老师们的合影照片。
但因为现在的生图模型还存在一些问题,哪怕是当今的王者模型NanoBanana,也会存在生成人物,人一多的情况下,每张脸都差不多。
那种感觉就像是,一堆的网红脸,一排的整容范,更离谱的是连发型,衣服款式都相差不多,所以强大如NanoBanana,也无法让老马完美圆梦。
今天一看这Wan2.7-Image发布了,居然敢说自己生成人物,能够千人千面,那高低得试它一试,看看是真牛逼还是吹牛逼。
毕竟,截止到今天,全世界的AI生图模型,都在向NanoBanana看齐,暂时还没有能够与它平分秋色的,超越它那就更不用说了。
也就是字节的Seedance2.0让国人长脸了,拿下AI生视频的世界第一,效果某种程度上一度超越Sora2,更凄惨的是,Sora都准备关门了。
因此,别看国产模型天天吹跑分,屠这个排行榜,拿那个SOTA啥的,是骡子是马,有时候拉出来一溜,多半都会露馅。
官方给出了不少参考的生图案例,老马这里就挑生成多人是否千人千面,调色盘功能,超长文字渲染,强大的组图生成,图像编辑,以及多主体一致性来实测一下。
差点忘了说了,阿里自从Wan2.5之后的模型都不开源了,因此Wan2.7-Image也是闭源的,这意味着没法自己部署。
没法部署的话,你想体验一下Wan2.7-Image的生图效果,可以通过阿里万相的官网:
https://tongyi.aliyun.com/wan 去使用。
登录后记得回到首页点“体验万相2.7图像生成”,再刷新一下当前的网页,否则对话框里无法选择该模型,如图:
登录账号之后,去签到一下,可以获得10灵感值。Wan2.7-Image有两个版本,Pro版本每生成一张图消耗2灵感值,非Pro版本是1灵感值,如图:
签到赠送的灵感值也就仅供大家体验,如果你要大批量,持续使用生图,那最好是去阿里云百炼官网:
https://bailian.console.aliyun.com,注册登录账号调用API,充钱就完了,如图:
老马大概看了一下,调用API生图的话,Pro版是5毛一张,非pro是2毛一张,另外,还送50张免费额度,如图:
大致情况就这样,下面直接开测,老马默认都选择非Pro版,2K图片输出,因为灵感值实在不够用,可能测不完还得换账号登录。
千人千面
官方给的千人千面的案例,是文字生成图片,意思是生成人物图片之后,你还可以对人物进行捏脸,改改眼睛,鼻子,下巴啥的。
但作为天生反骨不按套路出牌的老马来讲,反手就是上传自己的一张形象照,直接图生图搞起,生成自己与10位日本艺术圈老师的合影,提示词:
根据我上传的男性人物形象照,生成与10位日本美女的亲密合影,男性人物站在C位,真实手机拍摄效果
由于万相这种已经封装好的产品,都会做一些违禁词的过滤,所以日本老师没法写,只能写日本美女,一次性是默认生成4张图。
遗憾的是没有一张图,是生成满10位日本美女的,甚至有一张混入了两位韩国欧巴,什么鬼?也是辣眼睛:
最终老马挑了一张8位小姐姐的合影,勉强算是合格品吧:
你真要说千人千面吧,怎么感觉都长得差不多。可能是老马理解错了。官方说的是可以捏脸,而老马理解的是每个生成人物的人脸,都应该是不一样的。
有一说一,老马本人的人物一致性保持得还是不错的,跟原图高度一致。不像豆包的Seedream5.0,就是忍不住给你改点脸部细节,导致看起来跟本人有那么一点不像。
调色盘功能
在对话框点击“调色盘”,可以选择一些已经预设好的配色,或者自己新增配色方案。你可以理解为,通过调色盘,可以改变原图的配色,如图:
老马随便挑了一张用NanoBanana生成的原图:
选择莫兰迪的配色,上传上去后,通过提示词让Wan2.7-Image把原图改成莫兰迪配色,这一波怒耗2灵感值,最终效果:
这次是改到位了,以后给图片换配色啥的,轻松多了。
超长文字渲染
没记错的话,官方说支持生成一张A4纸大小的内容,里面可以密密麻麻都是文字,就跟那论文打印出来的效果差不多。
但作为爱搞事的老马来说,什么A4不A4的,直接上A3,都那么强了,干脆生成一张报纸算了,提示词如下:
生成一张A3尺寸的报纸,白色黑字,配图彩色。报纸刊名毛笔红色粗体字,刊名为:老马日报。报纸固定的栏目有:每日快讯、AI周报、财经新闻、娱乐八卦、养生知识、汽车之家、体育世界、全球军事、历史典故、生活妙招。每个栏目都有醒目的角标。栏目内的标题需加粗,内容按正常字体大小显示。每个栏目都得生成对应的内容,至少保证1条及以上完整内容。报纸整体排版紧凑合理,规范美观,阅读体验极佳。
一顿野生Prompt操作猛如虎,就问哪个生图模型见了不得手抖脚也抖。很快Wan2.7-Image交出了4张图片答卷,老马精选了一张:
恭喜,这次生成这么多的中文文字,没有一个乱码或者扭曲了。但是还是那个但是,这里面的内容都是混乱的,根本不成句成文,狗屁不通。
强大的组图生成
组图的意思有点类似于你去拍艺术照,可以摆不同的Pose,一次性生成多种姿态,或者背景的图片。
当然,这次依旧是老马本人上场当模特,上传了形象照作为参考图之后,输入以下提示词:
根据我上传的男性人物形象照,生成一组背景为豪华会所的多姿态多角度形象组图,至少4个姿态和角度,大师级摄影作品
四个姿态角度有点难挑选,大家凑合看看吧:
露个背影是啥情况,搞不懂。然后老马的辫子也没了,被剪掉了,这模型的脑补能力不咋地,都这样的发型了,肯定是扎小辫子啦。
图像编辑
图像编辑可以通过框选画面中的某个部位,然后让AI帮你修改。老马还是不按套路出牌,直接不框选要修改的位置,上传原图:
一句话提示词,让Wan2.7-Image把那个黑色的香奈儿包包,改成土味十足的帆布包:
图像编辑来说,无论是阿里的Qwen系列生图模型,或是Z-image,一直都是能力到位,没啥好说的,好评通过。
多主体一致性
多主体一致性其实跟单人主体一致性是差不多的意思,也就是你可以上传多个人物的照片,生成的图片,人物的脸跟形象不能有太大的出入。
这就是一致性,如果生成后的图片存在太大的出入,脸都变了,身材都变了,那就是一致性不行。
老马还是有点不死心,这次斗胆再找两位日本艺术圈的知名女老师,一起合影看看多主体一致性的效果,总共就三人,难度应该不算大:
完美!Wan2.7-Image牛逼~破音!这多主体一致性,基本赶上了NanoBanana,有一咱就得夸一,老实说话是老马的优良品德。
通过以上实际的用例体验测试下来,Wan2.7-Image的生图能力可圈可点,一个是主体一致性的保持,一个是图像编辑,还有中文多文字生成。
唯一不足之处还是跟世界知识有关系,生成的文字没糊没垮没扭曲,但不成句成文。所谓的千人千面,实际多人物生成的时候,一样大同小异。
但还是看到了国产生图模型的进步,离王者的位置越来越近了,拿出Seedance2.0那种震惊世人的效果出来,再继续努力吧!
好了,以上就是今天的分享,欢迎关注、点赞、转发一键三连。有任何问题和需求,请在评论区留言,回见!
对了,老马最近刚创建了一个AI学习交流群,有兴趣进群的小伙伴可以添加老马微信号:immajiabin,添加好友时备注:进群(不备注不通过)。


