豆包Seedream 4.5上线,AI生图能力再上一个台阶
对于AI小白用户,老马一直推荐他们使用豆包。
作为一个六边形战士,豆包方方面面的AI能力都比较能打。
在AI生图领域红海般混战的今天,前有谷歌的Nano Banana Pro。
一经升级的大香蕉2,妥妥霸住了王者之位,后面也跟着一群追兵。
什么阿里开源的Z-image,Ovis-image,可灵O1层出不穷。
这不,小豆包最近也悄咪咪地更新了生图模型:Seedream4.5。
早在Seedream4.0上线的时候,老马就做过一次评测。
明显当时的生图P图能力已经相对于3.0提升不少。
那这次的4.5,刚好遇上了Nano Banana Pro,高低得对比一下。
所以下面老马将会用Nano Banana Pro上生图表现不错的提示词。
拿Seedream4.5测试看看效果如何,当然先了解一下升级了个啥。
Seedream4.5此次升级在指令遵循、一致性保持、原图保持、多图组合、文字排版方面皆有。
按官方的说法,生成中文文字排版方面效果更好,图片上的人物小脸不再崩。
至于审美嘛,见仁见智,有人觉得豆包生成的人像好看,有人不觉得。
这块肯定是没法评测的,因此待会也会抛弃人像,景象图的测试用例。
目前Seedream4.5已经在豆包APP、电脑客户端上线,除了网页版暂时没上。
电脑客户端直接显示Seedream4.5,APP显示模型4.5,大家体验的时候留意一下即可。
对了,除了评测Seedream4.5,末尾再送一个图片复刻生图提示词工具。
Seedream4.5评测
首先多图组合生成,拿最近比较火的《疯狂动物城2》与老马的卡通人物形象做一个合影,总共是上传2张图去参考生成,原图如下:
比例3:4,高角度俯拍,三人头部靠得很近,人物在中间,狐狸在左侧,兔子在右侧,头部比例夸张放大,不拍腿部,眼神直视镜头,日系视觉系风格,iPhone前置自拍质感,画面清晰明亮均匀,背景为坐满观众的电影院,三人背对银幕,银幕显示《疯狂动物城2》海报填满屏幕,人物无缝融合、视觉过渡自然,保持原有脸部特征不变。
整个合成的效果还是很不错的,对于指令的理解很到位,唯一稍显遗憾的是,Seedream4.5的世界知识还不够,导致屏幕上动物没有体现尼克和朱迪。
原图保持能力的话,拿一张手绘的英文手账试试吧,只把里面手绘的英文文字改成中文,其余元素保持不变,原图及提示词如下:
把图片上的英文改成手写中文
好家伙,还挺强的,除了个别的英文没有翻译过来,但这个效果已算不错,原图除了手写英文之外的元素都保持得蛮好。
一致性保持也是在AI生图的时候,经常重点考虑的能力,下面以人物一致性为例,提供一张原图,让Seedream4.5生成多张同类型的图,原图及提示词如下:
根据参考图,生成人物骑共享单车,骑雅迪电动车,骑三蹦子,开敞篷汽车的图片
行了行了,小豆包终于不会乱重绘人脸了,人物保持了高度的一致,就是有些物理动作错误,老黄骑三蹦子的屁股都歪到马路上去了。
中文文字排版一般用于海报设计比较多,提示词如下:
生成一张电商海报视觉图,用来呈现自然堂的防晒乳。 场景设定在海边沙滩,背景是蓝天白云,模拟户外晴天的阳光,低饱和度,高级质感,产品斜着插入沙滩中,突出产品本身,沙子偏白偏淡金色,防晒霜表面有水珠,远景有蓝天白云+海面,海面有波光粼粼的质感,模糊远景,整体视觉突出自然堂品牌的大气,高端。
产品包装上的文字生成还是OK的,老马这里也没添加太多的其余文字,总的来说海报设计对于Seedream4.5小菜一碟。
迫不及待来到了挑战王者的环节,没错,下面的提示词都是Nano Banana Pro生图表现不错的。
为了对比效果,老马做了拼图,一边为Nano Banana Pro的生图结果,另一边为Seedream4.5的,图片右下角标红字进行区别。
信息图最能考验中文排版能力,提示词比较长,老马就简略掉信息图上的内容,大家在生成的时候插入内容即可:
比例 「9:16」根据以下AI行业日报内容,以蜡笔小新卡通风趣的风格,不要额外新增内容,生成一张8k高清中文日报信息图,保证中文文字渲染清晰,内容如下:[这里插入内容]
王者依旧是王者,Seedream4.5的表现出乎意料,中文生成几乎没崩,排版美观度也很不错,就是内容没有在一张图上生成完整,漏掉了一些。
多格漫画跟手账风格的教程图片一个道理,下面生成一个马斯克做红烧肉的漫画图,提示词如下:
绘制一张红烧肉的制作流程图,搭配简要说明、食材克数,并加入一个马斯克作为角色,所有流程步骤都生成在一张图上。整体采用日本流行杂志风格的页面结构,但视觉上融合 《进击的巨人》画风,呈现彩色漫画般的强烈表现力与动感,中文版本
Nano Banana Pro完美绘制了一个漫画风格的马斯克,而Seedream4.5
则创建了另外一个漫画角色,这就是世界知识不够的问题,Seedream4.5
不知道马斯克长啥样。
最后再上一下强度,来个Nano Banana Pro的Knolling风格吧,Knolling
是平铺陈列的意思,比如下面的提示词,就是把宇航员的一身装备平铺陈列展示出来:
宇航员装备生态系统,放射状布局。中心:宇航员头盔。周围:数百件物品,包括氧气瓶、手套、靴子、冻干食品包、任务徽章、工具等,填满背景。采用Knolling风格,Bento网格排列,严格的正投影俯视图,平铺,排列紧密,填满画面边缘,无空白空间,超细节,柔和均匀的摄影棚灯光,8K分辨率,超写实
奈何一直没文化,一句卧槽走天下,豆包站起来了,这效果真的很可以了。毫不夸张地说,Seedream4.5已经能达到Nano Banana pro 8成以上功力了。
Seedream升级到了5.0的时候,是不是已经能和王者平起平坐,未来可期,豆包加油!
视觉复刻提示词专家
末尾送福利的时刻到了,恭喜你能看到这里,免费喜提一个图片复刻工具。
每当看到不错的AI图片,最苦恼的事情是不知道怎么模仿复刻生成,没有提示词等于白瞎。
老马甚至看到有人在卖提示词,也是活久见,虽然一个提示词卖十块二十块的,但那也是韭菜的点滴血汗钱。
所以老马用秒哒搓了一个视觉复刻提示词专家的应用,上传一张图,自动分析该图的主体、风格、色彩、构图、光影等信息,最终生成专业的JSON格式提示词,以及常用的中文提示词,如图:
将分析生成的JSON格式提示词,或中文提示词,丢给Nano Banana Pro、豆包等AI生图工具,即可生成跟原图近似的图片,所以叫复刻。
工具无需注册完全免费使用,手机跟电脑的浏览器打开即可,网址如下:
https://app-82hkszor8d8h.appmiaoda.com
网址目前有点长,后期老马会统一整合在一个入口,访问就更加方便一些。
如果你是使用Nano Banana Pro生成图片比较多,那就用JSON格式的提示词,使用豆包比较多,那就用下面的中文提示词,如图:
工具使用还是比较简单的,大家自己体验一下就知道怎么操作了。
好了,以上就是今天的分享,欢迎关注、点赞、转发一键三连。有任何问题和需求,请在评论区留言,回见!


