开源免费,却能叫板谷歌NBP?GLM-Image实测真相来了

作者: admin 分类: 评论分析 发布时间: 2026-01-15 16:27

说到谷歌的Nano Banana Pro(简称NBP),目前还没有超越者。

能赶上或者平替的模型都基本没有,之前给大家测试过的阿里Qwen-Image系列也是如此。

NBP是闭源的商业模型,生图的成本相对较高,平均都得七八毛一张。

当然,不同分辨率图片的成本不一样,但今天有一个生图成本只需一毛一张的开源模型来了,如图:

它就是刚刚上市不久AI第一股智谱出品的GML-Image模型,联合华为昇腾、昇思 MindSpore 开发,基于国产算力。

简单地说就是纯纯的国产模型,而且在文字渲染的权威榜单中达到开源 SOTA(当前最高)水平。

采用“自回归+扩散”混合架构,结合大语言模型的理解能力与扩散模型的绘画精度。

拿跑分来讲,GML-Image在写汉字方面的能力以略微优势超越了NBP,有点难以置信。

昨天老马在测阿里的Qwen Image 25.12模型时还说,国产的模型居然中文都干不过NBP这种老外模型。

现在看来,GML-Image好像有希望了,不过跑分仅供娱乐,能不能打,测过才知道。

下面老马将从人像风景、海报信息图两个维度入手,实测一下GML-Image的表现,让大家感受一下效果。

目前在线体验GML-Image可以登录智谱AI的开放平台:https://www.bigmodel.cn,在右上角点击注册登录即可,如图:

登录后,首页正中间第二个模型就是GML-Image,点击进入体验网页,整个对话框为文生图的操作,可以调整图片的分辨率参数,如图:

当前智谱的体验网页无法上传参考图进行图生图,模型本身是支持的,技术大神们可以自行去折腾一下代码模型,开源地址:

GitHub:https://github.com/zai-org/GLM-Image

Hugging Face:https://huggingface.co/zai-org/GLM-Image

魔搭社区:
https://modelscope.cn/models/ZhipuAI/GLM-Image

废话不多说,下面直接开测。

人像风景

老马个人比较习惯用Json格式的提示词,当然下面给到大家的提示词都是转成了纯中文文字的。

接下来就是生成效果图+提示词的方式演示,不再一一赘述,末尾再点评一下。

差点忘了说个小细节问题,使用智谱AI开放平台体验GML-Image的生图,智谱默认是没有送你免费体验的资源包。

因此需要自行充值去开通资源包,提交了提示词之后,就会提示你余额不足或无可用资源包,请前往充值,如图:

点击前往充值,第一眼看到的就是充值100起步的页面,不要被吓到,在左侧菜单点击“资源包管理”,然后就能看到一个GLM-Image 3折尝鲜包,只需花5.9元购买开通即可,如图:

开通资源包前需要先实名认证,开通后可以获得200次GLM-Image生图,有效期3个月,体验玩玩一般也足够了,如图:

慢着!有小伙伴可能又会问了,不是说开源免费么?怎么还要充值购买资源包。

其实很好理解,充值购买资源包,就跟你充值API接口的资源余额一个道理,体验生图的时候,调用的是智谱的API,使用的是智谱的服务器算力。

如果你懂得自己本地部署GLM-Image的代码和模型,使用自己电脑显卡等硬件资源去运行生图,那自然是完全免费的。

再补充个小细节,智谱开发平台上体验生图是可以去掉水印的,这样生成的图片就不带AI生成水印,前提你得先实名认证,然后在网页底部可以看到水印管理,点击进去申请即可,如图:

OK,搞定资源包之后就可以开始生图了。

严格参考指定参考图,人物面部特征强制完全复刻,发型、服装、鞋履的长度、颜色、质地、款式必须精准克隆,不得有任何修改,发型不佩戴头饰,一致性权重拉满。
画面主体为与参考图完美匹配的女性,采用极高角度鸟瞰全身镜头,搭配重度广角畸变效果,营造出头部比脚部更大的视觉反差。人物自信站立在崎岖山峰的最高点,右手举到眼睛附近,清晰比出 V 字和平手势,肩膀略微驼背,适配俯视视角的透视缩短效果;人物抬头看向镜头,眼神明亮友好,脸上带着俏皮可爱的笑容。
场景设定在岩石嶙峋的高山之巅,背景是明亮的自然日光,脚下环绕着柔和的云层,远处天空中巨大的云层清晰排列拼出 “BeautyVerse” 字样,悬停在山脉上方。整体氛围雄伟壮丽,充满冒险精神,兼具超现实元素。
画面风格为带超现实主义元素的户外探险摄影,使用超广角镜头从高空俯拍,突出山峰的高耸感;分辨率达到 8K,岩石纹理与衣物面料的编织细节极致清晰,画面比例设置为 3:4
一、主体与动作1 人物:年轻女性,清冷气质,半身近景,身体侧向右侧,回眸直视镜头2 表情:眼神锐利克制,略带疏离与忧郁,嘴唇微抿3 头发:乌黑长发,蓬松凌乱,强风吹拂,发丝大幅飘起并掠过脸颊4 妆容:暖棕眼影与微红眼周,睫毛清晰,哑光红唇,肤质通透5 服饰:深色细肩带衣裙或上衣,肩颈与锁骨露出,外侧有深色薄纱或外搭下滑形成暗部包裹二、构图与镜头1 画幅:竖幅2 景别:胸口以上的半身近景,三分之二侧脸3 位置:人物偏画面中右,头顶留少量空间,左侧留出光源与雾化区域4 视角:平视或略微仰视,镜头距离较近但不夸张变形5 对焦:焦点落在眼睛与面部,背景强虚化,整体带轻微柔化与朦胧感三、光线与氛围1 主光:左后方强逆光,形成发丝与肩部的明亮轮廓光2 补光:正面极弱柔光,仅提亮面部细节,阴影保留3 光质:散射柔光,明显雾化光晕,带空气感与轻微眩光4 氛围:梦幻、神秘、安静、电影感、带一点冷感与孤独感四、色彩与质感1 色调:背景冷灰偏蓝,肤色偏暖,形成冷暖对比2 饱和度:整体低饱和3 明暗:对比偏高,暗部压低,高光柔亮不过曝4 质感:皮肤细腻自然,轻微颗粒与雾面感,边缘高光带光晕五、背景与环境元素1 背景:暗灰到黑的渐变空间,无明确场景信息2 光点:背景与发梢周围有零散点状光斑与闪烁颗粒,类似尘埃反光或微小光粒3 动态:风带动发丝飞舞,光点呈漂浮散落的层次感六、风格与后期1 风格:唯美写实,梦幻柔雾,电影海报质感2 后期:增强轮廓光与发丝高光,提升雾化与空气透光感,轻微褪色,暗角收束画面3 清晰度:眼部与唇部相对清晰,其余区域柔化过渡,整体通透但不锐利七、反向提示1 人物错误:不要脸部畸变,不要五官错位,不要双脸,不要多余肢体,不要手指异常,不要不自然的皮肤塑料感2 光影错误:不要正面硬光,不要强烈死白高光,不要背景过亮抢主体3 风格偏差:不要卡通化,不要漫画厚涂感,不要夸张霓虹色,不要过度锐化与过度磨皮
这是一幅垂直构图的现代中国山水画,融合了数字艺术风格,在有质感的纸面上呈现出水墨和笔触的纹理。画作采用深远透视,视线穿过一条峡谷般的山脉,顶部留有极其大量留白(负空间)。高耸的山峰以鲜艳的深蓝、青色和黄绿色渲染,山顶有显著的金色点缀,它们矗立在一条宽阔、蜿蜒的蓝色河流两岸,河水带有风格化的白色波浪和涟漪图案。一艘带有深色船体和桅杆的小型传统木制帆船正沿着河流中心航行。在远处的群山之间,可以看到一个小小的红日圆盘。整体色彩以蓝、青、绿和金色为主,营造出雄伟、宁静、神秘且广阔的氛围,将古代美学与当代手法完美结合。 极其震撼的一幕,视觉冲击力强,光影彼此交织错杂的梦幻感,朦胧,阴影过渡自然,电影级构图,视觉冲击,8K画质,超清,极致细节,清晰的线条,高对比,大师级别的作品。立体渲染,超细腻笔触,线条流畅,超清画质,完美品质,高质量,自适应饱和度,专业级打光,大师杰作,自由视角,阴影过渡自然,氛围感,高级感,意境,亮闪,唯美,宿命感拉满,弥散粒子,画面具有层次感。视觉冲击大,故事感,高级感,动态感。震撼,大师构图震撼人心。空灵 右下角点缀竖式小字中文瘦金体“东方美学”,其旁有极小英文“CHINESE ART”及极小的红色印章设计。
实拍摄影,8k画质 天高,白云一片一片,冷色光影与暖色调阳光形成鲜明对比,暖光变得愈发温柔,透过稀疏的秋叶,洒下斑驳且温暖的光影,光影的冷暖交织营造出一种既不燥热又惬意十足的氛围,中式诗意,大师级构图,唯美。

经过几十张图测试下来,发现GLM-Image支持的风格很少,除了写实跟手绘,其它的3D、极繁、涂鸦、壁画等很多风格都生成不了,甚至有些风格是属于凑合生成的。

这意味着一些酷炫玄幻的图片是无法达到预期生成效果的,当然写实人像风景的效果自然是不错的,中国水墨风格跟文字也生成到位。

可能GLM-Image的能力突出点还是在于中文文字的生成,所以还是期待一下海报、封面、信息图这些图片的生成效果。

按照国际惯例,老马还是会拿之前在NBP生图的提示词,来拷打一下GLM-Image。

海报信息图

拼贴活力风格,以绿色为主色调,打造 “寻觅探店搭子!” 主题海报。加入美食、咖啡杯、潮牌店元素与趣味 emoji;大标题用黑绿撞色字体突出 “寻觅探店搭子”,搭配蓝色标签 “三天两夜 逛吃长沙”;画面嵌入两位年轻人互动场景:一位穿潮 T 打卡网红店,一位着复古裙试吃小吃,背景是长沙地标街景。右侧设置黄色气泡 “吃喝不踩雷!”;下方列出卖点标签 “网红小店 深度打卡”“美食地图 专属定制”“搭子同好 逛吃自由”;整体延续夸张字体、装饰箭头与搞怪图形,突出探店搭子的美食社交乐趣,保持系列化的绿色系活力拼贴设计语言。
立冬节气主题的海报,整体采用分层的季节过渡风格,以白、灰、橙为主要色调,展现出秋尽冬来的时节变化与氛围感。画面最上方是浅灰色的天空,云层厚重,营造出冬日的清冷感。上方有大号的白色 “WINTER COLD” 英文,字体朦胧且富有层次感,传递出冬日的寒意。画面中央是黑色的 “立冬” 书法字体,字体旁标注 “WEDNESDAY” ,清晰点明节气时间与主题。画面主体是分层的山林景观,上层是被白雪覆盖的远山,山体巍峨;中层是色彩斑斓的秋林,树木呈现出橙、黄、绿等过渡色彩;下层是橙黄色的水杉林,树木倒映在平静的湖面上,形成对称的美景,生动展现了秋尽冬来的季节交替。画面下方是黑色的英文 “BEGINNING OF WINTER” 中文“立冬时节始凛寒”,字体简洁,点明节气的时节特点。“LAOMA DESIGN”英文小字居中显示。整体构图通过分层山林、湖面倒影和节气文字,营造出立冬时节秋尽冬始、冷暖交织的过渡氛围,细节丰富且富有视觉层次与季节韵味。
手帐风格,标题“香菇烧鸭”,出一个香菇烧鸭制作步骤过程教程图,步骤说明要清晰,中文字幕,最后展示成品图
插画形式,使用图标+文字,用一幅图介绍绿茶诞生全流程,信息图科普
为我生成鸡兔同笼的详细解说图,配上详细的中文知识解析,整体风格适合儿童教育
创建一个"中国古代官服品级制度可视化拆解"的历史图谱风格信息图,16:9横向构图。采用古代典章图式美学,使用古籍插图风格绘制。画面展示清代九品官员的官服差异对比,从左到右按品级排列:一品到九品共9个官员立绘人物。每个人物上方用工笔画标注"补子纹样"(一品仙鹤、二品锦鸡、三品孔雀...九品鹌鹑,文官用飞禽、武官用走兽),用放大镜特写补子刺绣细节。人物下方标注"朝珠材质"(一品东珠、二品珊瑚、三品蓝宝石...等级递减)、"顶戴花翎"(红宝石/珊瑚/蓝宝石/水晶等,用颜色色块区分)、"蟒袍图案"(九龙/五爪/四爪,用图示说明龙爪数量差异)。画面上方是"品级识别速查表":用表格对比9个品级在补子、顶戴、朝珠、蟒袍、腰带等5个维度的差异,每格用小图标+文字标注。画面下方是"历史冷知识":标注"为何文官用飞禽武官用走兽"(文职需高飞、武职需勇猛)、"花翎的政治含义"(赏戴花翎是皇帝恩宠)、"服色禁令"(平民不得穿黄色明黄)。底部用时间轴展示"历代官服演变":汉唐宋元明清的官服风格变化缩略图。所有文字用中文:顶部用小篆字体"官服品级图谱:穿在身上的权力密码",底部标注"服饰制度是封建等级的可视化呈现"。配色使用官服传统色。整体呈现历史制度和服饰文化,适合历史教育和文化研究。

怎么说呢,简单的文字海报跟信息图啥的,GLM-Image在中文文字生成方面是过关的,如果提示词复杂、或者文字笔画复杂的情况下,则会出现文字乱码扭曲现象。

再者其最终生成图片的画面表现力、信息丰富程度上还是不如NBP,整体显得清汤寡水,没有设计的美感,更谈不上惊艳。

想要平替NBP,那自然现在是不够格的,也别听有些AI自媒体博主瞎吹,贴出来的效果图要么是官方的,要么是多次抽卡的,没有实际意义。

一旦你真正去上手做项目用图,就会发现哪哪都膈应。这也要求国产模型需要戒骄戒躁戒吹,脚踏实地好好干,别动不动全球首个第一,干掉这个平替那个的。

好了,以上就是今天的分享,欢迎关注、点赞、转发一键三连。有任何问题和需求,请在评论区留言,回见!

如果觉得我的文章对您有用,请随意赞赏。您的支持将鼓励我继续创作!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Protected by WP Anti Spam