装上Kimi WebBridge,让你的龙虾跟马也能自动化操作网页
本地Agent的自动化操作,老马之前也分享过一些了,比如这个装上这双眼睛,让你的OpenClaw和Hermes也能自动浏览网页。
凡是涉及到网页自动化,或者软件自动化的操作,像让小龙虾和爱马仕去实现的话,无非两种思路,一种是视觉,另外一种是分析代码。
视觉很好理解,打开一个网页后截图,再丢给本地Agent接入的多模态模型,去分析网页上的每个元素,哪个是A按钮,A按钮上面是什么文字等等。
这个比较考验大模型的多模态能力,目前来说国内的豆包跟Kimi这方面能力还不错。Deepseek v4也具备多模态能力,老马没测过,不好评价。
视觉还有另外一种方式,就是框定网页和软件的坐标位置,这个用在手机上比较多,手机的分辨率跟APP启动后,坐标是相对固定的。
不像电脑,你打开个软件后,还可以缩小窗口,再把软件在屏幕上拖来拖去,这就比较影响坐标的判断,而我们熟知的RPA(机器人自动化流程)。
也会用到大模型的多模态跟坐标的方式去判断软件GUI界面上的按钮,或者网页上的按钮,当然第二种,通过UI控件属性去识别定位元素,可以称之为分析代码。
这跟今天老马要介绍的一款谷歌浏览器自动化插件就很有关系了,它主要采用的是第一种大模型多模态的方式,让本地Agent实现操作网页的。
老马也是偶然刷到Kimi官方推出的这款叫Kimi WebBridge(Kimi 网页桥)的插件,或者叫网页自动化插件:
安装十分简单,电脑浏览器访问:
www.kimi.com/zh-cn/features/webbridge,就可以看到插件的介绍和安装教程。
既然是Kimi推出的插件,那自然来说搭配Kimi的大模型,效果是最佳的。因此,如果你的小龙虾跟爱马仕此时接入的正好是Kimi的K2.5,那最好不过了。
Kimi K2.5本身是原生多模态的,K2.6也一样,剩下的就是你电脑上安装的默认浏览器得是谷歌的,虽然其它谷歌内核的浏览器理论上也支持。
但避免折腾太多,老马推荐还是安装使用谷歌浏览器。Kimi WebBridge已经介绍清楚插件的安装步骤了,下面还是重复一下。
尤其是演示一下装完Kimi WebBridge插件之后,自动去操作网页的效果到底如何,这个是大家比较关心的点。
Kimi WebBridge插件安装与使用
如果你有条件的情况下,安装Kimi WebBridge的谷歌浏览器插件,可以直接点击前往浏览器应用商店进行安装。如果没有条件就点击手动安装,下载插件的Zip压缩包:
以windows系统为例,下载完压缩包,解压一下,建议是放到电脑桌面上。然后打开谷歌浏览器,在浏览器地址栏输入以下命令:
chrome://extensions
打开谷歌浏览器的扩展程序管理页面,看一下右上角的开发者模式有没有打开,没有打开就点击打开一下。左侧有一个“加载未打包的扩展程序”按钮:
点击“加载未打包的扩展程序”按钮,选择刚才已经解压到电脑桌面的插件文件夹,进行导入即可:
导入插件成功,在扩展程序页面就能看已经安装成功的Kimi WebBridge浏览器插件了。接着右上角找找一块拼图的按钮,点击会显示当前已经安装的拓展程序列表,找到Kimi WebBridge把它固定一下:
这样Kimi WebBridge插件就会直接显示在浏览器的菜单栏上了,下一步是回到Kimi WebBridge的官网,我们需要复制一下安装命令:
Windows跟Mac系统的安装命令不一样,老马也分别给大家复制过来了,如下:
Mac安装命令:curl -fsSL
https://cdn.kimi.com/webbridge/install.sh | bashWindows安装命令:irm
https://cdn.kimi.com/webbridge/install.ps1 | iex
复制以上命令,无论你是通过小龙虾和爱马仕接入的QQ机器人、飞书机器人,还是命令行终端,网页版控制台都可以,发送过去,让小龙虾和爱马仕自己去安装:
老马的小龙虾是接入了QQ机器人,因此通过QQ把Windows的安装命令发送了过去,小龙虾第一次要确认运行命令的权限,确认后很快就安装完成了。
到这里Kimi WebBridge插件就算是全部安装配置成功了。到底好不好用,老马当然要测试一下,所以写了一句提示词,让小龙虾打开豆包的网页版,生成一张蜡笔小新的图片,并保存到电脑桌面:
最终任务顺利完成,有一说一,Kimi WebBridge是通过截图丢给多模态模型去分析,再进行网页自动化操作的,所以响应速度不是很快。
此外,比较考验你接入的模型能力,有时候第一次不成功的情况下,你还得指出问题所在,比如没有发送提示词,让它再次去尝试。
谈不上完美,但能用。越复杂的网页自动化操作,所消耗的时间跟token肯定就越多,所以用与不用,取决于你。
好了,以上就是今天的分享,欢迎关注、点赞、转发一键三连。有任何问题和需求,请在评论区留言,回见!
对了,老马最近刚创建了一个AI学习交流群,有兴趣进群的小伙伴可以添加老马微信号:immajiabin,添加好友时备注:进群(不备注不通过)。


