让AI自动操作浏览器和软件更简单,OpenCLI桌面版了解一下

作者: admin 分类: 评论分析 发布时间: 2026-06-24 10:29

OpenCLI其实不算是一个新鲜的开源项目了,之前一直是以终端工具的形式发布,安装与配置上稍显繁琐,对新手小白不友好。

OpenCLI的主要作用是能把你已经登录的浏览器和桌面App变成命令行接口,前段时间行业内在吹捧一个概念,CLI就是AI Agent的最好接口。

OpenCLI让你在终端里一行命令就能操作B站、知乎、小红书、GitHub等100多个网站和Notion、豆包等桌面软件,特别适合让AI Agent自动帮你干活。

OpenCLI会复用你Chrome浏览器的登录状态去操作,不用重复输入密码登录、不怕封号,不依赖官方API,只要有网页界面就能变成命令行。

输出格式是标准的JSON/YAML,AI Agent拿到就能直接用,不额外烧Token,简单说就是给AI装了一双能操作全网的手脚。

但还是那句老话,老马一直建议大家能上Macbook就用上,因为在Windows系统上使用OpenCLI体验并不怎么流畅。

不过现在OpenCLI的桌面版本出了,起码安装配置上简单了非常多,对于小白用户入手算是降低了门槛,能跑起来再说。

OpenCLI相对于其它的浏览器自动化工具强大的地方是支持的网站操作命令很多,桌面软件也多,你能用AI实现自动化操作的空间就大了一些。

废话不多说,我们直接进入实际的安装与操作。这里提醒一句,如果你之前手动安装过OpenCLI的终端版本,则需要运行以下命令先去卸载掉:

npm uninstall -g @jackwener/opencli

因为OpenCLI的桌面版已经自带了,所以可能会产生冲突,卸载掉就完事了。相当于环境依赖和工具等问题,OpenCLI桌面版已经一键打包成安装包,只需安装即可全部搞定。

OpenCLI桌面版目前支持Mac和Windows系统,访问官网opencli.info/download 即可下载对应的系统版本安装包:

老马还是以Windows 11系统为例,为大家演示接下来的安装设置与操作体验。

OpenCLI桌面版的安装体验

把安装包下载到电脑桌面后,双击运行安装,由于未签名Windows的安全提示会弹出来,老规矩是点击更多信息,再点仍要运行就可以继续安装流程:

安装完毕,双击快捷方式运行软件,等了一会儿,老马发现并未显示OpenCLI的软件界面窗口,正纳闷着,看了一下右下角正在运行的软件,才发现已经是打开了,直接显示成了图标:

我们通过点击右下角的OpenCLI软件图标,在弹出的软件窗口中可以看到当前OpenCLIApp的状态。右上角有个设置的按钮,直接点击打开:

这时就会出现OpenCLI的设置向导了,我们只需要跟着向导一步步去完成安装和设置,最后就能正常使用OpenCLI,这里点击下一步:

首先检测的是CLI的入口,前面提到过了,如果你之前安装过OpenCLI的终端版本,需要先运行卸载命令去卸载。现在提示OpenCLI命令已安装,并且显示绿色通过,没问题,继续点击下一步:

安装Skiils是建议大家点击安装,这一步会给你的Claude和Agents目录下统一装上OpenCLI Skills,后面各种本地Agent在调用的时候就很方便。装完继续点下一步:

这一步会提示当前OpenCLI daemon不可达,你可以点击一下安装/修复CLI。接着是安装拓展,点击后会跳转到谷歌浏览器的拓展程序商店,需要开启神秘力量才能打开,然后点击添加到Chrome安装拓展程序:

如果没有神秘力量那这一步就比较麻烦,你需要访问OpenCLI的github仓库去下载拓展程序的压缩包,然后手动导入谷歌浏览器进行安装,github仓库地址如下:

github.com/jackwener/OpenCLI/releases/tag/v1.8.4

访问不了github仓库的小伙伴,老规矩给老马的公众号发送“github访问”获取方法。不知道如何在谷歌浏览器手动导入zip压缩包,安装拓展程序的,可以问一下豆包跟千问,这个没太大难度。

搞定了拓展程序,点击完成,会自动回到OpenCLI的软件概览界面。这里有可能还会显示某些地方存在问题,提示黄色异常,不过没有关系,你关掉后,重新在设置中打开,就会变全绿了,类似于刷新一下:

接着介绍一下这里面的OpenCLI能力,登录页面显示的是存储了你已经登录过的网站凭证,这意味着你不需要再重复去登录这些站点,同时可以设定每天中午12点,对这些登录过的站点进行一次轻量检查:

命令集合类似于一个仓库,收集了OpenCLI所支持的各种软件和网站命令。覆盖非常全面,你可以复制了命令之后,替换掉里面的变量直接运行:

不过大部分情况下你可能不会用到这些命令,跟Agent用自然语言去交流,让Agent自己去搜索和使用命令,比你自己手动去操作方便得多。

网页转Markdown的作用是你看见一个网页还不错,想保存下来,就可以把链接放到这里去转换。OpenCLI会通过浏览器自动操作的方式去抓下来,然后渲染成Markdown文档,方便你下载和复制:

功能界面则比较简单,这里有开机自启动,以及安装Skills,Skills的安装前面的引导设置页面已经提到过了,建议你去安装一下:

到这里,OpenCLI的基本安装和设置就算全部搞定了。下面老马使用QoderWork这款Agent,直接输入一句话提示词,使用OpenCLI打开B站去搜索Agent视频,并且点赞跟评论:

可以看到,由于前面我们已经安装过了OpenCLI的Skills,所以Agent都能正常地去调用,并使用OpenCLI去自动化操作浏览器,完成我们设定的任务。

对于一般的浏览器自动化和软件自动化操作,OpenCLI还是能够胜任的,当然这还跟你的Agent是否强大也有关系,其次是系统兼容性,流畅程度与操作快慢,这个就没法统一一个说法了。

老马的个人建议是把OpenCLI当成AI自动化操作的常备工具,在你不想去折腾RPA,又想把一些任务简单地实现自动化的时候,它还是可以用用的。

好了,以上就是今天分享,欢迎关注、点赞、转发一键三连。有任何问题和需求,请在评论区留言,回见!

对了,老马最近刚创建了一个AI学习交流群,有兴趣进群的小伙伴可以添加老马微信号:immajiabin,添加好友时备注:进群(不备注不通过)。

如果觉得我的文章对您有用,请随意赞赏。您的支持将鼓励我继续创作!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Protected by WP Anti Spam