听说最近不养龙虾不养马的人,都在玩这个Agent
坊间传闻是这么说的,现在不养龙虾不养马的人,都去玩一款叫PilotDeck的新Agent,Agent现在确实介绍不完。
每天都会冒出各种定位,各种工程侧重,还有各种吹牛逼的Agent,有些确实经不起把玩,产品本身做得不咋地。
但PilotDeck老马提前跑了一下,还好没翻车,主要是PilotDeck目前已经有了电脑桌面端,支持Mac跟Windows系统,正好介绍给大家认识一下。
PilotDeck是一个开源的AI Agent生产力平台,由清华大学THUNLP实验室、面壁智能等联合研发。
它想解决的不是让AI回答一次问题,而是让AI像一个长期合作的项目助手。能分项目工作、记住项目上下文、控制成本、后台持续干活,最后把成果落成文件。
你可以把PilotDeck理解成一个AI员工的工作台。普通聊天机器人更像一个临时窗口,你问一句,它答一句,上下文长了会乱,多个项目混在一起也容易串台。
PilotDeck的核心思路是把每个项目放进一个独立的WorkSpace,也就是工作舱。每个工作舱都有自己的文件、记忆和技能,A项目的信息不会跑到B项目里。
所以它更像是给AI Agent配了一个项目管理系统,而不是单纯再做一个聊天界面,主要核心卖点如下:
WorkSpace工作舱:项目之间不串台
每个项目都有独立空间,包括文件系统、记忆库和技能集。适合同时做多个项目的人,比如开发者、研究者、自媒体团队、AI应用创业者。
白盒记忆:AI记住了什么,你能看到
传统AI的记忆像黑盒,你不知道它为什么突然按某种风格写,也不知道它记错了什么。PilotDeck把记忆的生成、抽取、存储、使用过程都做成可见的,还支持手动修改和回滚。
智能路由:复杂任务用强模型,简单任务用便宜模型
它会根据任务难度自动选择模型。比如规划类任务用更强的模型,简单润色、排版、整理交给轻量模型,目的是降低Token成本。
还有一个很关键的能力:Always-on,你离开电脑后,它还能继续发现任务、执行监控、推进长周期工作,并把结果保存成本地文件和摘要报告。
下面老马将实际安装体验一下PilotDeck,差点忘了,贴一下PilotDeck的开源地址:
github.com/OpenBMB/PilotDeck
老规矩,访问不了github的,文末会放上网盘的地址,另外Watt Toolkit
这款应用去了解一下,老马安利过多次了。
PilotDeck的安装使用
下载完PilotDeck的电脑桌面端安装包,双击运行安装,以Windows 11系统为例,会有安全提示,照例点更多信息,仍要运行即可:
接下来就是正常的软件安装流程,一路确认搞定。双击快捷方式运行软件,第一次居然报了个莫名其妙的错误,难道是老马多次双击的原因:
没搞懂没复现,关闭掉错误窗口,重新再次运行,软件又可以正常打开了。默认只有一个大模型接入的设置页面,这里老马选择Custom自定义接入:
照例接入小米模型送的token,到现在还没蹬完。填写完大模型接入信息,可以点击Test Connection测试一下连接,没问题再点Save保存。
然后就可以顺利进入PilotDeck主界面了,由于初始化是英文的界面,因此按照经验,我们去找齿轮按钮,齿轮按钮默认就是设置,或者叫Settings:
把语言改成中文,这样操作起来就比较方便了。然后老马想建议大家的是,体验一款新的Agent产品,先看软件界面组件布局,每个区块都搞清楚所有的功能:
左侧的项目跟通用没啥好说的,类似于会话记录的分类文件夹。右侧的智能体,对应新建会话时聊天输入页面,切换到文件,可以展开看看每个目录的具体情况,比如记忆目录:
技能里面,PilotDeck并没有内置,你可以通过Clawhub商店安装,或者导入文件夹,自己写一个,三种形式去用上技能:
路由页面显示模型请求数、Token数、成本这些信息,仅作为一个看板:
记忆页面里面可以查看的内容就比较多,也比较详细了,比如通用记忆、用户画像、记忆追踪,默认开启自动构建,好像索引也是自动的:
常驻页面又是相当于一个看板,开头提到的Always-on,这里有一个仪表盘,显示今日事件、活跃项目和正在运行的项目,计划与定时任务也在此显示:
另外需要补充的一点就是设置界面,PilotDeck做得挺简洁细致的。大部分设置可以保持默认,有些细节的设置,等你真正用起来了再去微调,像模型池、智能体、MCP服务器、记忆、搜索等都在设置里面进行调整。
介绍完PilotDeck的电脑桌面端,下一步肯定是要跑一个实际的测试用例,看看这款Agent到底好不好用,完成任务的效果如何。
老马就随便写了一句话的提示词,开发一个前后端完整的手机小店,要求所有的流程跟功能都是完整的:
像这样的全栈项目,PilotDeck一上来就是一通严谨的规划,前前后后大概做了不少设计文档,当时老马忘了截图和记录。
整个开发过程是全自动的,因为PilotDeck默认是开启了完全访问权限。但有一点需要注意的,PilotDeck是完全在你本地跑的Agent。
它没有强隔离的安全沙箱,在执行任务的过程中,Windows系统频繁显示本地子进程执行命令时的命令行窗口。
什么意思呢,就是老是会弹出黑色的命令行窗口,在跑命令。跑完了就关掉,然后又有新的命令行窗口跑出来,一直到开发完成:
开发完成后,它还保持了一个常开的运行node.js服务后端的命令行窗口,并显示数据库已经初始化完成,本地访问地址是多少,下面是开发完成后的手机小店效果:
商品配图是随便生成的,因为没有实际的商品图片,整个手机移动商城的感觉出来了,挺完整。点击进入商品的详情页也是正常显示的:
小店商城的用户注册、登录功能同样是正常可用的:
然后是正常的挑选商品,补充收货地址,联系人和联系方式,下单购买:
最后这里走的是虚拟支付,没接真实支付接口,完成了订单的支付,进入等待发货的流程:
有一说一,小米mimo v2.5 pro模型的编程能力还可以,除了前端设计差了一点之外,功能上基本没报啥错误,属于完整可用的状态。
当然,这也搭配上了PilotDeck的Agent能力,前期规划时边界和功能考虑到位,执行任务时不跑偏不乱来,最终交付的成品就算是令人满意的。
第一版谈不上完美,但能一次性跑通整套电商流程的系统,这就值得肯定。缺点也是有的,PilotDeck的思考与执行速度不算快。
PilotDeck软件安装包网盘地址:
夸克:pan.quark.cn/s/044f44fea96d
UC:drive.uc.cn/s/674ac7c435374?public=1
迅雷:pan.xunlei.com/s/VOuq3MJ9-k7fizqTQ0wfAkfoA1?pwd=hr6m#
好了,以上就是今天的分享,欢迎关注、点赞、转发一键三连。有任何问题和需求,请在评论区留言,回见!
对了,老马最近刚创建了一个AI学习交流群,有兴趣进群的小伙伴可以添加老马微信号:immajiabin,添加好友时备注:进群(不备注不通过)。


