用WorkBuddy部署RSS订阅服务,实现微信公众号文章搜索获取保存
很多小伙伴一直都想着有一个工具,或者一种方式,能够搜索到指定的微信公众号下的文章,进行订阅或者获取保存为本地文件。
就目前来说,微信开放的入口只有一个,以前什么搜狗微信搜索那些都失效了。这个入口就是微信公众号平台,使用你自己的公众号进行登录。
随意新建一篇文章,在编辑页面上点击超链接,就会出现一个链接内容,选择账号之后输入公众号的名称进行搜索,搜索出来的结果就是文章列表:
但这种操作有点繁琐,每次获取到的列表中显示的文章也不多,只能不断翻页。其次是无法导出,点击查看文章也只能是跳转到独立的文章链接页面。
因此今天老马就要给大家介绍一个开源项目,它等于是把上面的操作封装成了一个API,虽然也需要你扫码登录自己的公众号,但是功能和操作上强大了很多。
这个项目叫:WeChat Download API,它是一个微信公众号内容抓取与RSS订阅服务,提供RESTAPI,解决官方不支持RSS、难批量获取的问题。
开源地址如下:
github.com/tmwgsicp/wechat-download-api
核心功能按官方的介绍大致如下:
RSS订阅:订阅任意公众号,自动定时拉取新文章(包含完整文章内容和图片),生成标准RSS 2.0源,接入FreshRSS / Feedly等阅读器即可使用。
文章内容获取:通过URL获取文章完整内容(标题、作者、正文HTML / 纯文本、图片列表)。
Markdown导出:把已抓取文章导出为markdown(带YAML frontmatter,图片走代理可直接渲染),可导入Obsidian / Logseq;支持按时间游标增量同步全部文章。
反风控体系:Chrome TLS指纹模拟 + SOCKS5代理池轮转 + 三层自动限频,有效对抗微信封控。
文章列表 & 搜索:获取任意公众号历史文章列表,支持分页和关键词搜索
公众号搜索:按名称搜索公众号,获取FakeID。
公众号主体信息:获取公众号认证主体、认证状态、原创文章数等详细信息。
扫码登录:微信公众平台扫码登录,凭证自动保存,4天有效期。
图片代理:代理微信CDN图片,解决防盗链问题。
Webhook通知:登录过期提醒(提前24h/6h预警+已过期通知)、触发验证等事件自动推送(支持企业微信机器人)。
API文档:自动生成Swagger UI / ReDoc,在线调试所有接口。
它这里面的主要RSS服务,是可以一键部署起来的,比如Docker或本地部署,其它的大部分操作都需要通过调用API。
所以今天老马不介绍手动部署和调用的操作方法,而是请出咱们非常熟悉的AI Agent工具WorkBuddy,来协助我们完成部署跟调用的操作。
好久没用WorkBuddy了,现在打开一看功能强大了很多,但小Bug问题也依旧不少,动不动地报错,白屏偶有出现,好在重启后可以正常运行。
下面老马就直接使用WorkBuddy来进行实操演示,没有安装过WorkBuddy的小伙伴可以去搜索安装一下,像新用户可以领取额度,做做任务也可以领取,基本上日常轻度使用的。
WorkBuddy部署使用WeChat Download API
安装完WorkBuddy之后,我们登录自己的账号进行使用。建议在电脑桌面新建一个文件夹作为工作空间,比如老马这里新建的文件夹叫weixinapi。
然后在对话框中,输入下面的提示词,权限调整为完全访问权限,工作空间选择刚才新建的文件夹,把提示词发送过去即可:
帮我在本地工作空间部署这个项目,不要使用docker的方式,仅使用本地的方式,部署后,引导我启用该项目,项目地址:github.com/tmwgsicp/wechat-download-api
很快WorkBuddy就开始干活了,老马个人感觉其响应和处理速度比QoderWork快多了:
基本上等待个两三分钟,WorkBuddy就帮你把整个项目以本地部署的方式搞定了,你只需要根据它的提示进行下一步操作即可:
如下图所示,WorkBuddy除了帮老马把整个项目的代码拉取到本地进行部署之外,还写了一个启动服务.bat的一键运行脚本文件,双击打开运行就行了:
运行后会出现一个命令行窗口,这个窗口不要关闭掉,窗口中显示了
WeChat Download API网页控制台的网址,我们复制后使用浏览器打开:
打开后就能看到简洁的网页控制台面板首页了,这里可以先点击去登录,通过扫码的方式,登录一下我们自己的公众号:
登录完毕后,会显示当前登录正常的状态。一般来说,登录状态会保存4天,4天后就得重新去扫码:
我们点击RSS订阅,进入管理界面,在这里就可以搜索你想创建订阅的微信公众号名称,比如老马搜索的机器之心:
在列表中选择要订阅的公众号,点击订阅,在下面我的订阅里面就会出现当前已经订阅的账号列表。默认是显示只有0篇文章的,你可以点上面的立即轮询,获取一下最新文章:
接着我们回到控制台面板首页,点击分类管理,创建一个AI文章的分类,方便我们归类自己订阅的公众号:
最后再回到RSS订阅管理页面,找到我的订阅列表,比如老马只订阅了机器之心一个公众号,在右侧就可以归类到AI文章的分类里面:
在历史文章功能的页面中,我们可以针对当前已经订阅的公众号,获取它以往所有的历史文章,比如老马这里获取了一下机器之心100篇的历史文章:
切记不要频繁获取,间隔一段时间去操作。比如某个公众号历史文章有1000篇,你就分10次,每次获取100篇这样去操作,已存在的历史文章不会重复保存的,避免受到微信的限制。
回到RSS订阅页面,在我的订阅里面复制一下订阅链接,就可以添加到你的RSS订阅器里面,去进行查看和浏览阅读了。
当然这里老马并没有在电脑上安装任何RSS订阅软件工具,干脆通过一句话提示词告诉WorkBuddy,让它帮忙写一个本地订阅的工具,提示词如下:
我现在已经有了这样一个rss订阅地址,但是我没有安装rss订阅器等工具,我希望能直接使用这个rss订阅:localhost:5000/api/rss/xxxxxxx
提示词中,后面的订阅地址,记得改成你自己的,提交后很快WorkBuddy就用Python写代码干活了:
很快一个本地网页版的RSS订阅器就搞定了,打开看了一下,效果还行,基本上算是功能十分简单的在线订阅器:
搞定了订阅了,小伙伴们最关心的还是如何把一个公众号的文章全都获取下来,保存成MarkDown文档,后期可以导入到Obisidian这类知识库中,这时就需要用到API了。
当然,我们自己手动去操作调用API还是有点繁琐和门槛的。还是照例写一句话提示词,让WorkBuddy去帮我们操作,直接导出来就完了:
根据这个本地的api文档,帮我把订阅的公众号文章导出成markdown文档:http://0.0.0.0:5000/api/docs
稍等片刻,WorkBuddy会去仔细阅读API文档的要求,然后查看我们当前订阅的公众号,最后操作调用API导出成MarkDown文档:
可以看到,基本上老马刚才订阅的机器之心,获取到的100篇订阅文章,都被导出成功了,而且MarkDown文档里面的原文显示都是正常的。
可能有些小伙伴觉得,这里面公众号文章内容里面的图片没了。没关系,进一步要求WorkBuddy帮你导出的时候,保留微信自己的图片URL地址。
还有就是不想导出成MarkDown文档的,想导出为PDF,Word之类的文档,也是一句话的事情,告诉WorkBuddy帮你处理,或者转换格式即可。
通过以上操作我们就可以知道,以前需要懂一点技术基础才能部署的github开源项目,现在借助WorkBuddy这样的AI Agent都能轻松跑起来。
过程中遇到问题,直接把问题反馈给Agent,继续完善改进,对小白用户来说算是零门槛了,因此不要担忧和惧怕什么,有问题交给AI去处理。
好了,以上就是今天的分享,欢迎关注、点赞、转发一键三连。有任何问题和需求,请在评论区留言,回见!
对了,老马最近刚创建了一个AI学习交流群,有兴趣进群的小伙伴可以添加老马微信号:immajiabin,添加好友时备注:进群(不备注不通过)。


