老板AI应用课:一分钟学会免费用AI采集数据

作者: admin 分类: 评论分析 发布时间: 2025-07-29 18:11

假如我们需要采集一些网页上的数据,一般情况下可以代码编程,这对于普通用户来说门槛较高,也可以使用诸如八爪鱼、后羿这些采集器。
但采集器的配置和一些逻辑规则的设计,还是略显复杂。那有没有特别适合小白,只需鼠标点点,或者写一句话的要求,就能完成数据采集的AI工具呢?
有的!它来了,虽然它界面不支持中文,但并不影响我们在英文环境下使用,而且还是免费的,只需安装一个浏览器插件即可。

这款AI数据采集工具,是老马目前见过最简单的工具,它凭借可视化的操作,AI对话式的请求交互,让一个普通人都能轻松获取到自己想要的数据,如图:

由于安装这款插件需要魔法上网,考虑到有些小伙伴没有条件,老马已经将该插件提前打包好,大家只需要用以下地址,打开浏览器访问下载到电脑桌面上即可。

www.majiabin.com/1.9.1_0.crx

浏览器的话建议大家使用谷歌浏览器,或者搜狗、QQ浏览器也行,360浏览器的话,需要切换到极速模式,没记错的话,兼容模式是IE内核,极速模式才是Chrome内核。

好了,下一步我们先来安装这个插件,也叫扩展程序。

1、安装Chat4data浏览器插件

下载好Crx的插件文件后,老马这里以谷歌浏览器为例,我们点浏览器右上角的“拓展程序”按钮,一般在地址栏的右边,类似一块拼图的按钮,有些浏览器叫工具,或者第三方插件。
然后再点击“管理拓展程序”,或者“我的工具”,就能够进入管理界面,这里会显示你所有安装过的浏览器插件,我们需要找找“开发者模式”,将其打开,如图:
打开后,我们将浏览器窗口缩小一点,界面还是保留在当前的管理界面,接着把刚才下载的Crx插件文件,鼠标点击按住,拖进来管理界面,就可以自动安装成功了,如图:
安装成功后,插件会变成一个卡片,右下角的开关按钮默认是打开的状态,这样就可以了。
回到浏览器的右上角,还是在地址栏的右边点击那个拼图的按钮,就能够看到已经安装的插件列表,其中就有刚刚安装成功的Chat4data,如图:
下一步,我们需要在列表中,点击Chat4data插件,再点击Login进行登录,登录时不要点头部的Log in with Google,而是选择Don’t have an account?Sign up,先注册一个账号,如图:
注册很简单,输入你的邮箱,你设置的密码,继续就行,注册完再去Login登录即可,登录后的状态就跟一般的AI聊天窗口一样,我们只需要输入网址和提示词要求就可以开始数据采集了。
2、使用Chat4data采集淘宝竞品数据

老马这里就以采集淘宝上的商品为例,假设要采集一些颈椎按摩器竞品的数据。我们先登录网页版淘宝,搜索关键词“颈椎按摩器”,打开了商品的列表,如图:
淘宝的搜索结果默认显示有100页,我们这里假设需要采集商品的标题、价格、售卖店铺的名称这三项数据。在当前的淘宝搜索结果页面,右侧也已经显示了Chat4data插件的操作界面。
 
所以,接下来我们有两种操作选择,第一种是在浏览器地址栏,复制一下淘宝搜索结果的网址,在Chat4data的聊天窗口发过去,插件就会进行分析。
 
第二种是直接在右边的Chat4data插件中,点击“Extract data from the current webpage”,插件会针对当前所打开的淘宝搜索结果网页,自动进行分析,如图:
老马就选择第二种,稍等片刻,会分析出来几个网页的结构,比如有内容部分,底部部分,导航栏部分,我们把鼠标移动到这几个部分的内容选项时,页面该内容部分就会显示蓝色,如图:
所以这里我们就选择“content”内容部分,点击一下就行,再稍等片刻,Chat4data会继续分析出来更多的内容部分,你是要采集标题,还是价格、还是商品图片什么的。
 
同样道理,我们把鼠标移动到这些内容选项上时,页面对应的内容部分就会显示蓝色。而每个选项的右边都有一个垃圾桶的删除按钮,你只需要把不需要采集的内容选项删除掉,留下需要的即可,如图:
上面每个内容选项对应的英文单词,老马相信只要英语不是太差的小伙伴,都大致能看懂是什么意思,比如product_image就是商品图片,这里我们不需要,就点垃圾桶图标删除。
最后,我们注意一下,下面有个带箭头的选项:“Confirm selection”,就是确认选择的意思,我们点击确认采集即可。
 
再再稍等片刻,Chat4data就会给我们列出一部分的采集数据表格效果,以及询问我们需要采集多少页面,比如老马这里只需要采集10页,就点击“Extract 10 pages”就行,如图:
如果你是要采集50页,那么就在下面的输入框里面输入“Extract 50 pages”发送过去,老马测试过,你发中文提示词过去也行的,比如“采集50页”,最后点击“Start extraction”即可,如图:
接下来,插件就会自动滚动你的浏览器网页页面,自动进行翻页,自动进行采集,你要做的就是把浏览器缩放到一边不动它,喝杯咖啡抽根烟,坐等采集完毕。
 
最终采集完的数据会形成一个Excel表格,选择“Export data”导出数据即可。导出完的Excel表格,你可能需要修改的是表头,把英文改成中文,毕竟你看得懂是什么意思,团队小伙伴可不一定,如图:
怎么样?够简单吧。而且老马上面说了,你跟Chat4data进行对话,发送的提示词是中文的也没问题,虽然它的界面和回复是英文的,大致都能看得懂意思,实在看不懂的,就复制一下用百度翻译。
 
好了,以上就是今天的分享。有任何问题或需求请留言,回见!

如果觉得我的文章对您有用,请随意赞赏。您的支持将鼓励我继续创作!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

Protected by WP Anti Spam