现在你可以“训练”自己的AI了,阿里通义千问上线长期记忆功能
以前老马经常听到群里有些小伙伴说,我给Deepseek投喂了很多知识资料,我在训练Deepseek。
这种小白对于大语言模型训练的误解,一直被很多所谓的AI导师在抖音9.9的AI课程上传播。
想训练Deepseek模型,一般就是微调,多少需要点机器学习基础和技术知识,正常我们跟Deepseek对话,不是在训练模型。
在Deepseek的一个对话窗口中,我们对模型每次提问,模型的每次回答,统称为上下文(譬如一整篇文章)。
上下文有长度限制的(上下文窗口),超过了模型就记不住了,你再去提问,模型就忘了上面的问题跟答案。
其次,当你新建一个全新的对话窗口,之前老的对话窗口里面的所有上下文,模型也是不会有记忆的,这就是短期记忆。
当然,有些AI智能体在处理复杂任务的时候,会有一个中期记忆,即把记忆先放在一个地方暂时存储起来,完成任务之后再丢掉。
总的来说,都是没有长期记忆的,也就是无论你投喂多少知识,多少内容给模型,都不会被记住,更谈不上训练,让模型学会这些知识。
再补充一点,模型的知识来源,一个是在训练阶段时候学习到世界知识,这些知识量很庞大,学完之后,就不会再更新了。
除非你重新训练,或者微调训练模型,往里面更新或插入增加新知识。另外一个就是外部知识,比如RAG,等于接入一个外部知识库。
那么,对于普通的AI用户来说,模型的知识来源是恒定的,如果跟模型的对话习惯,以及投喂给模型一些知识,有没有办法被记住呢?
答案是肯定有的,比如近期阿里通义千问已经上线了长期记忆功能,这个功能未来很多大语言模型应用产品都会推出的,包括豆包啥的,属于标配,如图:

1、注册使用
通义千问官网地址:https://chat.qwen.ai,注册和使用就不再多讲了,老马之前也介绍过,相信很多小伙伴都用过了。
千问的长期记忆功能默认是开启的,在网页的左下角点击自己的头像,进入设置,选择个性化即可看到,如图:


目前保存的记忆项目最多支持50个,老马猜测应该是50个对话窗口的意思,这个量对于一般用户来说也足够了。
长期记忆功能主要包含三大特点,一是记录你的对话中的关键信息,包括你的个人偏好、提问习惯、重要细节啥的,等于为你搭建自己的个人知识库。
二是在后续的聊天对话中,会去主动调用以往的历史信息,你无需重复说明你是一个律师,或者什么其它的角色设定,背景信息啥的。
三是基于历史信息的记忆积累,千问会给你量身定制的回复,你是喜欢专业严谨的回复,还是简洁直接切中要点的回复,千问都会学习并记住。
这就像老马前面说的,现在你可以“训练”自己的AI了,一个真正记得住你说过的话,教过的知识,并且熟悉你的喜好,了解你需求的AI大语言模型。
2、实测检验
老马这里就不通过长期的使用,去实测检验千问的长期记忆功能了,简单点的测试方法就是,在一个窗口中跟模型对话,说明一下老马是谁,如图:

以上老马的个人介绍是重新写的,在互联网上没有的,也关闭了联网搜索,发送给千问之后,再新建一个新的对话窗口,看看千问有没有记住,如图:

毫无疑问,它记住了,并且回复的内容,原封不动地使用老马原来编写的提示词,而不是从它原来学习到的世界知识,或者互联网上搜索到的知识(未开启联网搜索)进行回复。
总结一下,通义千问上线的长期记忆功能,将极大提升用户体验,甚至于你以前用过的很好的提示词,自己忘记了,也可以问千问去找回,妈妈再也不用担心我的学习了。
好了,以上就是今天的分享,欢迎关注转发助力一键三连,有任何问题和需求请在评论区留言,回见!