2026世界杯

2026世界杯

开云kaiyun体育app登录入口 对话EverMind:4个月作念到SOTA,要给通盘Agent装上弥远系念

发布日期:2026-05-09 15:57 来源:未知 作者:admin 浏览次数:

"东谈主类智能 = 推理 + 弥远系念"。

当 AI 推明智商的竞赛插足尖锐化,通盘这个词行业运行默契到:infra 层面的系念缺失,正成为限度 AI 走向个性化与自进化的最大瓶颈。

莫得弥远系念的 Agent,就像一个自然考上了清华、但每天醒来齐不默契亲妈的天才。而大批涌入系念赛谈的公司,好多本体上仅仅在作念向量数据库,把数据存起来,等东谈主来检索。

EverMind 想作念点不同样的。这家由汜博集团孵化的公司,定位是为通盘 AI Agent 提供一个通用的 " 系念层 "(Memory Layer)。它的中枢居品 EverOS 是一套开源的弥远系念系统,开发者不错把它接入我方的 Agent,让 AI 不仅能记取用户的历史对话和偏好,还能像东谈主同样对系念进行整理、更新,致使从往时的素养中学习和进化。

EverMind 的 CEO 邓亚峰,是一位在 AI 规模深耕二十余年的老兵。他毕业于清华大学,曾任 360 集团副总裁兼 AI 操办院院长、格灵深瞳 CTO,在诡计机视觉、多模态 AI 和 AI 制药等规模深耕多年。2025 年,他加入汜博,带队从零启动 EverMind 的弥远系念名堂。团队仅用四个月就在多项系念评测上达到了 SOTA。

咱们与邓亚峰进行了一次对话,聊了聊他为什么押注弥远系念,以及这项工夫到底要处理什么问题。以下是对话实录,为阅读体验稍作剪辑。

为什么是 Long-term Memory(LTM)

硅星东谈主:在视觉、多模态、AI 制药这些规模齐作念到过很好的收获之后,您是何如锁定 " 弥远系念 " 这个方针的?

邓亚峰:作念 AI 制药的时候我最大的体会是,当数据产生得慢、不成快速迭代,工夫越过便是有限的。是以之后选方针,我就想找一个能快速作念数据迭代闭环的规模。也谈判过机器东谈主,但落地周期太长、数据赢得贫乏。转向话语模子之后,又濒临大模子在并吞一切的问题。OpenAI、Anthropic 车轮滔滔,创业公司的空间越来越小,必须找到一个有独到性的细分赛谈。

弥远系念恰恰中意这几个条款:它是下一代 AI 的必备特点,操办得很少,跟推明智商相对正交,有很强的计谋颓唐性。那时这个方针相对冷门,天下还在作念 LLM 模子、Agent、post-training,但我认为莫得系念功能的 Agent,用户体验一定是受限的。今天这也曾成了行业共鸣。

汜博这边的视角也很独到。陈天桥先生往时十多年一直在 sponsor 脑科学和 mental health 的操办,对东谈主类智能的机制机理终点感意思意思。这几年 AI 的发展让他运行想考一个问题:东谈主类智能恰恰不错简化为"推理 + 弥远系念",推理这一半也曾有无数巨头在卷了,弥远系念是不是一个极具计谋颓唐性的方针?这个判断和我我方的想考刚好吻合。

硅星东谈主:在您看来,Long-term Memory 到底要处理什么中枢问题?

邓亚峰:三件事。

第一,毁坏有限的高低文长度。当今模子高低文窗口基本到了 1M token,但系念数据量独特这个限度就没法用了。现存的 RAG 或压缩决策齐是工程谐和,不是最优解。咱们作念 memory,本体上是帮模子更好地管制高低文,在极高压缩率、低 token 糜掷的前提下,让模子有用运用无尽的历史信息。

第二,竣事委果的个性化。东谈主在调换中会为对方成立 profile:身份、偏好、价值不雅、话语立场、方针。LTM 便是帮 Agent 构建和调治这么的用户画像,交互越多越懂你。自然,LTM 的个性化成立不仅限于 Profile Memory。

第三,Self-evolving,自进化。今天的 AI 靠 offline training 擢升智商,在和用户交互的流程中并不会变得更贤人。我认为下一代 AI 一定是在交互中学习的,是一种 online learning。Long-term Memory 是竣事自进化的要道:通过纪录和分析交互的见效与失败,归来最好引申,常识和想考阵势齐随之越过。

这三件事和东谈主类进化出弥远系念的旨趣是同样的。旷古时间,何处水草丰茂你要记取,何处有危急你也要记取,同期你还要左证季节和天气去预计将来,这片草地会变得更湿润照旧会发激流。何况操办标明,弥远系念匡助东谈主类组织检会样本,把不同素营养类团聚,是以东谈主的泛化智商远强于模子。模子是把所罕有据不作念分裂地扔进去检会,很容易过拟合,或无离别求概率。东谈主脑的弥远系念机制让学习更有结构,泛化更强。AI 的 Long-term Memory 要作念的,本体上亦然这件事。

Memory Layer 和 Agent 层

硅星东谈主:您提到的个性化和自进化,听起来更像 Agent 应用层的功能,不像 infra layer 能作念的事?

邓亚峰:这是一个很好的点。Infra layer 能作念一部分。咱们最近在作念一个行将开源的 feature,基于 memory 的自进化。不同 Agent 把运行的 trace 放到我的 memory 里,我不错左证见效和失败的素养去归来最好 SOP。比如你作念了一个任务见效了,我作念了一个肖似的任务失败了,当我把大批用户的素养累积下来,就不错 learn from experience。这在系念层是不错作念到的。

要是想作念得更深,比如基于用户反应作念强化学习,那确乎需要 Agent 层和 Memory Layer 协同。但 Memory Layer 在其中演出要道脚色:帮 Agent 层组织数据,就像东谈主脑弥远系念补助学习的机制同样。

硅星东谈主:在您看来,接入 Memory Layer,Agent 最直不雅的智能擢升体当今哪?

邓亚峰:四个维度。

第一是效能,token 的极致压缩。这对限度资本至关病笃。要是咱们的居品能让 token 数相等下落,这件事的交易价值瑕瑜常大的。

第二是见效能。咱们作念了基于 skill 的自进化机制,Agent 不错从往时素养中学习,某些目的实测擢升了 234.8%。比如你昨天用一个功能可能还会失败,但这两天有几个东谈主也用过了,系统学到了其中见效的素养之后,你今天再用就见效了。系统会变得越来越好。

第三是个性化。不同用户有不同的高低文和系念,每个东谈主的助手体验齐唯一无二。咱们里面有个 AI Native 的相助平台叫 Tanka,提供基于弥远系念的 AI 助手。背后的 LLM 和推理工夫是同样的,但因为每个东谈主的系念不同,聊出来的效能就实足不同样。

第四是主动性。纪录了用户的算作历史之后,Agent 不错预计下一步需求。比如我知谈你每天这个时候要买杯咖啡,我就不错提前指示你。再进一步,我致使不错提前把事情作念了,再问你 " 这是不是你要的收尾?" 就像一个能预判需求的好职工,你莫得 assign 的责任他也曾作念收场。

系念何如更新,开云体育何如 " 健忘 "

硅星东谈主:我用 GPT 频繁遭遇这个问题:我的糊口也曾更新了,但它对我的联接还停在之前。比如之前跟它聊过的东谈主事物,在我现阶段的糊口里也曾不病笃了,但它还老是拿起,就让东谈主认为很烦。EverMind 何如处理系念的冲突和落后信息?

邓亚峰:咱们的机制分两步:在痕迹要(Online Memory Extraction)和离线进化(Offline Memory Evolution)。

在痕迹要,信息进来后作念 boundary detection,把吞并 topic 的内容聚到沿路,索要事实性的情景系念(episodic memory),再预计这个事实对将来的影响,咱们叫 forecast。系念不仅仅归档,要能工作于将来的决策。

离线进化,系统按期作念几件事:在更大范围信息上提真金不怕火用户 profile;作念反想和刷新,有点像 Claude Code 里 "dream" 作念的事,让模子回头谛视之前的判断对不合;还有处理系念更新,通过系念聚类策略(merge),把相似话题聚在沿路,冲突信息按时分线用最新的作念 update。

淡忘直露讲是更难的。Update 相对容易,用最新的信息替代老的就行。但淡忘有一个周期性的问题:你昨天提到一个东谈主,系统认为他病笃;一星期前呢?一个月前呢?是不是就该忘了?咱们当今是在离线策略中把每条信息的时分放进去,结伴咱们的预计将来功能,让模子我方去推测这条信息的时效性。直露说,在现时这个时分点还莫得作念到终点盼望,但我认为它是一个会被徐徐处理的问题。

我的判断是:AI 的 " 淡忘 " 不应该是物理删除,数据存在磁盘上不贵,而是一种权重调节策略。近期信息权重高,远期信息权重低,但需要时仍能找回。东谈主类为什么需要淡忘?两个原因:一是东谈主脑是呆板耗系统,记太多东西能耗扛不住;二是你需要基于近期信息作念决策和预计。AI 不存在第一个限度,它只需要在决策中把时效性和病笃性合理谈判进去。从这个角度说,AI 的淡忘机制推行上不错比东谈主类更优。

开源生态与大厂竞争

硅星东谈主:EverOS 也曾在 GitHub 上开源。但 OpenAI、Anthropic 也齐有我方的系念功能,用户也曾累积了好多偏好数据在他们的平台上。第三方 Memory Layer 何如找到我方的位置?

邓亚峰:咱们的定位是作念一个 memory layer for agents,将来通盘 Agent 齐需要系念功能,但没必要每个团队齐我方建一套 infra。咱们但愿成为阿谁契约数。

大厂一定会作念系念,但第三方系念层的空间来自一个毁坏事实:用户不会只用一个居品。你不会只用 Claude,也不会只用 OpenAI。你在各个居品上的历史信息齐有价值,是以反而需要一个委果属于我方的跨平台系念管制器具。这件事的驱能源是用户需要,不是咱们想作念照旧大厂想作念。

另外,memory 管制不需要最顶尖的大模子。咱们用 4B 的模子能作念到 235B 级别的效能,更快、资本更低。对开发者来说,memory 将来不是 " 能不成 " 的问题,而是性价比的问题。

开源策略上,咱们终点透彻:开源版和土产货部署等价,数据实足留在土产货,中意秘密要求高的用户。同期也有云版块,让不想我方部署的小团队即插即用。最中枢的算法全部开源。咱们也在作念一件事,帮用户把 Claude Code、OpenAI 和其他 Agent 里的 memory 数据买通,跨平台、跨端、长入管制。跟好多东谈主聊完发现,这是一个很刚的需求。

硅星东谈主:记取的信息越多,安全风险也越大。这方面何如均衡?

邓亚峰:两个层面。信息安全,也便是系念会不会线路,这跟云工作的安全挑战是等价的,需要塌实的工夫保险。另一个是系统要对敏锐信息作念过滤。比如用户告诉你密码、银行账号,咱们有个 vault 机制,把高敏锐信息阻碍存放,只在极端情况下激活。

部署模式上,系念的盼望形态是云霄和端侧结伴。用户的数字财富存在土产货开发上,复杂处理借助云霄,双方作念同步。咱们的模子也曾不错作念得很小,将来开发能跑 4B 模子,诡计就不错实足部署到端上。

要是 AI 记取了你的一切

硅星东谈主:要是 AI 领有了终点长周期、终点精准的系念,它就不再仅仅器具了。您但愿您的 AI 助理记取什么,不想让它记取什么?

邓亚峰:我认为将来最盼望的状况有两种。一种是 " 贾维斯 ",24 小时随着你的 AI,你的任务和意图齐通过它完成,它只需要你阐发收尾。另一种是数字分身。AI 有余了解你之后,不错代表你去 " 打工 ",或者作念 Agent 搪塞。咱们每个东谈主齐有好多两年齐不会聊天的一又友,但彼此可能有值得调换的信息。东谈主是串行的,AI 是并行的,你的数字分身不错和他的数字分身聊天,发现共同话题了来告诉你," 你们两个应该聊聊这件事儿。" 这让我认为终点 exciting。

至于记什么、不记什么,盼望的 AI 要有范畴感和情商,知谈哪些话题在厚谊上是敏锐的。不外有酷好的是,东谈主和 AI 的相处随机比东谈主和东谈主更容易,你自然认为 AI 跟你是一边的,反而更雀跃倾吐一些不会跟一又友说的事情。

硅星东谈主:我对 memory 有个感受:它有点像东谈主类对时分感知的演变。在腕表普及之前,你外出之后其实不知谈当今是几点几分了,对时分唯有一个拖沓的感知。而当今有了手机,你不错随处随时知谈当今的时分。而东谈主类面前对系念的感知,就像腕表出现之前东谈主类对时分的感知进度。您认为,要是 AI 有了精准的弥远系念,东谈主对自己履历的感知会不会也发生肖似的飘摇?

邓亚峰:这个譬如终点好。当今的东谈主类就像钟表刚发明时的状况,对我方作念过什么有大概感知,但不精准。要是 AI 能长周期地精准纪录和管制你的个东谈主数据,东谈主对自我的了解会飞腾到一个当今无法遐想的进度。

何况 AI 的系念智商不错弥补东谈主类的一个先天限度:东谈主的能量有限,是以有东谈主擅长宏不雅预备,有东谈主擅长细节,很少有东谈主两样齐强。但 AI 的 Long-term Memory 不错既帮你梳理三年来的大事条理、作念更有远见的预备,又能在你需要时精准调出三年前某个时刻的具体细节。宏不雅和微不雅齐备结伴,这是 AI 在 memory 上委果让东谈主感奋的所在。

滚球app中国手机版入口开云kaiyun体育app登录入口