存算一体与Agentic AI的个性化之路 - 主题精读稿

存算一体与Agentic AI的个性化之路 - 主题精读稿

前言

这期对话汇集了三位在AI一线工作的研究者,围绕一个核心问题展开:当AI已经是"有强大智能的通才",它距离真正的"个人助理"还差什么?讨论从架构哲学(存算一体/分离)出发,延伸到记忆管理、非语言信息、验证瓶颈、数据创新,最终落到Agentic AI对科学和社会的改造潜力。全场最有价值的洞察,是把几个看似技术性的问题(如"记忆怎么存")重新定位为智能本质的问题。


一、Digital Twin:从推荐系统到通用人类模拟器

(00:09)(09:16)

模拟人类行为的三个阶段

彭天翼梳理了AI模拟人类行为的历史路径:第一阶段是经典经济学的数学参数模型,简洁但现实局限大;第二阶段是机器学习+大数据的行为预测,比如与抖音合作开发的推荐系统,在预测点击行为上可达90%以上准确率——但只能理解特定行为,无法泛化。

LLM的出现带来了第三阶段的可能性:第一次看到通用模拟人类的曙光。 哥伦比亚大学做了一个实验:对2000名真人收集涵盖人格、经济行为、心理反应的500个问题,让LLM扮演这些人去回答测试集。结论是:LLM作为Digital Twin表现reasonably well,但存在三个明显偏差——倾向平庸化、忽略性格细节、向平均人坍缩。

图灵测试的真正定义

彭天翼提出一个反直觉的重读:图灵测试定义的不是AI,定义的是Human Simulator——最完美的数字工具。 这意味着训练"通用AI"和训练"人类模拟器"是两个不同的目标,需要不同的数据pipeline和reward设计。


二、存算一体:从冯·诺依曼架构到大模型哲学

(09:16)(17:37)

大模型打破了存算分离的哲学边界

主持人赵志成提出本场最核心的框架性问题:现代计算机基于冯·诺依曼的存算分离架构(CPU与内存分离),而人脑神经元网络本身既是记忆也是计算。大模型的参数同时构成"记忆"(知道拿破仑是谁)和"涌现的高级思维",二者无法分离。 这在高层次上已经挑战了冯·诺依曼哲学。

田渊栋补充:存算一体/分离的边界不是非黑即白,而是渐进的谱系——

  • 直觉性推理(1+1=2):已固化在权重里,属于存算一体
  • 复杂推理(需要列算式逐步推导):存在明显的调存储、再计算的分界

这个分界会随着训练而模糊:模型在某方向探索足够多之后,会自动把搜索路径固化进权重,下次就不需要重新搜索。这正是AlphaZero的逻辑——通过搜索得到的招法放回训练,模型站在"巨人的肩膀上"自我迭代。现在大模型后训练阶段(thinking trace → mid-training蒸馏)用的是完全相同的逻辑:从分离到一体、再分离到一体的螺旋上升。

人类也不是纯粹的存算一体

彭天翼提出一个有趣的反驳:人类虽然"存算一体",但我们也发展了外部内存(笔记、书本)和外部计算工具(计算器、电脑)。世界的信息是无穷无尽的,这决定了任何内部智能都需要外部辅助。他追问:如果弗洛伊曼和图灵生活在今天,面对LLM这个"可以做计算也可以做内存"的新东西,他们会设计出什么新架构?我们现在需要新时代的弗洛伊曼。


三、个性化记忆的三条路径与第三种可能

(17:37)(30:18)

大模型是"患有顺行性遗忘症的天才"

赵志成引入一个精准比喻:大模型训练截止日期之前的信息全部记得,之后的一无所知;每次会话结束后立刻抛弃上下文,回到只有训练数据的原始状态——这是典型的顺行性遗忘症。

路径一:显性记忆(Markdown文件+检索)

Claude (小龙虾) 的做法:把用户过去的重要事件写成Markdown文件,按时间分层(近期详细,远期压缩),通过Information Retrieval System根据当前对话智能检索相关记忆放进上下文。

优点:可解释、可编辑(用户可以直接删除不想被AI记住的内容)、灵活可控。

局限:田渊栋认为这种"懂你"的感觉是通过大量人工设计的记忆安排实现的,真正的挑战是能否做到自动化——让AI系统自动找到正确的记忆并说出来,实现"一切尽在不言中"。

路径二:参数化记忆(改写权重/LoRA)

将记忆直接写入模型权重,或通过Doc2LoRA(HyperNetwork预测LoRA adapter)在不改变主权重的前提下添加个性化插件。

局限:工程成本高,不灵活,每次更新都需要重新训练。田渊栋指出:人类采用神经元"存算一体"可能是进化的路径依赖,而非最优解——如果能把记忆和推理分开架构,对机器来说未必不是更好的方案。

路径三(彭天翼新提):用Agent动态管理信息流

彭天翼提出了超越前两种分类的第三个视角:智能的本质是组织非结构化信息、提取洞见、高效回答新问题的能力。 把信息组织成合适上下文这个过程本身,才是智能最核心的地方。

彭天翼分享实验结论:让Agent提前自己设计记忆架构(用什么数据库、如何预处理、怎么打通信息链条),比直接做RAG或让Agent事后写记忆,效果要好得多。关键在于:Agent不应只是task solver,它应该参与到信息维护和组织中。

他还提出"速度即智能"的洞察:衡量信息组织质量的指标,是用这些信息去回答后续问题时的速度和准确率。LLM之所以厉害,不只是因为压缩产生了智能,更是因为它提高了接下来信息收集的速度——"speed implies intelligence"。


四、语言的双刃剑:通向AGI的曙光,也是个性化的天花板

(30:18)(42:50)

语言是智能共识,但个性化恰恰在语言之外

赵志成提出一个深刻的悖论:自然语言是通向AGI的第一道曙光,但也可能成为进一步个性化的诅咒。语言作为交流工具产生的是"智能共识"——两个人能用语言交流的部分,恰恰是双方能达成共识的部分。而个性化AI最需要理解的,往往是那些不可言说的感受、症状和直觉。

人脑每秒处理的信息,绝大多数是无意识信息,有意识信息只是小部分,可以被语言总结的又是更小的部分。如果我们只训练语言模型,可能永远触及不了个性化最深层的那些东西。

AI"懂人"的本质:长上下文+精准记忆检索

田渊栋提出了一个相对务实的理解:所谓"不可言说的感受",本质上是人类在用极长的上下文做决策,只是压缩和抽取上下文关键信息的能力远超当前模型。

"懂你"的感觉来自:在关键时刻、在正确的点、说出正确的话。 这并不需要真正理解"不可言说",只需要有足够好的记忆检索和上下文感知。

他提出两条实现路径:一是工程路径(精心设计记忆安排);二是强化学习路径(让AI自动学会从上下文抽取最重要信息,MIT的Recursive Language Model在探索这个方向)。从进化角度看,长远来说RL路径更自然——进化没有工程师打补丁,一定是通过不停试错迭代出来的。

Digital Twin会比真人"更聪明"——这是个问题

彭天翼分享了实验中的尴尬发现:当被要求模拟一个普通人时,LLM的表现反而"太聪明"。测试题"非洲有多少个国家在联合国",95%的真人不知道答案,但LLM模拟这个人时准确率90%几——因为对LLM来说这根本不难,它没有意识到这个问题对人类很难。

这揭示了训练目标的根本差异:我们从来不会主动"把模型训傻"。 真正的人类模拟器需要能模拟人的认知局限和犯错能力——让AI像婴儿一样从零开始学习、犯错,才能真正模拟人类。


五、验证的非对称性:AI的能力边界在哪里

(44:17)(56:43)

Verifier's Law:AI擅长"易验证、难解决"的问题

赵志成引用Jason Wei提出的"验证者定律":AI擅长解决那些容易被验证但不容易解决的问题。 编程是典型——给几个输入输出样本就能验证代码对不对。但审美、道德伦理、新闻事实核查这类问题,要么根本没有客观标准,要么验证成本远高于生产答案的成本。

还有一类特殊情况:围棋虽然结果客观,但奖励极其稀疏(下完一整盘才知道输赢),使得RL训练极其困难。

验证瓶颈的解法

田渊栋的方向:打开模型黑箱,通过了解内部逻辑链条,在早期就发现推理错误。他们做的"Deep Confidence"工作:如果模型在推理时自己都不自信,这条路径就可以直接丢弃——因为大部分"心虚"的路径最终答案确实是错的,丢掉它既省计算成本也提升效果。

关于AI互相验证:田渊栋明确指出这行不通,结果往往是"菜鸡互啄"——只能发现小问题,无法一针见血指出根本性错误。真正的验证需要能力远超被验证者的人或模型。

彭天翼的角度:真正的瓶颈是高质量数据,而非算法本身。他引用Allen Institute CEO的观点:AI发展最重要的是"数据、数据,还是数据"。

GPT-2的数据创新启示:过滤机制即质量保证

OpenAI从GPT-1到GPT-2的关键突破是一个聪明的过滤机制:在Reddit上,只选取那些被用于回答问题时点赞数多的链接——这些链接背后的网页天然是"被人认可的高质量内容"。这个方法几乎不需要人工标注,却获得了大量高质量训练数据。

数据创新是民主化的:你不需要是CS专业,不需要是科学家,只要开脑洞想出好的过滤/生成机制,就能contribute。 而且一旦造出来,后面有整套pipeline可以把这个数据转化为模型能力提升。这个过程现在还没结束,仍在持续发生。

Agentic AI的真正价值:改善科学而非商业

彭天翼提出他认为最重要的视角:如果AI Agent能力已经与中级人工代理相当,那它真正的价值不在于取代这些中级劳动——而在于推动科学和技术的根本性突破

"如果我们能治疗癌症和不能治疗癌症,这是fundamental difference。如果人类能活到200岁和活到100岁,这是fundamental difference。" 这些才是定义文明边界的东西,商业只是在这之后adapt。


六、学术界在AI浪潮中如何找到位置

(59:19)(1:09:34)

彭天翼问田渊栋:你的宏大愿景是什么?

田渊栋的两个愿景:

  1. AI可解释性:找到神经网络工作原理,找到新的训练方法让模型更强更可理解
  2. 人类走出地球,成为星际文明:人类现在处于极其脆弱的阶段——明天一颗陨石就能灭掉几百万年的积累。星际扩散之后,智慧文明被整体毁灭的概率就极小了。

"现在我们可能到了这一步了,就是人只要这么想,因为AI会帮你实现这个。但是人要得这么想。" 彭天翼将此描述为"新时代的唯心主义"——不是迷信,而是想法可以激发AI去实现。

学术界角色的倒挂

田渊栋问彭天翼:学术界在AI时代还能做什么?

彭天翼的分析:学术界正面临"研究范式倒挂"——以前是学术界提供research idea,业界follow;现在是业界产生practical ideas,学术界在analyze。 更糟的是,理论往往难以给实践提供真正的指导。

但学术界有业界无法替代的价值:

  • 作为公共空间:非营利性质,没有商业约束,可以讨论任何话题(包括一些在大公司有"限制"的话题)
  • 承担公共意识传播:组织讲座、建立Agent Lab、Digital Twin Lab,让更多非技术人员参与讨论
  • 成为公共数据的生产者:像Allen Institute那样把训练数据、pipeline全部公开,传播技术

彭天翼认为,造数据和造环境成为一门科学,学术界完全可以在这个方向贡献力量——既民主化(不需要高深技能),也effective(数据直接转化为模型能力)。


七、AI是否会取代人类?两种观点的交锋

(1:17:13)(1:20:56)

观众问:AI是否能替代人类的沟通(55%靠肢体语言,38%靠语音语调,只有7%靠内容)以及承担责任?

田渊栋:Agent对Agent会取代重复性中间环节

"交流这块我觉得很难讲是个护城河,因为有可能以后都是agent对agent,而不是人对人。"

水管工可以让agent蹲在网上24小时接单、自动排期,每天只需要自己去做活就行——不需要人打电话约单。AI agent最终会取代那些"有清楚价值、清楚付出过程、比较重复和确定性的劳动"。中介行业尤其危险。

但创造性谈判、从来没见过的新需求、需要大量negotiation界定边界的任务——这部分还需要人。

彭天翼:人类价值将转向不可复制的创造性连接

彭天翼的补充区分更为细腻:

  • 可取代:重复性、确定性的中级人工代理工作;随着AI能力上升,信任和责任问题会随配套机制跟上而解决(类比无人车保险)
  • 不可取代CEO们在饭桌上聊聊天、发现资源可以对接、产生spontaneous的business idea——这是"personal creativity的表现",是散发性的,Agent做不了
  • 人与人之间的情感连接:你希望跟别人建立连接、成为community,这让你更开心——这是AI取代不了的人类需求

八、大模型的内部表示:量子叠加态的隐喻

(1:13:46)(1:17:01)

田渊栋分享了他在"latent space reasoning"方向上的发现:大模型的内部表示可能是一种量子叠加态——不同思维链在向量空间里通过叠加同时存在,推理时在搜索不同路径。这种叠加搜索永远比单一思维链的顺序搜索效率更高。

他还观察到大语言模型和儿童学习的相似性:给孩子教超越其年龄的知识,学会了也是死记硬背,无法举一反三;但等到大脑发育到一定阶段,突然就真正学会了——"不是数据灌进去的,而是表征上的突变"。"那些的顿悟到一个更深刻理解的表征,是自然而然涌现的。" 大模型的scaling和涌现能力,可能有相似的机制。


九、端侧AI与隐私保护的未来架构

(1:27:06)(1:31:17)

观众问On-device AI和隐私的前景。三人的判断:

赵志成:端侧有限制(算力、耗电),未来是"端侧 + Confidential Computing云端(硬件级别保证数据不被第三方看到)"的混合架构。英伟达、AMD、Intel都在做TEE(可信执行环境)方向。

彭天翼:Cursor是一个好的商业模式原型——数据在用户本地,AI agent在本地处理context,必要时调用云端LLM。Context management发生在自己设备上,隐私有保障。

田渊栋:关键路径是把大模型的"知识"和"推理/Agent能力"分离。如果训练一个专门做推理和Agent调用的小模型(知识从工具/检索获取),7B以内就能上手机。QwQ等小模型的agent能力值得观察。这条路上,Apple等大公司肯定会进场竞争。


核心论点汇总

主题 核心论断
存算一体 大模型高层次上实现了存算一体;但分离→一体→分离的螺旋迭代才是能力增强的核心逻辑
个性化记忆 短期内显性记忆(Markdown+检索)是主流;真正的突破是让Agent自动管理信息流和设计记忆架构
语言的边界 语言是AGI曙光也是个性化天花板;"懂你"的本质是长上下文+精准检索,不一定需要理解"不可言说"
验证瓶颈 AI最大的能力边界是验证非对称性;打开黑箱和高质量数据创新是两条解法
数据民主化 造数据和造环境是民主化的科学:不需要高深技能,聪明的过滤机制比暴力标注更有效
AI取代人类 重复性中级劳动会被取代;创造性连接和散发性idea是人类护城河
宏大愿景 AI的真正价值是推动科学突破(癌症、量子物理);而不仅仅是商业应用
目录与工具

从右向左滑动可关闭