存算一体与Agentic AI的个性化之路 - 主题精读稿

2026年3月20日

存算一体与Agentic AI的个性化之路 - 主题精读稿

前言

这期对话汇集了三位在AI一线工作的研究者，围绕一个核心问题展开：当AI已经是"有强大智能的通才"，它距离真正的"个人助理"还差什么？讨论从架构哲学（存算一体/分离）出发，延伸到记忆管理、非语言信息、验证瓶颈、数据创新，最终落到Agentic AI对科学和社会的改造潜力。全场最有价值的洞察，是把几个看似技术性的问题（如"记忆怎么存"）重新定位为智能本质的问题。

一、Digital Twin：从推荐系统到通用人类模拟器

(00:09) — (09:16)

模拟人类行为的三个阶段

彭天翼梳理了AI模拟人类行为的历史路径：第一阶段是经典经济学的数学参数模型，简洁但现实局限大；第二阶段是机器学习+大数据的行为预测，比如与抖音合作开发的推荐系统，在预测点击行为上可达90%以上准确率——但只能理解特定行为，无法泛化。

LLM的出现带来了第三阶段的可能性：第一次看到通用模拟人类的曙光。 哥伦比亚大学做了一个实验：对2000名真人收集涵盖人格、经济行为、心理反应的500个问题，让LLM扮演这些人去回答测试集。结论是：LLM作为Digital Twin表现reasonably well，但存在三个明显偏差——倾向平庸化、忽略性格细节、向平均人坍缩。

图灵测试的真正定义

彭天翼提出一个反直觉的重读：图灵测试定义的不是AI，定义的是Human Simulator——最完美的数字工具。这意味着训练"通用AI"和训练"人类模拟器"是两个不同的目标，需要不同的数据pipeline和reward设计。

二、存算一体：从冯·诺依曼架构到大模型哲学

(09:16) — (17:37)

大模型打破了存算分离的哲学边界

主持人赵志成提出本场最核心的框架性问题：现代计算机基于冯·诺依曼的存算分离架构（CPU与内存分离），而人脑神经元网络本身既是记忆也是计算。大模型的参数同时构成"记忆"（知道拿破仑是谁）和"涌现的高级思维"，二者无法分离。 这在高层次上已经挑战了冯·诺依曼哲学。

田渊栋补充：存算一体/分离的边界不是非黑即白，而是渐进的谱系——

直觉性推理（1+1=2）：已固化在权重里，属于存算一体
复杂推理（需要列算式逐步推导）：存在明显的调存储、再计算的分界

这个分界会随着训练而模糊：模型在某方向探索足够多之后，会自动把搜索路径固化进权重，下次就不需要重新搜索。这正是AlphaZero的逻辑——通过搜索得到的招法放回训练，模型站在"巨人的肩膀上"自我迭代。现在大模型后训练阶段（thinking trace → mid-training蒸馏）用的是完全相同的逻辑：从分离到一体、再分离到一体的螺旋上升。

人类也不是纯粹的存算一体

彭天翼提出一个有趣的反驳：人类虽然"存算一体"，但我们也发展了外部内存（笔记、书本）和外部计算工具（计算器、电脑）。世界的信息是无穷无尽的，这决定了任何内部智能都需要外部辅助。他追问：如果弗洛伊曼和图灵生活在今天，面对LLM这个"可以做计算也可以做内存"的新东西，他们会设计出什么新架构？我们现在需要新时代的弗洛伊曼。

三、个性化记忆的三条路径与第三种可能

(17:37) — (30:18)

大模型是"患有顺行性遗忘症的天才"

赵志成引入一个精准比喻：大模型训练截止日期之前的信息全部记得，之后的一无所知；每次会话结束后立刻抛弃上下文，回到只有训练数据的原始状态——这是典型的顺行性遗忘症。

路径一：显性记忆（Markdown文件+检索）

Claude (小龙虾) 的做法：把用户过去的重要事件写成Markdown文件，按时间分层（近期详细，远期压缩），通过Information Retrieval System根据当前对话智能检索相关记忆放进上下文。

优点：可解释、可编辑（用户可以直接删除不想被AI记住的内容）、灵活可控。

局限：田渊栋认为这种"懂你"的感觉是通过大量人工设计的记忆安排实现的，真正的挑战是能否做到自动化——让AI系统自动找到正确的记忆并说出来，实现"一切尽在不言中"。

路径二：参数化记忆（改写权重/LoRA）

将记忆直接写入模型权重，或通过Doc2LoRA（HyperNetwork预测LoRA adapter）在不改变主权重的前提下添加个性化插件。

局限：工程成本高，不灵活，每次更新都需要重新训练。田渊栋指出：人类采用神经元"存算一体"可能是进化的路径依赖，而非最优解——如果能把记忆和推理分开架构，对机器来说未必不是更好的方案。

路径三（彭天翼新提）：用Agent动态管理信息流

彭天翼提出了超越前两种分类的第三个视角：智能的本质是组织非结构化信息、提取洞见、高效回答新问题的能力。 把信息组织成合适上下文这个过程本身，才是智能最核心的地方。

彭天翼分享实验结论：让Agent提前自己设计记忆架构（用什么数据库、如何预处理、怎么打通信息链条），比直接做RAG或让Agent事后写记忆，效果要好得多。关键在于：Agent不应只是task solver，它应该参与到信息维护和组织中。

他还提出"速度即智能"的洞察：衡量信息组织质量的指标，是用这些信息去回答后续问题时的速度和准确率。LLM之所以厉害，不只是因为压缩产生了智能，更是因为它提高了接下来信息收集的速度——"speed implies intelligence"。

四、语言的双刃剑：通向AGI的曙光，也是个性化的天花板

(30:18) — (42:50)

语言是智能共识，但个性化恰恰在语言之外

赵志成提出一个深刻的悖论：自然语言是通向AGI的第一道曙光，但也可能成为进一步个性化的诅咒。语言作为交流工具产生的是"智能共识"——两个人能用语言交流的部分，恰恰是双方能达成共识的部分。而个性化AI最需要理解的，往往是那些不可言说的感受、症状和直觉。

人脑每秒处理的信息，绝大多数是无意识信息，有意识信息只是小部分，可以被语言总结的又是更小的部分。如果我们只训练语言模型，可能永远触及不了个性化最深层的那些东西。

AI"懂人"的本质：长上下文+精准记忆检索

田渊栋提出了一个相对务实的理解：所谓"不可言说的感受"，本质上是人类在用极长的上下文做决策，只是压缩和抽取上下文关键信息的能力远超当前模型。

"懂你"的感觉来自：在关键时刻、在正确的点、说出正确的话。 这并不需要真正理解"不可言说"，只需要有足够好的记忆检索和上下文感知。

他提出两条实现路径：一是工程路径（精心设计记忆安排）；二是强化学习路径（让AI自动学会从上下文抽取最重要信息，MIT的Recursive Language Model在探索这个方向）。从进化角度看，长远来说RL路径更自然——进化没有工程师打补丁，一定是通过不停试错迭代出来的。

Digital Twin会比真人"更聪明"——这是个问题

彭天翼分享了实验中的尴尬发现：当被要求模拟一个普通人时，LLM的表现反而"太聪明"。测试题"非洲有多少个国家在联合国"，95%的真人不知道答案，但LLM模拟这个人时准确率90%几——因为对LLM来说这根本不难，它没有意识到这个问题对人类很难。

这揭示了训练目标的根本差异：我们从来不会主动"把模型训傻"。 真正的人类模拟器需要能模拟人的认知局限和犯错能力——让AI像婴儿一样从零开始学习、犯错，才能真正模拟人类。

五、验证的非对称性：AI的能力边界在哪里

(44:17) — (56:43)

Verifier's Law：AI擅长"易验证、难解决"的问题

赵志成引用Jason Wei提出的"验证者定律"：AI擅长解决那些容易被验证但不容易解决的问题。编程是典型——给几个输入输出样本就能验证代码对不对。但审美、道德伦理、新闻事实核查这类问题，要么根本没有客观标准，要么验证成本远高于生产答案的成本。

还有一类特殊情况：围棋虽然结果客观，但奖励极其稀疏（下完一整盘才知道输赢），使得RL训练极其困难。

验证瓶颈的解法

田渊栋的方向：打开模型黑箱，通过了解内部逻辑链条，在早期就发现推理错误。他们做的"Deep Confidence"工作：如果模型在推理时自己都不自信，这条路径就可以直接丢弃——因为大部分"心虚"的路径最终答案确实是错的，丢掉它既省计算成本也提升效果。

关于AI互相验证：田渊栋明确指出这行不通，结果往往是"菜鸡互啄"——只能发现小问题，无法一针见血指出根本性错误。真正的验证需要能力远超被验证者的人或模型。

彭天翼的角度：真正的瓶颈是高质量数据，而非算法本身。他引用Allen Institute CEO的观点：AI发展最重要的是"数据、数据，还是数据"。

GPT-2的数据创新启示：过滤机制即质量保证

OpenAI从GPT-1到GPT-2的关键突破是一个聪明的过滤机制：在Reddit上，只选取那些被用于回答问题时点赞数多的链接——这些链接背后的网页天然是"被人认可的高质量内容"。这个方法几乎不需要人工标注，却获得了大量高质量训练数据。

数据创新是民主化的：你不需要是CS专业，不需要是科学家，只要开脑洞想出好的过滤/生成机制，就能contribute。 而且一旦造出来，后面有整套pipeline可以把这个数据转化为模型能力提升。这个过程现在还没结束，仍在持续发生。

Agentic AI的真正价值：改善科学而非商业

彭天翼提出他认为最重要的视角：如果AI Agent能力已经与中级人工代理相当，那它真正的价值不在于取代这些中级劳动——而在于推动科学和技术的根本性突破。

"如果我们能治疗癌症和不能治疗癌症，这是fundamental difference。如果人类能活到200岁和活到100岁，这是fundamental difference。" 这些才是定义文明边界的东西，商业只是在这之后adapt。

六、学术界在AI浪潮中如何找到位置

(59:19) — (1:09:34)

彭天翼问田渊栋：你的宏大愿景是什么？

田渊栋的两个愿景：

AI可解释性：找到神经网络工作原理，找到新的训练方法让模型更强更可理解
人类走出地球，成为星际文明：人类现在处于极其脆弱的阶段——明天一颗陨石就能灭掉几百万年的积累。星际扩散之后，智慧文明被整体毁灭的概率就极小了。

"现在我们可能到了这一步了，就是人只要这么想，因为AI会帮你实现这个。但是人要得这么想。" 彭天翼将此描述为"新时代的唯心主义"——不是迷信，而是想法可以激发AI去实现。

学术界角色的倒挂

田渊栋问彭天翼：学术界在AI时代还能做什么？

彭天翼的分析：学术界正面临"研究范式倒挂"——以前是学术界提供research idea，业界follow；现在是业界产生practical ideas，学术界在analyze。 更糟的是，理论往往难以给实践提供真正的指导。

但学术界有业界无法替代的价值：

作为公共空间：非营利性质，没有商业约束，可以讨论任何话题（包括一些在大公司有"限制"的话题）
承担公共意识传播：组织讲座、建立Agent Lab、Digital Twin Lab，让更多非技术人员参与讨论
成为公共数据的生产者：像Allen Institute那样把训练数据、pipeline全部公开，传播技术

彭天翼认为，造数据和造环境成为一门科学，学术界完全可以在这个方向贡献力量——既民主化（不需要高深技能），也effective（数据直接转化为模型能力）。

七、AI是否会取代人类？两种观点的交锋

(1:17:13) — (1:20:56)

观众问：AI是否能替代人类的沟通（55%靠肢体语言，38%靠语音语调，只有7%靠内容）以及承担责任？

田渊栋：Agent对Agent会取代重复性中间环节

"交流这块我觉得很难讲是个护城河，因为有可能以后都是agent对agent，而不是人对人。"

水管工可以让agent蹲在网上24小时接单、自动排期，每天只需要自己去做活就行——不需要人打电话约单。AI agent最终会取代那些"有清楚价值、清楚付出过程、比较重复和确定性的劳动"。中介行业尤其危险。

但创造性谈判、从来没见过的新需求、需要大量negotiation界定边界的任务——这部分还需要人。

彭天翼：人类价值将转向不可复制的创造性连接

彭天翼的补充区分更为细腻：

可取代：重复性、确定性的中级人工代理工作；随着AI能力上升，信任和责任问题会随配套机制跟上而解决（类比无人车保险）
不可取代：CEO们在饭桌上聊聊天、发现资源可以对接、产生spontaneous的business idea——这是"personal creativity的表现"，是散发性的，Agent做不了
人与人之间的情感连接：你希望跟别人建立连接、成为community，这让你更开心——这是AI取代不了的人类需求

八、大模型的内部表示：量子叠加态的隐喻

(1:13:46) — (1:17:01)

田渊栋分享了他在"latent space reasoning"方向上的发现：大模型的内部表示可能是一种量子叠加态——不同思维链在向量空间里通过叠加同时存在，推理时在搜索不同路径。这种叠加搜索永远比单一思维链的顺序搜索效率更高。

他还观察到大语言模型和儿童学习的相似性：给孩子教超越其年龄的知识，学会了也是死记硬背，无法举一反三；但等到大脑发育到一定阶段，突然就真正学会了——"不是数据灌进去的，而是表征上的突变"。"那些的顿悟到一个更深刻理解的表征，是自然而然涌现的。" 大模型的scaling和涌现能力，可能有相似的机制。

九、端侧AI与隐私保护的未来架构

(1:27:06) — (1:31:17)

观众问On-device AI和隐私的前景。三人的判断：

赵志成：端侧有限制（算力、耗电），未来是"端侧 + Confidential Computing云端（硬件级别保证数据不被第三方看到）"的混合架构。英伟达、AMD、Intel都在做TEE（可信执行环境）方向。

彭天翼：Cursor是一个好的商业模式原型——数据在用户本地，AI agent在本地处理context，必要时调用云端LLM。Context management发生在自己设备上，隐私有保障。

田渊栋：关键路径是把大模型的"知识"和"推理/Agent能力"分离。如果训练一个专门做推理和Agent调用的小模型（知识从工具/检索获取），7B以内就能上手机。QwQ等小模型的agent能力值得观察。这条路上，Apple等大公司肯定会进场竞争。

核心论点汇总

主题	核心论断
存算一体	大模型高层次上实现了存算一体；但分离→一体→分离的螺旋迭代才是能力增强的核心逻辑
个性化记忆	短期内显性记忆（Markdown+检索）是主流；真正的突破是让Agent自动管理信息流和设计记忆架构
语言的边界	语言是AGI曙光也是个性化天花板；"懂你"的本质是长上下文+精准检索，不一定需要理解"不可言说"
验证瓶颈	AI最大的能力边界是验证非对称性；打开黑箱和高质量数据创新是两条解法
数据民主化	造数据和造环境是民主化的科学：不需要高深技能，聪明的过滤机制比暴力标注更有效
AI取代人类	重复性中级劳动会被取代；创造性连接和散发性idea是人类护城河
宏大愿景	AI的真正价值是推动科学突破（癌症、量子物理）；而不仅仅是商业应用