算法会梦见电子羊，但人类需要学会与有偏见的AI共存 - 主题精读稿

2026年4月10日

算法会梦见电子羊，但人类需要学会与有偏见的AI共存 - 主题精读稿

前言：狂飙突进中的清醒与隐忧

这是一场发生在中关村论坛 AI 主题日现场的对话，两位嘉宾——北京江苏大学的靳潇杰和清华大学人工智能学院的刘淼——都有过工业界与学术界的双重经历，一个在字节跳动做多模态与世界模型，一个在 Meta 参与了 Llama3/Llama4 的后训练。他们共同的判断是：AI 已进入正反馈阶段，轮子越转越快。但这期间最有价值的声音，是他们对"所有资源涌向同一条技术路线"的不安，以及对"AI 必须以人为本"这条底线的坚守。

一、正反馈的飞轮，与那片令人不安的乌云 (00:00:00 - 00:09:54)

刘淼用"正反馈"描述当下的 AI 时代。她的博士在 2022 年结束，那也恰好是这一轮浪潮的起点。在此之前，AI 研究的反馈机制是来回试探的——往一个方向走，发现问题，退回来，再找新路。但从那以后，这个循环不再有"退"的机会了。AI 在生产力层面已经变成避不开的工具，基础能力的每一次提升都在加速 AI 科学本身的进程。 她举了一个细节：她的学生现在很少自己写代码了。

靳潇杰对这个判断有共鸣，却也在肯定中按下了一个暂停键。他将当下描述为"狂飙突进"，同时说出一句对研究者来说分量颇重的话：有一些令人不安的乌云。

大家现在可能在整个 AI 的技术方面过于聚焦了。就是说大家全部都是所有的精力都铺在某一个方向上……这种聚焦对于商业上来讲是比较好的事情，但是对于我们所寻求的智能的本质，我们所需要做到的 AGI 的这条路径，它是不是一定是这样的？

王兆洋补充了一个具体的现象：2024 年他在斯坦福旁听李飞飞和 Chris Manning 的课，发现现场没坐满——学生都去硅谷大厂实习了。甚至有老师公开宣布"如果你期末来不了，这是补考方法"。这个细节无需解读：正反馈高到让最聪明的人觉得，在学校待着是一种浪费。

而问题也恰在这里。所有最聪明的脑袋、最多的钱和算力，全涌向了 LLM 这一条路。这对商业化是好事，但研究的多样性正在被压缩。

二、从视觉到世界模型：为什么选择"最难的那条路" (00:11:12 - 00:20:09)

靳潇杰的研究轨迹折射了整个领域的演变。2017 年，他拿下 ImageNet 大赛最后一届冠军；那一年，Attention is All You Need 发表，Transformer 开始悄悄重塑一切。

在字节跳动的工业界经历让他清楚感受到两个压力：一是"技术做深"，二是"应用落地"。21 年多模态浪潮兴起后，他发现很多业务问题根本上是因为技术还不够，所以转向基础研究。在逐渐以 LLM 为核心的范式下，他开始问一个刺穿表面的问题：在语言之外，如果想进一步提升模型能力，应该往哪个方向去？

这个问题最终导向了 Video World——一个彻底不用语言来做的视频世界模型项目。为什么选择如此激进的方式？

语言模型已经解决得很好了。我们如果想要探索更大的可能，我们就要找到最困难的部分……我们不需要借助语言这么强的工具，那么它剩下的能力到底有多强，这样一下子就能暴露出来。

更深的理由藏在智能演化的逻辑里：地球上的生命最先拥有的是视觉，语言是建立在对世界有充分认识之后才抽象出来的新层级。要真正理解智能如何产生，需要从更基础的地方切入——视觉，就是那个切口。

三、第一人称视角数据：17 年前埋下的伏笔 (00:20:44 - 00:27:01)

刘淼从博士期间就开始做第一人称视角（EgoCentric）数据，时间比 Ego4D 还要早——她参与的 EGTA 数据集从 2017 年就开始了。当时这是一个偏冷门的方向，周围做 Object Detection、Action Recognition 的人都觉得这个细分方向受众有限。

她当时做这件事的底层逻辑，来自一个关于"具身性"的判断：如果 AI 要像人一样解构世界，它就必须像人一样感知世界。而所有哺乳类动物感知的核心特点是：动作与感知是耦合的（embodiment）。

最初的应用预期相当保守——把第一视角下的人类行为感知作为触发开关，用于 AR/VR 交互或内容推荐。但 GPT 出现后，这套"先识别意图，再检索或推荐"的两步流程被一个统一的大模型直接碾过了。她坦承，回头看，"当时的 Ego4D 还是缺乏想象力"。

于是她回国后决定重新设计数据集，核心转变是：不再以任务为驱动，而是以用户为驱动。旧的设计验证的是"模型能解决什么任务"，新的设计要回答的是"这个用了 AI 助手的人，他有什么需求"。这个视角的偏移，是工具思维和用户思维的分水岭。

四、CLIP 的历史地位，与 CV 式微的技术逻辑 (00:27:29 - 00:33:09)

刘淼在清华讲的多模态生成式 AI 课，开头有一句话："学完这些你什么都可以忘，就 CLIP 不可以忘。"

CLIP 的关键性不只是作为一个模型，而是作为一个数据引擎。它本质上做的是图像与文字的对齐，Meta 内部至今仍大量使用 OpenAI 的 CLIP 来清洗数据，这一用法已经嵌入到整个行业的数据处理流程里。

为什么语言模型最终"统治"了视觉？刘淼的解释来自架构层面的历史逻辑：CV 领域早期用 RNN、LSTM，而这些架构的归纳偏置（inductive bias）本身就有基础性缺陷。正是因为语言模型的人深知这套东西不够合理，才有了更强的动力去设计全新的架构——这就是 Transformer 诞生的土壤。之后把 self-attention 引入视觉，才有了 CLIP。CV 的"败退"，是历史进程的结果，不是 CV 研究者的失败。

而到了工业界的后训练阶段，刘淼的判断更为直接：做 Llama3/Llama4 的后训练，最终发现"改数据是唯一能做的"。模型架构已固定，预训练已完成，后训练的本质就是在评测和数据上做文章。研究成分在逐步收敛，这一点让她意识到，是时候回到学术界了。

五、学术界的使命：分担风险，而非跟随风险 (00:33:09 - 00:42:41)

大模型时代，学校的处境颇为尴尬：斯坦福学生去实习、OpenAI 都养不起 Sora、连"一台 8 卡机器"都成了门槛的讨论。学术界的资源劣势变得前所未有地突出。

靳潇杰对此的回应，建立在一个关于"研究进步机制"的判断上：没有哪条技术路线是唯一正确的，research 永远是螺旋前进。 某个方向火热，但很快落下，再起来——这是规律，不是偶然。

学术界分担了我们整个 community 的一部分的风险。我们提前把这部分东西去做了，去看了。公司里面因为业务需求和商业压力，它不可能做很多事情。但是在学校里面，你有非常年轻、充满活力、非常聪明的学生，有足够的时间和自由去探索。

他强调，这不是失败者的安慰，而是一种结构性分工：学术界保持思想多样性，防止整个社区把所有赌注压在单一路线上。资源限制本身也有倒逼的一面——资源不够，才逼着人想工业界还没想到的角度。

刘淼则从另一个维度补充：她不反对学生去工业界，但不希望他们去"当螺丝钉"。她给学生的选择框架更像是路径规划——长期愿景如果像"愚公移山"，那要么在学术界培养一代代有同样方向的人，要么找志同道合的人去创业。工业界是一个很好的能力培养场所，但应该是"体验"而非"归宿"。

六、主动化、个人化：未来 AI 的形态 (00:42:41 - 00:53:38)

刘淼的实验室名字是 MEOW，取自 Modeling Egocentric Omnivore W——希望从用户的第一视角实现全知的世界建模。名字听起来像猫叫，但它背后的愿景相当清晰：研究五到十年后工业界产品可能具备的能力。

她的判断很确定：

五十年之后你跟我说这个人工智能的形态会是什么样的，我能非常确信地跟你说，它一定是一个主动化的、个人化的智能。它知道你是什么样的人，知道你什么样的需求，而不是被动的作为一个工具与你交互，而是 proactive 去交互，一定是这个趋势。

这个方向与工业界讲的 agent 有交叠，但侧重点不同。Agent 解决的是"执行任务"，而刘淼的方向更专注于"用户意图理解"和"proactive timing"——AI 什么时候应该主动介入，怎样介入才符合用户当下的真实需求。

她举了一个具体的数据集构想：如果有一个长时间连续捕捉用户视角的设备，能不能让模型学会判断"这个用户此刻的兴奋程度和情绪状态"，从而主动决定哪些时刻值得记录、哪些时刻用户可能有问题需要回答？这是从任务驱动到用户驱动的彻底转变，也是她认为当下学术界最值得挖的"新坑"。

七、AI 有情感吗？一个孤单小女孩引发的警醒 (01:01:35 - 01:10:03)

靳潇杰分享了两个触动他的瞬间，一正一反。

正向的：他用视频生成软件给孩子做特效——小朋友突然长出翅膀飞起来。生成质量从满是 bug 到以假乱真的进化，让他切实感受到技术对人的价值不是抽象的，而是具体的欢乐。"AI 真正产生了作用，对人产生了作用。"

反向的：一个短视频里，小女孩平时和 AI 聊天，手机快没电，AI 说"我要下线了"，小女孩哭了。

这说明这个 AI 它在融入的过程中是真的和人类的社会融入得非常深了……它会影响人的感受，影响人的情绪，对我们每个人自身或者更广泛的群体，是有很大影响的。这是一种警醒。

靳潇杰随后对"AI 情感"做了一个区分：AI 并不具有人类普遍意义上的情感，但它具有情感的特点——表现得像，带来的影响也像，在交互过程中就产生了情感效果。他目前的一个研究方向，正是探索 AI 的情感特点及其与人类情感的对照。

刘淼的"惊讶时刻"来自工业界内部：做 Llama 后训练时，她发现可以轻易通过改变后训练数据来塑造模型的偏见和世界观。这个发现对她的冲击，不亚于当年刚入行时得知"图像可以用三维矩阵表示"。

我们可以轻易的通过改变一些后训练的数据，来塑造这个模型的偏见和世界观。它一定会成为小孩跟这个世界接触的一个主要途径，所以这个模型所具备的偏见，自然而然就会蒸馏到这些孩子们，尤其是他们世界观尚未成型的阶段。

这也是她理解"为什么国家要大量投入做自己的大模型"的底层逻辑——不只是技术主权，更是价值观的主权。

八、人的价值：一条不允许讨论的底线 (01:01:35 - 01:03:39)

靳潇杰对"人在 AI 时代的价值"有一个明确的立场，拒绝任何工具性框架：

这个 AI 它不管多么强，是一定要是服务于人类的。否则这样的 AI 没有价值，没有任何意义……人的存在它就是一件很重要的事情。人不需要说因为 AlphaGo 下围棋比我好，那我就没价值了。这不存在。

他的论证绕过了"人还有哪些事情能做得比 AI 好"这条路线，直接去到了一个更根本的地方：人与人之间有爱，人的感受和体验本身就是价值的来源，不需要用效率或不可替代性来证明。 即使人可以什么都不做，活着本身就是一种重要的价值。

刘淼从人口和经济的角度给出了一个补充：历史上每一次技术革命都没有让人"失业"，是因为人口同步增长了，需要工作的人还是很多。但现在人口增速放缓，需要工作的人一定会越来越少。所以不能用"AI 能不能替代我"来定义自身价值——这个标准迟早会失效。

九、世界模型与具身智能：下一个爆点 (01:12:15 - 01:19:25)

靳潇杰的研究核心仍然是世界模型，目标是让 AI 真正理解世界背后的规律——不只是物理规律，也包括人与人之间交往的范式。他同时在做 AI 情感方面的初步探索，作为更偏人文的研究线索。

刘淼推荐了两个她认为值得挖的方向：一是"AI 助手视角的 EgoCentric 数据集"，弥补当年数据集以任务为中心的缺陷，转向以用户需求为中心；二是人与机器人之间的自然交互，目标不是"抓拿放"这类已经做得很好的任务执行，而是能理解指代（"你把这里擦一下"里的"这里"在哪）、能主动感知用户需求的真实交互。

对于行业整体方向，刘淼的判断简洁有力：world model 和具身智能，是下一个爆点。 大模型发展到这个阶段，最迫切需要的是一个物理世界的接口——人不可能只存在于网上聊天。世界模型和具身智能，本质上就是把 LLM 的能力接入真实世界，这个趋势不会变。

五年前这样的话题都跟科幻片一样，今天就是在讨论和在做了。