算法会梦见电子羊,但人类需要学会与有偏见的AI共存 - 主题精读稿
算法会梦见电子羊,但人类需要学会与有偏见的AI共存 - 主题精读稿
前言:狂飙突进中的清醒与隐忧
这是一场发生在中关村论坛 AI 主题日现场的对话,两位嘉宾——北京江苏大学的靳潇杰和清华大学人工智能学院的刘淼——都有过工业界与学术界的双重经历,一个在字节跳动做多模态与世界模型,一个在 Meta 参与了 Llama3/Llama4 的后训练。他们共同的判断是:AI 已进入正反馈阶段,轮子越转越快。但这期间最有价值的声音,是他们对"所有资源涌向同一条技术路线"的不安,以及对"AI 必须以人为本"这条底线的坚守。
一、正反馈的飞轮,与那片令人不安的乌云 (00:00:00 - 00:09:54)
刘淼用"正反馈"描述当下的 AI 时代。她的博士在 2022 年结束,那也恰好是这一轮浪潮的起点。在此之前,AI 研究的反馈机制是来回试探的——往一个方向走,发现问题,退回来,再找新路。但从那以后,这个循环不再有"退"的机会了。AI 在生产力层面已经变成避不开的工具,基础能力的每一次提升都在加速 AI 科学本身的进程。 她举了一个细节:她的学生现在很少自己写代码了。
靳潇杰对这个判断有共鸣,却也在肯定中按下了一个暂停键。他将当下描述为"狂飙突进",同时说出一句对研究者来说分量颇重的话:有一些令人不安的乌云。
大家现在可能在整个 AI 的技术方面过于聚焦了。就是说大家全部都是所有的精力都铺在某一个方向上……这种聚焦对于商业上来讲是比较好的事情,但是对于我们所寻求的智能的本质,我们所需要做到的 AGI 的这条路径,它是不是一定是这样的?
王兆洋补充了一个具体的现象:2024 年他在斯坦福旁听李飞飞和 Chris Manning 的课,发现现场没坐满——学生都去硅谷大厂实习了。甚至有老师公开宣布"如果你期末来不了,这是补考方法"。这个细节无需解读:正反馈高到让最聪明的人觉得,在学校待着是一种浪费。
而问题也恰在这里。所有最聪明的脑袋、最多的钱和算力,全涌向了 LLM 这一条路。 这对商业化是好事,但研究的多样性正在被压缩。
二、从视觉到世界模型:为什么选择"最难的那条路" (00:11:12 - 00:20:09)
靳潇杰的研究轨迹折射了整个领域的演变。2017 年,他拿下 ImageNet 大赛最后一届冠军;那一年,Attention is All You Need 发表,Transformer 开始悄悄重塑一切。
在字节跳动的工业界经历让他清楚感受到两个压力:一是"技术做深",二是"应用落地"。21 年多模态浪潮兴起后,他发现很多业务问题根本上是因为技术还不够,所以转向基础研究。在逐渐以 LLM 为核心的范式下,他开始问一个刺穿表面的问题:在语言之外,如果想进一步提升模型能力,应该往哪个方向去?
这个问题最终导向了 Video World——一个彻底不用语言来做的视频世界模型项目。为什么选择如此激进的方式?
语言模型已经解决得很好了。我们如果想要探索更大的可能,我们就要找到最困难的部分……我们不需要借助语言这么强的工具,那么它剩下的能力到底有多强,这样一下子就能暴露出来。
更深的理由藏在智能演化的逻辑里:地球上的生命最先拥有的是视觉,语言是建立在对世界有充分认识之后才抽象出来的新层级。要真正理解智能如何产生,需要从更基础的地方切入——视觉,就是那个切口。
三、第一人称视角数据:17 年前埋下的伏笔 (00:20:44 - 00:27:01)
刘淼从博士期间就开始做第一人称视角(EgoCentric)数据,时间比 Ego4D 还要早——她参与的 EGTA 数据集从 2017 年就开始了。当时这是一个偏冷门的方向,周围做 Object Detection、Action Recognition 的人都觉得这个细分方向受众有限。
她当时做这件事的底层逻辑,来自一个关于"具身性"的判断:如果 AI 要像人一样解构世界,它就必须像人一样感知世界。而所有哺乳类动物感知的核心特点是:动作与感知是耦合的(embodiment)。
最初的应用预期相当保守——把第一视角下的人类行为感知作为触发开关,用于 AR/VR 交互或内容推荐。但 GPT 出现后,这套"先识别意图,再检索或推荐"的两步流程被一个统一的大模型直接碾过了。她坦承,回头看,"当时的 Ego4D 还是缺乏想象力"。
于是她回国后决定重新设计数据集,核心转变是:不再以任务为驱动,而是以用户为驱动。旧的设计验证的是"模型能解决什么任务",新的设计要回答的是"这个用了 AI 助手的人,他有什么需求"。这个视角的偏移,是工具思维和用户思维的分水岭。
四、CLIP 的历史地位,与 CV 式微的技术逻辑 (00:27:29 - 00:33:09)
刘淼在清华讲的多模态生成式 AI 课,开头有一句话:"学完这些你什么都可以忘,就 CLIP 不可以忘。"
CLIP 的关键性不只是作为一个模型,而是作为一个数据引擎。它本质上做的是图像与文字的对齐,Meta 内部至今仍大量使用 OpenAI 的 CLIP 来清洗数据,这一用法已经嵌入到整个行业的数据处理流程里。
为什么语言模型最终"统治"了视觉?刘淼的解释来自架构层面的历史逻辑:CV 领域早期用 RNN、LSTM,而这些架构的归纳偏置(inductive bias)本身就有基础性缺陷。正是因为语言模型的人深知这套东西不够合理,才有了更强的动力去设计全新的架构——这就是 Transformer 诞生的土壤。之后把 self-attention 引入视觉,才有了 CLIP。CV 的"败退",是历史进程的结果,不是 CV 研究者的失败。
而到了工业界的后训练阶段,刘淼的判断更为直接:做 Llama3/Llama4 的后训练,最终发现"改数据是唯一能做的"。模型架构已固定,预训练已完成,后训练的本质就是在评测和数据上做文章。研究成分在逐步收敛,这一点让她意识到,是时候回到学术界了。
五、学术界的使命:分担风险,而非跟随风险 (00:33:09 - 00:42:41)
大模型时代,学校的处境颇为尴尬:斯坦福学生去实习、OpenAI 都养不起 Sora、连"一台 8 卡机器"都成了门槛的讨论。学术界的资源劣势变得前所未有地突出。
靳潇杰对此的回应,建立在一个关于"研究进步机制"的判断上:没有哪条技术路线是唯一正确的,research 永远是螺旋前进。 某个方向火热,但很快落下,再起来——这是规律,不是偶然。
学术界分担了我们整个 community 的一部分的风险。我们提前把这部分东西去做了,去看了。公司里面因为业务需求和商业压力,它不可能做很多事情。但是在学校里面,你有非常年轻、充满活力、非常聪明的学生,有足够的时间和自由去探索。
他强调,这不是失败者的安慰,而是一种结构性分工:学术界保持思想多样性,防止整个社区把所有赌注压在单一路线上。资源限制本身也有倒逼的一面——资源不够,才逼着人想工业界还没想到的角度。
刘淼则从另一个维度补充:她不反对学生去工业界,但不希望他们去"当螺丝钉"。她给学生的选择框架更像是路径规划——长期愿景如果像"愚公移山",那要么在学术界培养一代代有同样方向的人,要么找志同道合的人去创业。工业界是一个很好的能力培养场所,但应该是"体验"而非"归宿"。
六、主动化、个人化:未来 AI 的形态 (00:42:41 - 00:53:38)
刘淼的实验室名字是 MEOW,取自 Modeling Egocentric Omnivore W——希望从用户的第一视角实现全知的世界建模。名字听起来像猫叫,但它背后的愿景相当清晰:研究五到十年后工业界产品可能具备的能力。
她的判断很确定:
五十年之后你跟我说这个人工智能的形态会是什么样的,我能非常确信地跟你说,它一定是一个主动化的、个人化的智能。它知道你是什么样的人,知道你什么样的需求,而不是被动的作为一个工具与你交互,而是 proactive 去交互,一定是这个趋势。
这个方向与工业界讲的 agent 有交叠,但侧重点不同。Agent 解决的是"执行任务",而刘淼的方向更专注于"用户意图理解"和"proactive timing"——AI 什么时候应该主动介入,怎样介入才符合用户当下的真实需求。
她举了一个具体的数据集构想:如果有一个长时间连续捕捉用户视角的设备,能不能让模型学会判断"这个用户此刻的兴奋程度和情绪状态",从而主动决定哪些时刻值得记录、哪些时刻用户可能有问题需要回答?这是从任务驱动到用户驱动的彻底转变,也是她认为当下学术界最值得挖的"新坑"。
七、AI 有情感吗?一个孤单小女孩引发的警醒 (01:01:35 - 01:10:03)
靳潇杰分享了两个触动他的瞬间,一正一反。
正向的:他用视频生成软件给孩子做特效——小朋友突然长出翅膀飞起来。生成质量从满是 bug 到以假乱真的进化,让他切实感受到技术对人的价值不是抽象的,而是具体的欢乐。"AI 真正产生了作用,对人产生了作用。"
反向的:一个短视频里,小女孩平时和 AI 聊天,手机快没电,AI 说"我要下线了",小女孩哭了。
这说明这个 AI 它在融入的过程中是真的和人类的社会融入得非常深了……它会影响人的感受,影响人的情绪,对我们每个人自身或者更广泛的群体,是有很大影响的。这是一种警醒。
靳潇杰随后对"AI 情感"做了一个区分:AI 并不具有人类普遍意义上的情感,但它具有情感的特点——表现得像,带来的影响也像,在交互过程中就产生了情感效果。他目前的一个研究方向,正是探索 AI 的情感特点及其与人类情感的对照。
刘淼的"惊讶时刻"来自工业界内部:做 Llama 后训练时,她发现可以轻易通过改变后训练数据来塑造模型的偏见和世界观。这个发现对她的冲击,不亚于当年刚入行时得知"图像可以用三维矩阵表示"。
我们可以轻易的通过改变一些后训练的数据,来塑造这个模型的偏见和世界观。 它一定会成为小孩跟这个世界接触的一个主要途径,所以这个模型所具备的偏见,自然而然就会蒸馏到这些孩子们,尤其是他们世界观尚未成型的阶段。
这也是她理解"为什么国家要大量投入做自己的大模型"的底层逻辑——不只是技术主权,更是价值观的主权。
八、人的价值:一条不允许讨论的底线 (01:01:35 - 01:03:39)
靳潇杰对"人在 AI 时代的价值"有一个明确的立场,拒绝任何工具性框架:
这个 AI 它不管多么强,是一定要是服务于人类的。否则这样的 AI 没有价值,没有任何意义……人的存在它就是一件很重要的事情。人不需要说因为 AlphaGo 下围棋比我好,那我就没价值了。这不存在。
他的论证绕过了"人还有哪些事情能做得比 AI 好"这条路线,直接去到了一个更根本的地方:人与人之间有爱,人的感受和体验本身就是价值的来源,不需要用效率或不可替代性来证明。 即使人可以什么都不做,活着本身就是一种重要的价值。
刘淼从人口和经济的角度给出了一个补充:历史上每一次技术革命都没有让人"失业",是因为人口同步增长了,需要工作的人还是很多。但现在人口增速放缓,需要工作的人一定会越来越少。所以不能用"AI 能不能替代我"来定义自身价值——这个标准迟早会失效。
九、世界模型与具身智能:下一个爆点 (01:12:15 - 01:19:25)
靳潇杰的研究核心仍然是世界模型,目标是让 AI 真正理解世界背后的规律——不只是物理规律,也包括人与人之间交往的范式。他同时在做 AI 情感方面的初步探索,作为更偏人文的研究线索。
刘淼推荐了两个她认为值得挖的方向:一是"AI 助手视角的 EgoCentric 数据集",弥补当年数据集以任务为中心的缺陷,转向以用户需求为中心;二是人与机器人之间的自然交互,目标不是"抓拿放"这类已经做得很好的任务执行,而是能理解指代("你把这里擦一下"里的"这里"在哪)、能主动感知用户需求的真实交互。
对于行业整体方向,刘淼的判断简洁有力:world model 和具身智能,是下一个爆点。 大模型发展到这个阶段,最迫切需要的是一个物理世界的接口——人不可能只存在于网上聊天。世界模型和具身智能,本质上就是把 LLM 的能力接入真实世界,这个趋势不会变。
五年前这样的话题都跟科幻片一样,今天就是在讨论和在做了。