Episode 13 风霁:优化体验,还是塑造现实?平台推荐算法探秘 - 主题精读稿

Episode 13 风霁:优化体验,还是塑造现实?平台推荐算法探秘 - 主题精读稿

前言:当算法成为内容生态的自然之力

推荐算法在过去十年从一个无人理解的边缘技术,演变为支撑千亿级日均播放量的内容分发基础设施。它本质上仍是信息检索,却在尺度的爆炸中获得了截然不同的能力——不仅能识别用户的显性兴趣,更能在向量空间中沉淀人们说不清道不明的细微偏好。这期对话与资深推荐算法工程师风霁深入探讨了这套系统的演进逻辑、内部权衡与社会争议:算法究竟是在被动反映现实,还是在主动塑造现实?工程师如何在用户满意度、生态价值与社区文化之间做切割与兼容?当文化战争、信息茧房、情绪治理这些社会议题被输入到一个黑箱里循环放大时,技术的边界又在哪里?风霁的答案出人意料地不极端:算法既没有公众想象的那么武断,也没有工程师宣称的那么清白,它是一种群体智慧在工程现场不断迭代演化出来的"自然之力"。

一、推荐算法从人工编辑到深度学习的演进 (00:02 - 17:58)

风霁的视角从一开始就把推荐算法去神秘化:它本质就是信息检索,与互联网为信息检索而诞生这件事并无两样。2005 年以前的推荐主要靠人工编辑和规则匹配;2005 到 2012 年间,矩阵分解、线性回归、GBDT 等机器学习方法首次让"猜你想看"成为可能。真正的转折点发生在 2016 年——谷歌发表了 Wide and Deep 论文,把神经网络应用在 YouTube 推荐里,开启了深度学习时代。

风霁在 17 年进入这一行,18 年主导把神经网络在推荐上落地。在那之前,业界做法是百度那种"几十号人手工挖掘特征"的笨功夫——用户喜欢什么、视频是什么品类,工程师手工把信号编码进去,再做特征交叉。深度学习的到来让这套苦力活变得低效,但当时的代价是另一面:上线深度神经网络后,点击率会暴涨 10% 到 20%,可标题党和封面党的问题也被同步放大。这倒逼出了下一阶段——从单一目标 CTR 走向多目标体系,把时长、点赞、关注、长期价值都纳入建模,用 MMOE(多专家混合)这样的结构同时拟合多个目标。

汉洋作为同一时期做过推荐的从业者,回忆起当年的氛围:人们极度低估了推荐算法的威力,是因为大盘整体在涨——"你做什么都是 work 的,所以掩盖了事情之间权重的区别"。他做自动驾驶时,所有人都默认神经网络是未来,只是时间问题;但在新闻和内容行业,主流认知里"内容分发只跟主编的品位有关",赢家是因为某个电视台名编辑跳槽过去了。直到字节"仿佛是 middle of nowhere 传出来的一个巨大的生物"突然胜利,人们才意识到千人千面这件事不是一个口号,而是一种可以把点击率从 10% 做到 20% 的能力——"你会知道其实那个总编根本不重要"

这背后藏着一个鸡生蛋的问题:千人千面需要供给端和需求端同时膨胀到某个量级才有意义。早期的小贴吧一天就二十几个人发帖,你能把全部新内容刷完,算法没有发挥空间。所以推荐算法之所以成立,并不是某个天才在实验室里搞出来的科研成果,而是供给爆炸、用户红利、技术进步多重力量交汇后的结果。重轻把这个状态形容为"自然之力",风霁顺势接:"一个物种如果存续,那它一定是因为它有它的生存之道。"

推荐对于很多公司来说是推进器。

它跟 AlphaFold 不同。AlphaFold 是一小撮科学家在办公室里就能完成的成果,而推荐算法是消费者、创作者、平台一起在生态里玩出来的群体智慧的产物。

二、用户满意度函数的多层建模 (17:58 - 32:09)

接下来风霁解释了一个听起来近乎科幻的命题:所谓"算法在优化用户满意度函数",到底是什么意思?人心如此复杂,怎么可能写成一个有限变量的函数?

他给出的答案是分层的。第一层是模型算力本身的进化——从早年 4 到 5GB 的模型膨胀到今天几十 T 的参数量,这一层是"绝对的改进",越大越好,让目标拟合得更准。第二层是不停增加新的目标维度:从最早只有 CTR,到时长、点赞、关注,再到长期价值目标——比如预测你跟某个作者未来 182 天会看几天,预测你一年累积播放多少时长。这一层不是越多越好,需要谨慎挑选,否则会出 bad case。第三层是各个目标之间的动态权重:在这一刻、对这一个用户,到底应该让哪个目标主导?

风霁讲了一个关于第二层的有趣反例:他们曾经调研一个"全屏播放"目标,结果发现全屏率最高的稿件,是某人放出自己初中毕业合照——大家全屏只是为了找自己有没有在照片里。一个本来 100 人的初中班级合影,被推到了 10 万人那里,"那 10 万人可能体验就被打扰了"。这种 bad case 让团队意识到:加目标必须谨慎,全屏要结合足够长的播放时长,才算有效全屏。汉洋也补充了自己的例子:一部叫《海拉尔,真的存在吗?》的纯艺术影集,因为触发了地域关键词被推给全海拉尔,十多万阅读全是来骂他们的——"你把一个纯艺术的标题推给了海拉尔人,海拉尔人会觉得被冒犯了。"

风霁在这个层级里揭示了一个反直觉的事实:优化时长其实并没有想象中那么至高无上。"我个人对涨时长这个事不太 care",他说。原因是真正重要的是 365 天后用户还在不在用这个 APP——"今天让用户多看十分钟,意义不一定大。"反过来,如果用户因为太沉迷而卸载,"你多了一天的活跃,但损失了未来 365×50 的价值"。所以他们更关注用户有没有发生有效互动——点赞、关注、评论、跟创作者的长期交互。

我们最终标识的用户是未来一年之后还用这个 APP,或者说这个 APP 能够陪伴用户非常久,那我们就不能只看今天。

由此延伸出长期价值建模这一近年来非常重要的工作——预测用户跟某个作者在未来 182 天会看多少天。如果作者本身没那么厉害,"他顶多让你看两天看三天,你不可能看 182 天"。能让人看 182 天的,必然是真正用心创作、有人格魅力的作者。所以推荐系统并不是一味追求即时刺激,它内部同时容纳"加里巴人"和"阳春白雪"两种价值:既要有娱乐补能的内容,也要有学习获得感的内容;一小时内一次点赞都没有的纯沉迷消费,会被判定为不健康——"那是不是他就是在给你洗脑?"

汉洋这时把整段讨论拉到一个更高的层次:推荐算法是一个一直在进化的系统,像生物在适应环境;但反过来,推荐算法也制造了一个环境让人来适应。每个创作者会觉得"网上有版本"——这个版本火什么,下个版本火什么——但从工程师视角看,根本不存在一个统一的版本。海岸线远看是波浪,近看全是巨石。具体到每一个用户、每一个项目,逻辑都不一样。这些不同的逻辑让参数变得越来越多,最后做内容的人不知道怎么做才能被推荐,做推荐的人也不太知道动哪个事会造成什么影响。

三、创作者生态与版本迭代的稳定性 (32:09 - 53:13)

针对创作者最焦虑的"一代版本一代神"问题,风霁的回答是:好作者应该越来越满意,永远的神,而不是被某个版本宠幸。

逻辑很直白:算法迭代的本质是让用户看到更满意的内容、让好创作者拿到应得的流量。如果你的作品下一个版本不行了,"那是不是说明你过去是靠那个版本的 bug 拉多了流量?" 优化创作技巧能让你涨 10% 到 20% 的流量,但不会让你少 90%。如果真少了 90%,要么是你换题材了,要么是用户需求本身变了——18 年能火的东西,25 年还能不能火?

这里隐藏着一个被反复印证的判断:用户审美的变迁对创作者命运的影响,远大于推荐算法本身。抖音从最早的跟拍模仿,到剧情向、三农、知识类的依次涌现,每一波新内容都会挤压旧品类的占比。但风霁强调,这不是平台 push 的结果——平台运营撑死能推动几万个投稿,"今天来说几万个投稿是带不来一个趋势的"。如果用户没有这个需求,平台硬推只会损失活跃度。算法不会、也没有必要去主动引导某种文化趋势。

但这个理性判断很难安抚现实中的创作者。重轻替很多人补了一刀:

我作为一个创作者,我肯定永远都不愿意去承认是需求端、是我的受众抛弃了我,那肯定是抖音抛弃了我。

汉洋接得更彻底:"不是抖音抛弃我,那就是 B 站抛弃了我,要不就是小红书抛弃了我,但绝对不能说我的观众抛弃了我。我的观众抛弃我,是因为算法没推他们我的视频,我被限流了。"

风霁给出了平台保护创作者的两个机制。一个叫"冷启动":新作者上场的前几个稿件会有保底流量,比如 1000 或 500 播放,避免因为没人看而被埋没;之后每篇投稿也有保底流量,比如 300 播放,让推荐系统有机会学习你的内容质量。另一个是 AB 实验机制:每次迭代都拿 10% 流量做对照,5% 用户跑老策略,5% 跑新策略,看用户侧、作者侧、生态侧多重指标——头部作品什么样、中腰部作品什么样、涨粉作者是谁、掉粉作者是谁。指标都好才放大流量。一年中能产生大流量变化的迭代屈指可数,单次迭代对大盘市场的影响通常只有千分之一到千分之二。所以"断崖式下跌"在成熟平台并不正常——"如果是这样的话,那这个产品出问题了,自然会被淘汰。"

至于运营和算法的关系,汉洋观察到一个微妙现象:创作者数据好就感谢运营推了,数据不好就赖算法不推了——"我们不冤枉吗?"风霁笑答这无所谓,运营在创作者眼里"百分之百是个好人",他们的工作就是帮作者解决问题。两者实际上紧密配合:日常运营负责对接作者、识别异常流量、参与品类审美评估;算法工程师则提供数据洞察和系统层面的修正。

讨论延伸到了播客这个媒介本身。风霁的观察让两位主播略感不适:播客今天起不来,不一定是推荐系统的问题,而是供给和需求都还没起来。"如果今天只有一万个播客,而一个用户需要的是第十万个播客才能覆盖他的需求,那播客根本不可能起来。" 重轻和汉洋的直觉是国内播客已经多到呕吐——光去年就新增了五万五千多档节目。但从风霁的尺度看,五万五"太爽了"——一个 10 亿用户级的短视频生态需要至少 100 万级的供给,而播客比短视频更挑人,也就意味着潜在播客的体量至少需要到这个量级。

他这种冷酷的客观让我感到有点难受。这个量级是没有办法通过你少数内容的绝对质量的好来弥补的。

风霁的判断是,今天播客的内容质量和它全网的播放量是不匹配的——好播客很多,但缺乏能"养"出大众消费习惯的"年轻人的第一款播客"。播客真正爆发,需要内容形式的变化(比如视频播客)、设备和创作门槛的降低、自媒体环境的成熟同时发生,这是一个一两年甚至更久的孵化过程。

四、千亿级分发与稀疏表征 (53:13 - 1:11:52)

接下来的对话进入了纯粹的尺度震撼。中国互联网每天新上传的视频是一两亿量级,每个用户人均每天看一百个视频,整个生态每天产生千亿次播放——录这期节目的时间里,中国人产出的视频数量已经超过了中文播客全年的量。

汉洋把这个尺度推到一个隐喻:**短视频就像信息社会在村口聚会,大家聊天八卦、获取信息,同时听一下村委的广播。**风霁延展:现在拍个视频就跟三十年前夏天大家在村口大树下乘凉聊八卦一样自然,"它就是信息社会的村口聚会"。

中国人每天消费一千亿次短视频,这不是一个我的小脑瓜可以体会的事。

这个尺度反过来定义了推荐系统的物理形态。十年前的推荐模型物理存储是 4 到 5GB,今天页内做得比较好的推荐模型存储量是几十 T 大小——"你家里的硬盘是放不下我们这个模型的"。这套系统的诞生本质上是被信息爆炸倒逼出来的,是手机成本下降、上头成本下降、网络成本下降、算法成本下降的综合结果。

风霁随后揭开了机房里发生的事。在这套系统里,每个用户被表征为几百到几千维的浮点数向量;用户在抖音 B 站小红书产生的几万到上百万个行为,每一个都是几十到几百维的数字;一个视频也是几百维的浮点数;视频的标签、作者的特征也都是向量。这些向量构成了"稀疏表征"——它们不参与计算,只通过查表被取出来塞进模型,但占据了模型存储的大头。然后稀疏向量进入"稠密计算"层做浮点数运算,对应大模型那种"几百 B 大小"的算力。

最反直觉的一点是:这些向量是没有语义的。它不是"汉洋是男的、35 岁、喜欢网球"这样的明文标签表,而是模型自动学习出来的几千维数字——"我也其实不知道它里面代表什么。" 重轻直觉地问:"那如果我把这几千个字节的关于汉洋的字符串拷贝出来给你看,你能读出来吗?"风霁答:读不出来。

这个事实颠覆了汉洋十多年前做数据挖掘时的工作范式。早年推荐系统确实是"把人变成标签"——挖掘用户的明文兴趣、写规则、做特征交叉。今天的推荐已经从"数据挖掘"演变为"序列建模":12 到 17 年是手工特征工程时代;17 到 19 年用户/视频/作者的向量表征逐渐占主导;19 年后系统直接把用户过去几万到上百万的历史行为输入模型,让模型自己学。"我们之所以要用神经网络,某种逻辑就是不希望大家再做很多这类的工作,因为它非常低效。"

风霁还描述了视频投稿后到分发完成的完整链路:先过机审(提取音频视频帧、用大模型识别违规),再进推荐池子;接着是召回(从亿级或千万级稿件库里通过模糊计算筛出几万个候选)、排序(多目标预估融合)、重排(保证多样性、做兴趣探索、退场不感兴趣的)、混排(穿插广告、直播、短剧等多业务)。 这一切发生在几分钟到一两小时内。模糊计算的逻辑像在一棵树上一层层往下走,每层选最相关的分叉,最终从树叶里拿到候选视频。

业界正在探索的下一步是"生成式推荐"——给每个视频赋予一个有语义的 ID(比如四个一万维数字组成的序列),让模型直接预估你想看的四个数字。"但是现在业界也不是特别成熟。"

重轻对一个细节震惊了:模型其实"隐式地"做了"看俄乌战争 30 秒短视频"和"看俄乌战争长篇分析"的精细区分。同样关心俄乌战争的用户,因为对长视频/短视频的偏好、对点赞内容的口味不同,最终接收到的内容截然不同。模型可以沉淀到这么细的程度,能力强到可以理解一个人对万千事物中一件事情里非常细微的偏好。

五、信息茧房的纠偏机制与算法的社会责任 (1:11:52 - 1:46:21)

针对信息茧房的指控,风霁给出了一个数据:完全随机分发的点击率只有正常推荐的 1%——"如果没有推荐系统,你基本可以理解,你在这个内容极度爆发的时代,你是没办法去看内容的,找到一个视频的难度至少是现在的一百倍。"

如果没有推荐系统,在内容极度爆发的时代,你基本没办法看内容,找到一个视频的难度至少是现在的一百倍。

而且更反直觉的是:完全随机分发反而会让用户更极端。心理学实验显示,没有推荐筛选的情况下,用户自己的筛选率会变低,但他们仍然会筛选——只不过是滑过那些观点不一样的内容、停留在更单一的内容上。如果是推荐系统在做这件事,它会推一个"观点跟你不一样、但你还会看下去"的东西,因为它考虑的是长期留存。算法实际上是在做"求同存异",而完全无差别分发反而会让用户固化。

更重要的是,重轻原本以为"放松算法、引入随机分发"能缓解这些问题,但风霁说这套系统其实可以把所有担忧的问题都纳入目标设计里:兴趣探索、防退化、防极端、长期价值、热点纠偏——它不是被动的镜子,而是积极有为的工程。比如他们会用随机流量收集真实样本,反过来纠正大盘模型——如果一个视频在随机分发下点击率只有 1.3%,但大盘预估时是 11%,那就说明大盘存在高热偏执,需要纠偏。

但这种"积极有为"也带来了道高一尺魔高一丈的反复博弈。点赞目标上线后,出现了"点个赞就做俯卧撑""点个赞今天有好运"这类骗赞视频;标题党被打压后,封面党起来;封面党被压制后,又有别的 hack 行为。"这是一个攻防的事情。"

风霁解释,算法工程师其实是前置考虑风险的——上线一个新目标前会想到大部分潜在风险,但不可能 100% 看全。有些问题是后续治理的问题,因为很多问题不是上线时就发生,而是当黑产意识到某种行为能换流量时反过来 hack 系统。这反过来说明:算法不能停滞,否则系统就在变差——用户需求在变,作者作品在变,社会偏好在演进。"我们必须要迭代,无为而治退一步是不可能的。"

重轻随后追问 Frances Haugen 当年揭发 Instagram 的案例——少女账号被推送越来越极端的减肥节食内容、Facebook 内部研究证实算法在加剧身材焦虑、但因为提高用户 engagement 仍然继续做了两三年。风霁的回答分两层:第一,国内对内容风险的管控比海外严,催吐这类视频在审核环节就过不了,根本进不了热门第二,那些有风险性的内容很多并不是用户上传的,而是灰黑产有意为之——背后对应的是减肥药、非法减肥机构等利益链条。所以平台的工作有相当一部分是在治理这些灰黑产。

汉洋把这个逻辑往前推了一步:"推荐算法不能是个纯市场经济,它必须有一定的监管在里面。"风霁同意——平台不应该决策 A 观点对还是 B 观点对,但应该管理好下限:这个下限符合法律法规和道德约束。算法迭代的过程,本质上是在跟着社会的工序良俗一起演进。

推荐算法不应该决策到底哪个观点是对的,但是推荐算法应该管理好一个下限,这个下限应符合法律法规和道德约束。

风霁还引出了一个微妙的观察:很多被指责为"新出现的问题",其实并不是新增的,而是过去就存在、只是大家的要求比过去更高了。十年前的推荐系统大家是什么体验?现在没人记得了。"我们要求东西比以前更便宜,比以前更好;要求内容比以前更新颖,茧房比以前更窄。"——

越长大越孤单,是因为我们小时候感受到快乐更容易,而现在对于快乐的要求一直在提高。

六、算法公平性与不可比内容的排序 (1:46:21 - 2:13:13)

关于公平性,风霁的答案是冷峻的:企业经营最重要的是效率,公司根本没有时间也没有动机系统性地反对自己平台上的某一群人,那对公司没有任何利益。

汉洋在某个知名问答网站玩了多年后发现一个现象:自己每个不同政治倾向的朋友都觉得这个平台在系统性迫害他们这一派。"当你认识的朋友足够多,你会意识到咱每个倾向都在被迫害,咱每个观点都不受这个平台支持。"

但当代文化战争已经进入了下一个阶段:早年人们指责对方"用卑鄙手段污染了算法",现在大家接受了"算法是社会的镜子"这个事实,转而开始争"渗透率"——你那 45% 的内容向我这 55% 渗透得更多,说明算法偏袒了你。这已经变成"划江而治、流芒相遇"的争吵了。风霁的判断是:

我们讨论的很多推荐算法争议,本质上是社会问题和哲学问题,并不是单纯的技术问题。

关键在于"什么是公平"本身就没有定义。如果一个观点的支持者占六成,那六四开分发是不是合理?还是应该按照某种"未来正确性"去分?这都不是算法能回答的。算法只能在统计学意义上做纠偏,比如反事实样本、因果推断——区分"个子高的人更富"是因果还是相关。神经模型本质还是基于统计,会有统计偏执,所以需要前述的随机流量、反事实样本来纠偏。但纠偏也可能纠过头——上个月有研究发现大模型在电车难题里"美国白人是最先被牺牲的",因为训练时为了政治正确做了纠偏,结果纠偏过度了。

关于不可比内容的排序——见证视频、擦边舞蹈、机器学习教程、小猫视频该怎么排——风霁的解释是兴趣内做精排、兴趣间做品类隔离和力度约束。最强兴趣先出,第二兴趣次之,每个品类有出量上限,避免一个品类无限霸屏。主题不明确的视频也不会吃亏——任何视频都会被打上一个标签和一个几百维的向量。决定播放量上限的是两件事:你这个主题潜在受众有多少,以及你在同题材里的竞争力如何。

针对创作者的"被压迫"叙事,风霁给出一个量化的判断:算法可能会让一个本应 100 万播放的稿件只拿到 30 万——少一个数量级是有可能的,但不可能让一个本应 100 万的稿件只拿到 1000。如果几家平台都不行,那不是平台联盟在压你,而是题材本身或创作能力的问题。

当然把责任推给推荐算法总是容易的。把责任归结到自己这儿总是难的。

重轻引用 Patreon 老板 Jack Conti 的说法作为最委婉的总结:"如果有足够多的人喜欢你而我没把他们找到,那是我的问题。但如果我的平台就没有这些人呢?这是 the one thing that I can't fix。" 需求本身的问题,是平台无法解决的问题。

七、情绪治理与社区画风的长期价值 (2:13:13 - 2:31:46)

关于情绪治理,风霁给出了一个具体的算法实践:评论区会被大模型识别为友善或不友善的标签。如果一个视频本身没有内容价值,只有引发争议获得流量的价值——评论区都是骂他的——那么在综合目标里它是不占优势的。反过来,如果评论区是关于视频的延展讨论、共鸣分享,会被识别为友善标签,整体被鼓励。

一个社区,从效率逻辑来说,大家希望它是一个观众认为它有口碑的社区,这个对于这个平台发展是更好的。我们很难想象一个平台会认为自己的社区因为有争议、明天大家还来吵架,然后这个平台还能长得很好。

风霁这里把推荐系统的价值拆成了三层:用户价值(活跃度,最容易衡量)、生态价值(品类丰富度、作者结构、内容质量,难以衡量但深刻影响平台未来)、社区价值(评论区氛围、用户口碑、社交传播)。后两者是平台的底线——伤害到生态价值和社区价值的事,绝对不能做,因为它们的反馈周期非常长,要观察很久才能看到代价。

回到 Facebook 当年那个案例——上线"愤怒"和"大笑"按钮、给情绪表达极高权重、提高了 engagement 但两年后发现仇恨言论全冒出来了。风霁的看法是:如果当时业界已经有"用户/生态/社区"三层价值的认知,这个问题不用等两年才能看到。技术认知的进步本身也是一个逐渐演化的过程。

平台如何让用户对自己有整体认知?风霁用了"画风"这个词。它不只是单条内容的好坏,而是用户在什么时间、什么场合、什么心情更倾向于打开你这个 APP——这背后是用户意图。满足某种意图的内容定义了产品的画风。这不再是单纯的推荐技术问题,而是一个产品逻辑问题,甚至是整个公司价值观的问题。"今天这个事可以做,但有可能你要选择不做"——取决于你定义的赛道是什么。

八、AI 驱动下的交互变革与工程师的使命 (2:31:46 - 3:07:10)

未来三到五年,AI 会在三个层面改变推荐:第一,对视频本身的理解会从几百维向量变得更深更充沛第二,推荐技术本身可能借鉴或直接使用大模型——业界还在黎明之前,不知道之后是黑暗还是崭新的明天第三,交互形式可能发生根本变化

风霁畅想了第三点:今天推荐完全靠用户的行为决定结果,但未来用户能不能用文字描述自己理想的推荐状态?也就是说,从纯行为派回到声明式交互。这个想法呼应了重轻一直在追问的一个困惑——为什么算法只信"行为"不信"言语"?

重轻分享了一个朋友的故事:一个群友最近在搜机器学习教程,搜了好多点了好多,但首页相关推荐依然是擦边舞。群里所有人都在笑他:"因为你就是喜欢擦边舞,你天天在这块当个白莲花,宣称想学东西,但其实就想看小姑娘跳舞。"对方说:"没有,我是想看小姑娘跳舞,但我也想学 machine learning。"

这种 cynicism 是在告诉我们一个人的主观愿望、一个人想要成为的样子是完全不重要的,而他行为暴露了一切。

这是行为派与表达派的根本张力。汉洋自己最近在用黑白相机拍佛像,所以会刻意点很多不好看的黑白照片来"养号"。用户在主动训练算法这件事,本身就反映了行为派的局限

风霁给了一个温柔的回应:

我们希望成为的那个人是我们的动力和目标,而平庸的日常生活是滋养我们的,是给我们补能的。

它们并不相斥。你想要成为的样子可以通过搜索来满足,而推荐则补能。十年前推荐没办法满足"我想成为的样子"这个意图,但随着时间推进,这件事可能越来越可能。系统的合理状态不是非黑即白,而是一个能闭环的回应——你表达想学习,系统配合你尝试一段时间;如果你持续没有真实学习行为,系统回到满足你的真实需求;下次你再表达想学习,系统再来配合。"如果你表达了学习而系统没响应,这个系统做得不好;如果你持续没学习,推荐还要给你学习,也是做得不好。"

最后回到工程师的使命。重轻问了一个温情的问题:在所有这些社会矛盾的漩涡里,作为一个无辜的工程师,有什么时刻让你觉得自己的工作有价值?风霁说有两类时刻:一类是技术迭代本身的工程师快乐,参与了很多技术解态升级;另一类更深的快乐,是当他能决定一个产品长什么样的时候——这个产品满足的是一类文化和意图。"我会感觉自己在做一个文化产品,在改变一些东西。"

但说出"改变世界"四个字,风霁笑了一下:"还是有点羞耻。"

我们生活在一个多么 cynical 的世界里面,以至于人们说"我在改变世界"这个话是非常羞耻的,说不出口、难以启齿的。

风霁的总结是平静而诚实的:推荐技术是被时代倒逼出来的——信息在人类生活中的比重越来越大,所以这个技术承担的审视和要求也越来越多。算法有自己的边界——涉及到法律法规、社会公序良俗的不去碰;但什么样的产品形态、什么样的社区氛围、什么样的内容画风是可以主张的。

它不是技术上面没有认知清楚,而可能是社会的工序良俗道德没有给他形成统一的一个认知。如果它形成统一认知,那一天我们既然也就解决这个问题。所以我觉得很多情况下,它是一个互相推动的过程。

汉洋在最后给出了一个清晰的切割:"形式是推荐算法可以干扰的——是推短视频还是长视频、是图文还是视频;但形式下面装着的内容——粽子蘸糖还是吃咸的——是推荐算法很难控制的。今天大部分关于算法的争吵,都打在了内容和形式分不出来的那个东西上。" 短视频会不会让人上瘾、浪费时间?这不是推荐算法的事,这是短视频这种形式本身的事——没有推荐算法的短视频依然是短视频,只是不那么顺滑。

而风霁面对最后那个"留下一个建筑"的问题,给了一个意外的答案:留一本严实的书籍,里面没有什么内容。"不是想给其他人证明什么,而是说一本书就证明人类存在过,有过文明,就 OK 了。" 在做了一辈子让信息更高效流转的工作之后,他想留给下一个物种的,是一个脱离语境也能存在的、单纯指向"这里曾有信息"的容器。

目录与工具

从右向左滑动可关闭