优化胜率而非赔率,把一件事做到理论上该有的样子|对谈连续创业者 Albert - 主题精读稿
优化胜率而非赔率,把一件事做到理论上该有的样子|对谈连续创业者 Albert - 主题精读稿
前言:从"赌大的"到"做有把握的"——一位连续创业者的思维重构
Albert 过去三年在 AI 领域做了两件事:一次从赔率到胜率的范式切换,以及一次从影像工具到智能本身的思维回归。他把 AI 拆成"想象力"(Q-Time)与"智能"(Save-Time)两条分岔路径,又在 2025 年底意识到 coding 才是智能真正的显化手段。真正的一流企业家从来不是在赌概率,而是在等运气——"运气是你的优势被时间放大的结果"。这期对谈里最锋利的一句话是:优化赔率本质上就是赌博,而把一件事做到"理论上应该有的样子"才是值得押上人生的指导方针。
一、AI 产品三年探索:从互动内容平台到胜率追问的转型 (00:19 - 05:44)
Albert 把自己的三年划分成了两个截然不同的阶段:前半段看赔率,后半段看胜率。 23 年初他对 AI 乐观,天然倾向于做那种"超强网络效应、超强规模效应"的平台型业态。他做过互动内容平台的尝试,做了两个 demo——一个 2D 交互的图像视频 demo,一个把交互改成手机摇杆控制器、甚至在 PC 上做成更像游戏的客户端空间。
做完之后他的体感很直接:很难回答"为什么我不玩原神、为什么不刷抖音",因为"做出来的东西太烂了"。这句话撬动了一个更深的思考:在内容市场里,创造门槛越高的模态,供给越稀缺,因为用户的时间是有限的,大家只会消费最投入的那 1% 的内容。而当时的 AI 水平顶多能做出 70、80 分的内容。但实际上 80 分的内容其实就是垃圾。
这里他做了一个关键区分:用户的创作动机到底是 for 创作,还是 for 更功利的目的(赚钱或获得影响力)。供给驱动越强的模态,分发侧的障碍就越大——互动内容这种更偏游戏的形式,"你很难做出超越 Steam、超越 App Store、超越 TapTap 的价值和体验",即使供给爆发,也很难有平台级的机会。
但真正让他转型的不是这些产品判断,而是市场选择。中国市场的特点是,没有强规模效应、强网络效应,你几乎无法在与巨头的竞争中获得任何优势,胜率天然趋近于零。当他转头研究美国市场,发现那里存在大量 niche market,大量确定性更高的机会点。于是 24 年初他完成了从赔率追问到胜率追问的切换:
AI 这个事情是一个非常非常长的赛道,核心还是说要去找一些确定性更高的事情先参与点,然后在这个过程中去锻炼团队,借着认知找手感。
二、AI 组织逻辑转变:Coding 能力平权与交互形式创新 (05:44 - 11:16)
24 年 6 月他找到了那个 niche 切入点,一路 scale,增长相当顺利。到 25 年 9 月前后,外部压力和内部焦虑迫使他重新寻找新的可能性。这一次他做了一个极端的实验:新项目必须人工代码量为 0,完全交给 AI 来写,所有工程化的东西全部交给 AI,职能上也不让工程师参与需求。
这个实验背后有个关键的时间节点。Claude Opus 相比之前模型的变化是——它对规范的 follow 能力有了大幅度的提升,这让非工程师写需求变成了现实。他们推进过程中发现智能的发展已经完全超出预期,并提炼出两个核心视角:
第一个视角是 coding 能力的平权。Cursor 是给程序员的 IDE 工具,Lobo 是给设计师的,Replit 是给产品经理的。Coding agent 这个方向可以不断往下切,切出很多不同用户群。它的本质是:coding 这个权利可以被掌握给很多很多不同的群体。 挖到某个群体,为它设计一个好的容器,并对应解决除了 coding 以外要解决的问题,这是第一视角。
第二个视角是交互形式。在不同的任务类型上,AI 的交互会有不同的交互形式——核心是你不能让这个交互本身成为模型的限制,而应该让交互放大在这个场景上模型的能力。"是不是所有的 coding agent 都应该是 chat base,我觉得这个是不一定的。"
回看过去几年,他承认自己走的是一个"矫枉必过正"的循环:从完全优化赔率,切换到"超级接地气"地优化胜率(很多行业里的人看他做的产品都觉得不可思议),再到去年重新导向智能。"又一杆子戳到底,把之前的积累全部忘掉,重新开始。"
三、AI 产品开发:从交互必要过度到导向智能的循环 (11:16 - 15:31)
曲凯在这里让 Albert 把"想象力"和"智能"拆开讲。Albert 解释这个框架最初是用来回答 AI 在 Q-Time 和 Save-Time 两件事上的差异:
Q-Time(刷时间) 服务的是"帮助用户获得某种过程性体验和乐趣",对应想象力;Save-Time(省时间) 服务的是"帮助用户完成任务、节约成本",尤其是纯结果向的任务,对应智能。这两种场景刚好呼应了当时模型的两个方向:language model 与多模态模型(video model 和 image model)。
他反复强调自己不愿意用"多模态"这个词,因为在他看来多模态代表的是理解能力,不是生成能力。当时这两个模型还没有看到很好的交汇,今天可能也还不够好。Gemini 有一些尝试——Nano 可能是在 Gemini 底模上把 decoder 改了一下,因为 Gemini 的理解能力变好,图像生成能力也有了更大提升。
在当下这个节点,他正在探索的正是"把智能更好地运用在多模态场景"这件事。
四、多模态与互动内容:工具产品确定性高,容器创新是关键 (15:31 - 23:28)
聊到想象力这一条线,现在大致分成两条路:工具产品(如营销、专业创作)和陪伴/互动内容。Albert 的判断是:工具产品确定性最高、商业化清晰,但产品形态还是上个时代的。 它只是把提供服务的能力从 GAN 换成了 Diffusion。
而关于陪伴和泛娱乐,他抛出了一个很具体的商业约束:今天好模型的溢价一直存在,如果你想做一个娱乐型(非工具生产力向)的产品,想用最好的模型效果几乎不可能——business model 站不起来。所以"距离真的有一些有影响力的东西出来,可能还需要一些时间"。
互动内容为什么难?用户的时间有限,好内容的竞争持续存在,这是一场左脚踩右脚的军备竞赛。短视频之所以能成立,是因为容器本身可以帮用户形成习惯、hack 行为,使人更容易沉迷。而参与成本越高、沉浸感越强的内容(比如游戏),竞争越激烈,最后就是百分之零零零零一的人在创造最好的东西。
那么下一个 AI 时代的抖音,究竟会不会出现?Albert 补充了一个关键观点:最好的内容一定会流向辨识效率最高的地方。 这个效率被规模效应和网络效应决定,已经存在的平台天然有巨大优势。如果你只是在工具侧有了制作好内容的能力,那其实也没用——"你做了一个非常好的剪辑软件,这个剪辑软件做出来的内容去哪儿了?去抖音,去 Netflix,不会去别的地方。"
所以容器本身才是决定性的。 Albert 提出了一个产品形态的"三者闭合"框架:用户 × 模态类型 × 内容类型,三者同时交汇,才能定义出一个成功的产品形态。
对于小红书,就是用图文来承载有用内容,给一二线城市的女性,这个东西就闭合了。对于抖音,就是短视频,内容是那些炫酷的运镜、卡点、分段拍摄的剪辑玩法,加上音乐 BGM,给这帮唱跳很好、长得好、摄像头权利很高的人。对于内涵段子,就是图文混拍的搞笑段子,低俗笑话,给 18 线城市的个体户。
单纯的内容题材垂类抵挡不住模态垂类的牵引。抖音是把短视频这个媒介摘下来了,小红书是把图文有用这个媒介摘下来了。Albert 还举了一个反例——是中国第一个做全屏体验的短视频产品,内容形式是动态桌面的分享社区,但内容形式和用户、模态并不 match,虽然一度有规模,最终也没用。
五、AI 娱乐的未来:智能是重要玩家,新公司机会高 (23:28 - 25:44)
曲凯直接追问:你现在相信会有下一个 AI 时代的抖音吗?还是你觉得其实就是抖音?
Albert 用自己离开字节时的判断做铺垫:当时整个移动互联网除了微信以外,没有任何一个 DAU 超过一亿的 native mobile app。中国手机活跃量七八亿 DAU,微信六亿——中间有巨多的机会,"理论上每一个活跃设备都应该有通用软件,也应该会有一些娱乐产品"。他当时并不认为短视频会那么大,这是一个错误判断,两三年后他就看到短视频成了全民级产品。
今天的逻辑是类似的。智能水平已经很强,ChatGPT 已经 6 亿 DAU。在未来所有的活跃设备上,大家都应该在跟智能交互。 假定 ChatGPT 会占据这个位置,那么在 ChatGPT 之上或周边,一定会有很多娱乐场景是被智能带来的。
"到底是抖音带来的,还是豆包带来的,还是 ChatGPT 带来的,我不知道。但你能够确定的就是说,在整个范围的用户需求场景下,智能一定会是一个极为重要的玩家,甚至是一个不可或缺的玩家。" 老产品一定会是重要参与者,但新公司和新产品形态的机会——"概率是很高的"。
六、Higgsfield 为什么起得这么快 (25:44 - 31:47)
曲凯把话题拉到一个具体案例:同样做视频生成方向,Higgsfield 起得非常快,而 Albert 的产品做到小几千万美元也已不错,区别究竟是什么?
Albert 拒绝用"Higgsfield 的区别是什么"这个框架回答,他要回答的是影像领域的模型能力和竞争格局。他认为现在影像模型是"多超多强"的格局:Sora 2、Veo 3、可灵分别在不同的维度搜查。一旦出现分布不均,聚合战和全家桶产品就有机会——用户总想用更少的钱享受更多的模型服务,这是必然的。
叠加两个约束:第一,影像需求太大且太分散(社媒创作者、商业体、个体),通用产品是必然;第二,模型能力再强,能用好这些 idea 的人也有限,加上"语言和你想象的图像之间一定有巨大的 loss",所以一定有人会通过模板的方式来定义审美,降低用户成本。把这些约束叠在一起,产品形态就呼之欲出——就是 Higgsfield 那个样子。
"这个事情我们一开始迭代的时候就已经完全想明白了。"但即使你定义出了这样的产品形态也不够,因为类似的产品行业里很多。真正的核心是:Higgsfield 总能以更好的方式把模型能力卖出来。
视频/图像模型发展太快,总有些任务"一个月之前不行,一个月之后可以"。Albert 把行业拆成两个指标:用户意愿强度 vs 交付能力强度。意愿随着整个 AI 的大 Beta 在快速上升,但交付水平是不断迭代的——用户第一次试用觉得"这东西很好",结果一用发现是垃圾,第二次再尝试的难度就高了。
而 Higgsfield 最擅长的,是总能很好地分装一个能力来把交付表现出来。一致性做不好时,他推出了 Soul;其他一系列 Drag to Video、灯光控制……他在社媒上能把交互能力卖出去。但仔细看他卖的东西,"卖的东西依然是三分真七分假"。
他们团队对于内容理解的 sense 实在是太好了,以至于他在 showing 这个能力的时候,能够非常好地知道我要怎么去 show,能够扬长避短,然后同样的用户再想要去试用这个能力的时候,会发现怎么都用不出来他说出来的那种效果。
这不是 cherry picking,而是对内容理解的 sense 让他能选择最佳素材让你觉得 amazing。Albert 在这里做了一个精准的概念澄清:套壳这个词是工程师视角——用户只在意你是不是最好的、是不是解决了问题。模型能力越好,对应用就越好,核心是你能不能把模型能力拿出来用好,而且不仅能用好、还能秀好。
七、AI 创业建议:理解模型、审美与执行力 (31:47 - 35:59)
曲凯追问:怎么样才能把一个壳套好?Albert 先自嘲"没有发言权"——自己在这波里做得很差,处于矫枉过正的状态,"生意太好做了,在非常 neat 的 market 里大家互利共赢,那你这怎么搞?就肯定自我麻痹啊"。
但他提出了一个心态层面的分野:如果你只想做个生意,那很简单;但如果你真的要干一个事业,就要回归本质思考,不能有太多投机需求。
曲凯补充了三个维度:对模型有特别深的理解、把模型能力用起来的审美(内容审美 + 产品审美)、极强的执行力与速度(模型一直在变,抢第一个用到新模型的人就能最大化获取价值)。
Albert 在这里抛出了一个更微妙的观察:行业焦虑指数越来越高,因为这个 Beta 太强,随机性也很强。 偶然情况下一些并非本质的东西阶段性会表现出不错结果,但拉长时间潮水会退去。焦虑使大家更想优化这种随机——行业总是在讨论 Manus 怎么搞营销、怎么拍视频、怎么弄,大家就跟着学,但学到的其实是随机结果,忽略了更本质的东西。
他没有给出绝对答案:"你拥有更强的定力去找更本质的东西是正确的,还是像一个随机漫步的傻瓜一样靠执行力和速度去 random 到一些东西,我不好说。"但他的倾向很明确:如果你对商业本身没有足够理解,"最终靠运气赚的钱会靠本事输掉"。
曲凯总结:"谁能套壳套得又好又快,谁就能赢。" Albert 反问:"赢是怎么定义赢?"——"阶段性的数据和估值都涨最快。""就是获得了更多资源。"
八、理解与生成:多模态代表理解能力,Coding 实现智能显化 (35:59 - 39:51)
Albert 再次强调他的术语洁癖:多模态代表的是理解能力,不是生成能力。 他刚才一直在说 video model 和 image model,就是刻意避免说"多模态"。
Gemini 3 的理解能力大幅跃进已经看到了。目前在理解能力的大幅提升上,"可能也只有 Google 在算力上的优势比较明显"。而更关键的追问是:这个理解能力能否反向提升智能本身? Albert 认为这是大家相对乐观的方向,理解能力越来越强,能解锁的场景会越来越多。"当眼睛戴了脑子会怎么样?这个问题也是现在我还在想的问题。"
曲凯接上一句——过去几年智能是最大的杠杆,而 Albert 他们没有最好地用到,Manus 是最好用到的典型例子。Albert 的反驳很锋利:
过去智能是模型最大的杠杆,我觉得不是。我觉得就是 coding。它其实跟智能没关系,就是智能的显化是要通过 coding 来完成的,只有 coding 才能超出本来智能的那个界限。
想把 coding 能力用好,你再早也没用——至少要到 Sonnet 3.5,再到 Opus。"从什么时候开始都挺好,反正那个方向能力一天一个样子。"他对 coding 平权有执念的原因很朴素——亲身经历了自己不会写代码,借助 coding agent 完成自己的任务,"我觉得这个权利就应该平权给更多高价值场景、更多的人"。即使 coding agent 现在的融资水平和收入规模已经很大,但渗透率仍然是"九牛一毛"。
九、优化胜率:定义重要问题,消费者导向 (39:51 - 51:55)
这里是整期播客最核心的思想转折。曲凯的提问直接:绝大多数创始人都在优化赔率,你怎么看这两者?
Albert 的答案犀利:绝大多数创始人优化赔率,是因为这样比较好拿钱——因为 VC 在优化赔率。 他甚至承认中国创业者尤其喜欢优化赔率,因为退出渠道窄。但他进一步说,真正走到这一层思考的人很少,大多数人只是因为"这样好拿钱",甚至区分不了赔率和胜率。
他的顿悟来自和张一鸣的一次对话——张一鸣问他"为什么不做更有把握的事情?"。由此他意识到:上一波一流企业家其实全都是在优化胜率,只是他们有人赛道本身赔率就高。
- 张一鸣在 PC 互联网尾巴做搜索,对信息分发有执念,14 年海外已经有 Vine 等短视频产品火起来的时候他并不着急,一直优化胜率到 16 年才正式下场做视频;
- 黄峥 PC 时代做电商,一直关注供给侧和流量端变化,自己在供应链做了很多生意,拼多多的结构性机会出现时他抓住了;
- 王兴做美团时——"在当时那个时间点里,所有做团购的人、所有懂线下的人都没有我们懂线上,所有懂线上的人都没有我们懂线下。做校内的时候手底下就管 200 人的地推团队。";
- 季逸超(小红)一直做浏览器插件的生意,从 17、18 年到 23 年,再到 Manus——"他其实一以贯之地在积累优势"。
真正的一流企业家其实都是在优化胜率,没有人在优化赔率。优化赔率你这个不是赌博吗?
曲凯的反应很直接:"按你这么讲,优化胜率跟优化赔率其实不是一个选择题,它是一个很清晰的正确与否的问题——你觉得就是应该优化胜率,而且优化胜率才能最终有可能得到更大的赔率。"
Albert 给出了那句核心表达:运气是你的优势被时间放大的结果,你的赔率是等来的。
选择赔率可能高的方向没错,但路径的行动一定是胜率的优化。他区分说:"优化赔率"不是完全的伪概念——"我要做一个什么什么抖音"、"因为什么什么足够大,所以我要做什么什么",这就是赔率思维。在第一天你是说不出你要做抖音的,你应该讲的是你要解决什么问题。
曲凯举了字节赛马作为"优化胜率的方法",Albert 修正说那已经是另一种问题了——字节今天的规模下必须获胜,"不是优化赔率"。关于"大力出奇迹",Albert 明确:"一鸣动不动就说 all in 是偷懒,他其实还是很胜率追问的。"
从赔率到胜率最实际的行为转变是什么?——做更有把握的事。控制变量,当一个事情变量太多、不可预测性太多、超出能力范围的东西太多,就尽量不选择;尽量去选择那些可以控制的东西。"你企业的阶段和体量不一样,你能控制的东西也不同。"
在段永平与张一鸣的对比上,Albert 的判断非常有趣:字节给人带来巨大错觉——它让你对完美主义有更强倾向,但实际上很多事情都很难做得很完美,追求把一件事做到理论上应该的样子,非常非常困难;另一件错觉是让你以为自己能用第一性原理想问题,但第一性原理需要庞大的资源,否则条件不成立,大多数时候你还是要在约束下想问题。
他的结论很清晰:字节偏强者思维,段永平偏弱者思维。 张一鸣要跟一流的人做有挑战的事,操作难度很大;段永平强调文化,认为大家都是普通人,但在好文化下找到值得去创造价值、能找到差异化价值的方向,普通人也能做出很大成绩。
十、创业公司选择:优化个人能力,看重看风景的心态 (51:55 - 59:58)
曲凯追问一个更尖锐的问题:优化胜率是不是容易让人变得更保守——因为做擅长的事胜率更高,那什么时候该做改变?
Albert 的答案回到段永平的核心信条:做生意最重要的是消费者导向。 你不会不拥抱 AI,因为你知道它对消费者有用。但反过来,如果一个东西对你的消费者没好处,你有其他方法能更好地服务消费者,你就不做它,这跟保守没关系。真正的问题是:当你讲赔率的时候,你的优化目标不再是消费者导向,而变成了市占率导向或估值导向,事情就出问题了。
曲凯精准地提炼了这个分野:"如果你站在自己的角度,只想自己擅长什么,其实就是比较封闭、比较保守的。但如果你站在结果和目标导向的话,就好了。" Albert 补了最关键那句:"这个结果和目标是消费者导向。"
关于"把一件事做到理论上应该有的样子"这句话,Albert 澄清:"这只能是一个理想国,更重要的是你要接受不完美,它更多是个心态问题——你怎么能够在看到这件事情很不完美的情况下,又认为我应该尽力把它做到理论的样子。"曲凯类比"做正确的事",Albert 纠正:"这不是做正确的事,这是正确地做事,是 how to,不是 why。"
对于 2026 年该做什么样的事,Albert 的答案回到两个"道":多模态(理解能力)值得被利用;coding 平权+与之同步找到好的交互方式,在这个场景下更好地释放模型能力。"这两个肯定都是指引我们很重要的道,至于术呢,就非常非常多了。"
最后谈到应聘者应该怎么选公司——Albert 的回答扩展了"优化胜率"的边界:任何一个应聘者他思考的角度,本质都是在优化自己的能力、视野、信息质量,这其实就是胜率。 "不是说优化胜率就得不到赔率,只有在优化胜率的时候,你得到赔率的概率才会变高。"
反面例子就是:自己不认可公司做的事、觉得人也不太行,但听说明年要上市、融资不错所以去——典型的优化赔率。
但 Albert 在最后又拔高了一层:"你真正最后的究竟的思考方式,核心还是放平心态——你选择一家公司就是在选择看什么风景,最后你的能力到底能不能变现我觉得不重要,你看什么风景这个很重要。"
曲凯感叹:"这个心态就太难了,我觉得有这个心态比优化赔率还难。" Albert 引用段永平:"中国人的文化里多了一些急功近利的东西,美国这样心态的人可能是更多的,尤其是这些一流的人。" 什么心态?—— "就是看风景啊,就是过程啊。"
十一、团队文化:耐心、求知欲与科幻畅想 (59:58 - 1:05:38)
Albert 描述自己公司的精神状态是由三层构成的:
第一是强信心与信念——"我们对创业这件事情本身会更有耐心,在这些道的指导下,我们终将创造价值,终将变成我们想要变成的样子。"这让他在遇到极端情况时非常淡定——即使老业务突然没了、从盈利公司变成巨亏公司,他的心态也会很正常,"因为已经经历过很多次这样的时刻"。
第二是 Stay hungry, stay foolish——一旦觉得一件事情有意思,就不遗余力地搞明白它的本质、它为什么有意思、它能创造什么价值。
第三是 Stay peace and love——接受困难一定会发生,遇到问题就讨论问题究竟是什么。
关于能力锻炼,Albert 的回答反直觉:"能力是被你的机会决定的,你只要是有想法、有意愿的人,在我们这就是无穷多的机会。你的能力只被你自己的意愿和想法决定。"
曲凯问他的 sharpness 从哪来,Albert 否定了这个评价:"说话比较极端就容易 sharp,sharp 只是个表达方式,其实没什么特别的。一个人满口胡言但很绝对,你也会觉得很 sharp。你很容易像 AI 一样说了很多听起来很有道理的东西,实际执行下来根本不是这样。"
真正的方法论是提问。 提问 push 你去评价自己的方案到底 OK 不 OK,再去修正这个方案。再往下推就是同理心和想象力,核心是意愿——你要愿意提问。"我们公司的人可能都不想跟我聊天,因为总是拉着他们说'我觉得这个可能有问题''我觉得这不是最终的样子'。"
最后是一段科幻畅想。Albert 讲了一个他觉得有意思的故事:有一个 AI 信徒,相信一切都是注定的、一切都是被证明的。他试图集合全世界的算力构建所有被证明的约束——脑科学、生物学、物理学的第一性原理。把这些约束全部注入模型,让它演化,借助外力改变参数,使它逐渐对齐地球发展的过程:第一个生物出现→人类出现→对齐今天。然后他发现这个发展停留在一个循环里——他发现在那个世界中也有一个人,构建了所有的算力去预测未来会怎么样。
对未来的所有想象都是在预测未来中。
往前提一点,就是再造一个社会出来。我们像观察员,甚至参与者。里面有人在赚钱、有人在生活、有人在发生各种各样的事情。虚拟世界跟线下其实就差不太多了。"你可以在任意一个角落以任意的方式扮演一个角色,在那个世界中成为一个演员,然后重新过一遍人生,在那个世界中创业,没有问题。"
What if——两个、三个、五个、一百个、五百个这样的世界,每个世界里都有自己的经济系统,有无穷无尽的人在这些世界中获得收益,这些收益反哺到我们这个世界里。
曲凯接一句——马斯克说过现实世界虚拟的概率非常高。Albert 的回应是闭环:"就是我刚刚那个推论——最后就是你预测世界的方式,未来的显化其实就是不断在预测未来。"