优化胜率而非赔率，把一件事做到理论上该有的样子｜对谈连续创业者 Albert - 主题精读稿

2026年4月10日

优化胜率而非赔率，把一件事做到理论上该有的样子｜对谈连续创业者 Albert - 主题精读稿

前言：从"赌大的"到"做有把握的"——一位连续创业者的思维重构

Albert 过去三年在 AI 领域做了两件事：一次从赔率到胜率的范式切换，以及一次从影像工具到智能本身的思维回归。他把 AI 拆成"想象力"（Q-Time）与"智能"（Save-Time）两条分岔路径，又在 2025 年底意识到 coding 才是智能真正的显化手段。真正的一流企业家从来不是在赌概率，而是在等运气——"运气是你的优势被时间放大的结果"。这期对谈里最锋利的一句话是：优化赔率本质上就是赌博，而把一件事做到"理论上应该有的样子"才是值得押上人生的指导方针。

一、AI 产品三年探索：从互动内容平台到胜率追问的转型 (00:19 - 05:44)

Albert 把自己的三年划分成了两个截然不同的阶段：前半段看赔率，后半段看胜率。 23 年初他对 AI 乐观，天然倾向于做那种"超强网络效应、超强规模效应"的平台型业态。他做过互动内容平台的尝试，做了两个 demo——一个 2D 交互的图像视频 demo，一个把交互改成手机摇杆控制器、甚至在 PC 上做成更像游戏的客户端空间。

做完之后他的体感很直接：很难回答"为什么我不玩原神、为什么不刷抖音"，因为"做出来的东西太烂了"。这句话撬动了一个更深的思考：在内容市场里，创造门槛越高的模态，供给越稀缺，因为用户的时间是有限的，大家只会消费最投入的那 1% 的内容。而当时的 AI 水平顶多能做出 70、80 分的内容。但实际上 80 分的内容其实就是垃圾。

这里他做了一个关键区分：用户的创作动机到底是 for 创作，还是 for 更功利的目的（赚钱或获得影响力）。供给驱动越强的模态，分发侧的障碍就越大——互动内容这种更偏游戏的形式，"你很难做出超越 Steam、超越 App Store、超越 TapTap 的价值和体验"，即使供给爆发，也很难有平台级的机会。

但真正让他转型的不是这些产品判断，而是市场选择。中国市场的特点是，没有强规模效应、强网络效应，你几乎无法在与巨头的竞争中获得任何优势，胜率天然趋近于零。当他转头研究美国市场，发现那里存在大量 niche market，大量确定性更高的机会点。于是 24 年初他完成了从赔率追问到胜率追问的切换：

AI 这个事情是一个非常非常长的赛道，核心还是说要去找一些确定性更高的事情先参与点，然后在这个过程中去锻炼团队，借着认知找手感。

二、AI 组织逻辑转变：Coding 能力平权与交互形式创新 (05:44 - 11:16)

24 年 6 月他找到了那个 niche 切入点，一路 scale，增长相当顺利。到 25 年 9 月前后，外部压力和内部焦虑迫使他重新寻找新的可能性。这一次他做了一个极端的实验：新项目必须人工代码量为 0，完全交给 AI 来写，所有工程化的东西全部交给 AI，职能上也不让工程师参与需求。

这个实验背后有个关键的时间节点。Claude Opus 相比之前模型的变化是——它对规范的 follow 能力有了大幅度的提升，这让非工程师写需求变成了现实。他们推进过程中发现智能的发展已经完全超出预期，并提炼出两个核心视角：

第一个视角是 coding 能力的平权。Cursor 是给程序员的 IDE 工具，Lobo 是给设计师的，Replit 是给产品经理的。Coding agent 这个方向可以不断往下切，切出很多不同用户群。它的本质是：coding 这个权利可以被掌握给很多很多不同的群体。挖到某个群体，为它设计一个好的容器，并对应解决除了 coding 以外要解决的问题，这是第一视角。

第二个视角是交互形式。在不同的任务类型上，AI 的交互会有不同的交互形式——核心是你不能让这个交互本身成为模型的限制，而应该让交互放大在这个场景上模型的能力。"是不是所有的 coding agent 都应该是 chat base，我觉得这个是不一定的。"

回看过去几年，他承认自己走的是一个"矫枉必过正"的循环：从完全优化赔率，切换到"超级接地气"地优化胜率（很多行业里的人看他做的产品都觉得不可思议），再到去年重新导向智能。"又一杆子戳到底，把之前的积累全部忘掉，重新开始。"

三、AI 产品开发：从交互必要过度到导向智能的循环 (11:16 - 15:31)

曲凯在这里让 Albert 把"想象力"和"智能"拆开讲。Albert 解释这个框架最初是用来回答 AI 在 Q-Time 和 Save-Time 两件事上的差异：

Q-Time（刷时间） 服务的是"帮助用户获得某种过程性体验和乐趣"，对应想象力；Save-Time（省时间） 服务的是"帮助用户完成任务、节约成本"，尤其是纯结果向的任务，对应智能。这两种场景刚好呼应了当时模型的两个方向：language model 与多模态模型（video model 和 image model）。

他反复强调自己不愿意用"多模态"这个词，因为在他看来多模态代表的是理解能力，不是生成能力。当时这两个模型还没有看到很好的交汇，今天可能也还不够好。Gemini 有一些尝试——Nano 可能是在 Gemini 底模上把 decoder 改了一下，因为 Gemini 的理解能力变好，图像生成能力也有了更大提升。

在当下这个节点，他正在探索的正是"把智能更好地运用在多模态场景"这件事。

四、多模态与互动内容：工具产品确定性高，容器创新是关键 (15:31 - 23:28)

聊到想象力这一条线，现在大致分成两条路：工具产品（如营销、专业创作）和陪伴/互动内容。Albert 的判断是：工具产品确定性最高、商业化清晰，但产品形态还是上个时代的。 它只是把提供服务的能力从 GAN 换成了 Diffusion。

而关于陪伴和泛娱乐，他抛出了一个很具体的商业约束：今天好模型的溢价一直存在，如果你想做一个娱乐型（非工具生产力向）的产品，想用最好的模型效果几乎不可能——business model 站不起来。所以"距离真的有一些有影响力的东西出来，可能还需要一些时间"。

互动内容为什么难？用户的时间有限，好内容的竞争持续存在，这是一场左脚踩右脚的军备竞赛。短视频之所以能成立，是因为容器本身可以帮用户形成习惯、hack 行为，使人更容易沉迷。而参与成本越高、沉浸感越强的内容（比如游戏），竞争越激烈，最后就是百分之零零零零一的人在创造最好的东西。

那么下一个 AI 时代的抖音，究竟会不会出现？Albert 补充了一个关键观点：最好的内容一定会流向辨识效率最高的地方。这个效率被规模效应和网络效应决定，已经存在的平台天然有巨大优势。如果你只是在工具侧有了制作好内容的能力，那其实也没用——"你做了一个非常好的剪辑软件，这个剪辑软件做出来的内容去哪儿了？去抖音，去 Netflix，不会去别的地方。"

所以容器本身才是决定性的。 Albert 提出了一个产品形态的"三者闭合"框架：用户 × 模态类型 × 内容类型，三者同时交汇，才能定义出一个成功的产品形态。

对于小红书，就是用图文来承载有用内容，给一二线城市的女性，这个东西就闭合了。对于抖音，就是短视频，内容是那些炫酷的运镜、卡点、分段拍摄的剪辑玩法，加上音乐 BGM，给这帮唱跳很好、长得好、摄像头权利很高的人。对于内涵段子，就是图文混拍的搞笑段子，低俗笑话，给 18 线城市的个体户。

单纯的内容题材垂类抵挡不住模态垂类的牵引。抖音是把短视频这个媒介摘下来了，小红书是把图文有用这个媒介摘下来了。Albert 还举了一个反例——是中国第一个做全屏体验的短视频产品，内容形式是动态桌面的分享社区，但内容形式和用户、模态并不 match，虽然一度有规模，最终也没用。

五、AI 娱乐的未来：智能是重要玩家，新公司机会高 (23:28 - 25:44)

曲凯直接追问：你现在相信会有下一个 AI 时代的抖音吗？还是你觉得其实就是抖音？

Albert 用自己离开字节时的判断做铺垫：当时整个移动互联网除了微信以外，没有任何一个 DAU 超过一亿的 native mobile app。中国手机活跃量七八亿 DAU，微信六亿——中间有巨多的机会，"理论上每一个活跃设备都应该有通用软件，也应该会有一些娱乐产品"。他当时并不认为短视频会那么大，这是一个错误判断，两三年后他就看到短视频成了全民级产品。

今天的逻辑是类似的。智能水平已经很强，ChatGPT 已经 6 亿 DAU。在未来所有的活跃设备上，大家都应该在跟智能交互。假定 ChatGPT 会占据这个位置，那么在 ChatGPT 之上或周边，一定会有很多娱乐场景是被智能带来的。

"到底是抖音带来的，还是豆包带来的，还是 ChatGPT 带来的，我不知道。但你能够确定的就是说，在整个范围的用户需求场景下，智能一定会是一个极为重要的玩家，甚至是一个不可或缺的玩家。" 老产品一定会是重要参与者，但新公司和新产品形态的机会——"概率是很高的"。

六、Higgsfield 为什么起得这么快 (25:44 - 31:47)

曲凯把话题拉到一个具体案例：同样做视频生成方向，Higgsfield 起得非常快，而 Albert 的产品做到小几千万美元也已不错，区别究竟是什么？

Albert 拒绝用"Higgsfield 的区别是什么"这个框架回答，他要回答的是影像领域的模型能力和竞争格局。他认为现在影像模型是"多超多强"的格局：Sora 2、Veo 3、可灵分别在不同的维度搜查。一旦出现分布不均，聚合战和全家桶产品就有机会——用户总想用更少的钱享受更多的模型服务，这是必然的。

叠加两个约束：第一，影像需求太大且太分散（社媒创作者、商业体、个体），通用产品是必然；第二，模型能力再强，能用好这些 idea 的人也有限，加上"语言和你想象的图像之间一定有巨大的 loss"，所以一定有人会通过模板的方式来定义审美，降低用户成本。把这些约束叠在一起，产品形态就呼之欲出——就是 Higgsfield 那个样子。

"这个事情我们一开始迭代的时候就已经完全想明白了。"但即使你定义出了这样的产品形态也不够，因为类似的产品行业里很多。真正的核心是：Higgsfield 总能以更好的方式把模型能力卖出来。

视频/图像模型发展太快，总有些任务"一个月之前不行，一个月之后可以"。Albert 把行业拆成两个指标：用户意愿强度 vs 交付能力强度。意愿随着整个 AI 的大 Beta 在快速上升，但交付水平是不断迭代的——用户第一次试用觉得"这东西很好"，结果一用发现是垃圾，第二次再尝试的难度就高了。

而 Higgsfield 最擅长的，是总能很好地分装一个能力来把交付表现出来。一致性做不好时，他推出了 Soul；其他一系列 Drag to Video、灯光控制……他在社媒上能把交互能力卖出去。但仔细看他卖的东西，"卖的东西依然是三分真七分假"。

他们团队对于内容理解的 sense 实在是太好了，以至于他在 showing 这个能力的时候，能够非常好地知道我要怎么去 show，能够扬长避短，然后同样的用户再想要去试用这个能力的时候，会发现怎么都用不出来他说出来的那种效果。

这不是 cherry picking，而是对内容理解的 sense 让他能选择最佳素材让你觉得 amazing。Albert 在这里做了一个精准的概念澄清：套壳这个词是工程师视角——用户只在意你是不是最好的、是不是解决了问题。模型能力越好，对应用就越好，核心是你能不能把模型能力拿出来用好，而且不仅能用好、还能秀好。

七、AI 创业建议：理解模型、审美与执行力 (31:47 - 35:59)

曲凯追问：怎么样才能把一个壳套好？Albert 先自嘲"没有发言权"——自己在这波里做得很差，处于矫枉过正的状态，"生意太好做了，在非常 neat 的 market 里大家互利共赢，那你这怎么搞？就肯定自我麻痹啊"。

但他提出了一个心态层面的分野：如果你只想做个生意，那很简单；但如果你真的要干一个事业，就要回归本质思考，不能有太多投机需求。

曲凯补充了三个维度：对模型有特别深的理解、把模型能力用起来的审美（内容审美 + 产品审美）、极强的执行力与速度（模型一直在变，抢第一个用到新模型的人就能最大化获取价值）。

Albert 在这里抛出了一个更微妙的观察：行业焦虑指数越来越高，因为这个 Beta 太强，随机性也很强。 偶然情况下一些并非本质的东西阶段性会表现出不错结果，但拉长时间潮水会退去。焦虑使大家更想优化这种随机——行业总是在讨论 Manus 怎么搞营销、怎么拍视频、怎么弄，大家就跟着学，但学到的其实是随机结果，忽略了更本质的东西。

他没有给出绝对答案："你拥有更强的定力去找更本质的东西是正确的，还是像一个随机漫步的傻瓜一样靠执行力和速度去 random 到一些东西，我不好说。"但他的倾向很明确：如果你对商业本身没有足够理解，"最终靠运气赚的钱会靠本事输掉"。

曲凯总结："谁能套壳套得又好又快，谁就能赢。" Albert 反问："赢是怎么定义赢？"——"阶段性的数据和估值都涨最快。""就是获得了更多资源。"

八、理解与生成：多模态代表理解能力，Coding 实现智能显化 (35:59 - 39:51)

Albert 再次强调他的术语洁癖：多模态代表的是理解能力，不是生成能力。 他刚才一直在说 video model 和 image model，就是刻意避免说"多模态"。

Gemini 3 的理解能力大幅跃进已经看到了。目前在理解能力的大幅提升上，"可能也只有 Google 在算力上的优势比较明显"。而更关键的追问是：这个理解能力能否反向提升智能本身？ Albert 认为这是大家相对乐观的方向，理解能力越来越强，能解锁的场景会越来越多。"当眼睛戴了脑子会怎么样？这个问题也是现在我还在想的问题。"

曲凯接上一句——过去几年智能是最大的杠杆，而 Albert 他们没有最好地用到，Manus 是最好用到的典型例子。Albert 的反驳很锋利：

过去智能是模型最大的杠杆，我觉得不是。我觉得就是 coding。它其实跟智能没关系，就是智能的显化是要通过 coding 来完成的，只有 coding 才能超出本来智能的那个界限。

想把 coding 能力用好，你再早也没用——至少要到 Sonnet 3.5，再到 Opus。"从什么时候开始都挺好，反正那个方向能力一天一个样子。"他对 coding 平权有执念的原因很朴素——亲身经历了自己不会写代码，借助 coding agent 完成自己的任务，"我觉得这个权利就应该平权给更多高价值场景、更多的人"。即使 coding agent 现在的融资水平和收入规模已经很大，但渗透率仍然是"九牛一毛"。

九、优化胜率：定义重要问题，消费者导向 (39:51 - 51:55)

这里是整期播客最核心的思想转折。曲凯的提问直接：绝大多数创始人都在优化赔率，你怎么看这两者？

Albert 的答案犀利：绝大多数创始人优化赔率，是因为这样比较好拿钱——因为 VC 在优化赔率。 他甚至承认中国创业者尤其喜欢优化赔率，因为退出渠道窄。但他进一步说，真正走到这一层思考的人很少，大多数人只是因为"这样好拿钱"，甚至区分不了赔率和胜率。

他的顿悟来自和张一鸣的一次对话——张一鸣问他"为什么不做更有把握的事情？"。由此他意识到：上一波一流企业家其实全都是在优化胜率，只是他们有人赛道本身赔率就高。

张一鸣在 PC 互联网尾巴做搜索，对信息分发有执念，14 年海外已经有 Vine 等短视频产品火起来的时候他并不着急，一直优化胜率到 16 年才正式下场做视频；
黄峥 PC 时代做电商，一直关注供给侧和流量端变化，自己在供应链做了很多生意，拼多多的结构性机会出现时他抓住了；
王兴做美团时——"在当时那个时间点里，所有做团购的人、所有懂线下的人都没有我们懂线上，所有懂线上的人都没有我们懂线下。做校内的时候手底下就管 200 人的地推团队。"；
季逸超（小红）一直做浏览器插件的生意，从 17、18 年到 23 年，再到 Manus——"他其实一以贯之地在积累优势"。

真正的一流企业家其实都是在优化胜率，没有人在优化赔率。优化赔率你这个不是赌博吗？

曲凯的反应很直接："按你这么讲，优化胜率跟优化赔率其实不是一个选择题，它是一个很清晰的正确与否的问题——你觉得就是应该优化胜率，而且优化胜率才能最终有可能得到更大的赔率。"

Albert 给出了那句核心表达：运气是你的优势被时间放大的结果，你的赔率是等来的。

选择赔率可能高的方向没错，但路径的行动一定是胜率的优化。他区分说："优化赔率"不是完全的伪概念——"我要做一个什么什么抖音"、"因为什么什么足够大，所以我要做什么什么"，这就是赔率思维。在第一天你是说不出你要做抖音的，你应该讲的是你要解决什么问题。

曲凯举了字节赛马作为"优化胜率的方法"，Albert 修正说那已经是另一种问题了——字节今天的规模下必须获胜，"不是优化赔率"。关于"大力出奇迹"，Albert 明确："一鸣动不动就说 all in 是偷懒，他其实还是很胜率追问的。"

从赔率到胜率最实际的行为转变是什么？——做更有把握的事。控制变量，当一个事情变量太多、不可预测性太多、超出能力范围的东西太多，就尽量不选择；尽量去选择那些可以控制的东西。"你企业的阶段和体量不一样，你能控制的东西也不同。"

在段永平与张一鸣的对比上，Albert 的判断非常有趣：字节给人带来巨大错觉——它让你对完美主义有更强倾向，但实际上很多事情都很难做得很完美，追求把一件事做到理论上应该的样子，非常非常困难；另一件错觉是让你以为自己能用第一性原理想问题，但第一性原理需要庞大的资源，否则条件不成立，大多数时候你还是要在约束下想问题。

他的结论很清晰：字节偏强者思维，段永平偏弱者思维。 张一鸣要跟一流的人做有挑战的事，操作难度很大；段永平强调文化，认为大家都是普通人，但在好文化下找到值得去创造价值、能找到差异化价值的方向，普通人也能做出很大成绩。

十、创业公司选择：优化个人能力，看重看风景的心态 (51:55 - 59:58)

曲凯追问一个更尖锐的问题：优化胜率是不是容易让人变得更保守——因为做擅长的事胜率更高，那什么时候该做改变？

Albert 的答案回到段永平的核心信条：做生意最重要的是消费者导向。 你不会不拥抱 AI，因为你知道它对消费者有用。但反过来，如果一个东西对你的消费者没好处，你有其他方法能更好地服务消费者，你就不做它，这跟保守没关系。真正的问题是：当你讲赔率的时候，你的优化目标不再是消费者导向，而变成了市占率导向或估值导向，事情就出问题了。

曲凯精准地提炼了这个分野："如果你站在自己的角度，只想自己擅长什么，其实就是比较封闭、比较保守的。但如果你站在结果和目标导向的话，就好了。" Albert 补了最关键那句："这个结果和目标是消费者导向。"

关于"把一件事做到理论上应该有的样子"这句话，Albert 澄清："这只能是一个理想国，更重要的是你要接受不完美，它更多是个心态问题——你怎么能够在看到这件事情很不完美的情况下，又认为我应该尽力把它做到理论的样子。"曲凯类比"做正确的事"，Albert 纠正："这不是做正确的事，这是正确地做事，是 how to，不是 why。"

对于 2026 年该做什么样的事，Albert 的答案回到两个"道"：多模态（理解能力）值得被利用；coding 平权+与之同步找到好的交互方式，在这个场景下更好地释放模型能力。"这两个肯定都是指引我们很重要的道，至于术呢，就非常非常多了。"

最后谈到应聘者应该怎么选公司——Albert 的回答扩展了"优化胜率"的边界：任何一个应聘者他思考的角度，本质都是在优化自己的能力、视野、信息质量，这其实就是胜率。 "不是说优化胜率就得不到赔率，只有在优化胜率的时候，你得到赔率的概率才会变高。"

反面例子就是：自己不认可公司做的事、觉得人也不太行，但听说明年要上市、融资不错所以去——典型的优化赔率。

但 Albert 在最后又拔高了一层："你真正最后的究竟的思考方式，核心还是放平心态——你选择一家公司就是在选择看什么风景，最后你的能力到底能不能变现我觉得不重要，你看什么风景这个很重要。"

曲凯感叹："这个心态就太难了，我觉得有这个心态比优化赔率还难。" Albert 引用段永平："中国人的文化里多了一些急功近利的东西，美国这样心态的人可能是更多的，尤其是这些一流的人。" 什么心态？—— "就是看风景啊，就是过程啊。"

十一、团队文化：耐心、求知欲与科幻畅想 (59:58 - 1:05:38)

Albert 描述自己公司的精神状态是由三层构成的：

第一是强信心与信念——"我们对创业这件事情本身会更有耐心，在这些道的指导下，我们终将创造价值，终将变成我们想要变成的样子。"这让他在遇到极端情况时非常淡定——即使老业务突然没了、从盈利公司变成巨亏公司，他的心态也会很正常，"因为已经经历过很多次这样的时刻"。

第二是 Stay hungry, stay foolish——一旦觉得一件事情有意思，就不遗余力地搞明白它的本质、它为什么有意思、它能创造什么价值。

第三是 Stay peace and love——接受困难一定会发生，遇到问题就讨论问题究竟是什么。

关于能力锻炼，Albert 的回答反直觉："能力是被你的机会决定的，你只要是有想法、有意愿的人，在我们这就是无穷多的机会。你的能力只被你自己的意愿和想法决定。"

曲凯问他的 sharpness 从哪来，Albert 否定了这个评价："说话比较极端就容易 sharp，sharp 只是个表达方式，其实没什么特别的。一个人满口胡言但很绝对，你也会觉得很 sharp。你很容易像 AI 一样说了很多听起来很有道理的东西，实际执行下来根本不是这样。"

真正的方法论是提问。 提问 push 你去评价自己的方案到底 OK 不 OK，再去修正这个方案。再往下推就是同理心和想象力，核心是意愿——你要愿意提问。"我们公司的人可能都不想跟我聊天，因为总是拉着他们说'我觉得这个可能有问题''我觉得这不是最终的样子'。"

最后是一段科幻畅想。Albert 讲了一个他觉得有意思的故事：有一个 AI 信徒，相信一切都是注定的、一切都是被证明的。他试图集合全世界的算力构建所有被证明的约束——脑科学、生物学、物理学的第一性原理。把这些约束全部注入模型，让它演化，借助外力改变参数，使它逐渐对齐地球发展的过程：第一个生物出现→人类出现→对齐今天。然后他发现这个发展停留在一个循环里——他发现在那个世界中也有一个人，构建了所有的算力去预测未来会怎么样。

对未来的所有想象都是在预测未来中。

往前提一点，就是再造一个社会出来。我们像观察员，甚至参与者。里面有人在赚钱、有人在生活、有人在发生各种各样的事情。虚拟世界跟线下其实就差不太多了。"你可以在任意一个角落以任意的方式扮演一个角色，在那个世界中成为一个演员，然后重新过一遍人生，在那个世界中创业，没有问题。"

What if——两个、三个、五个、一百个、五百个这样的世界，每个世界里都有自己的经济系统，有无穷无尽的人在这些世界中获得收益，这些收益反哺到我们这个世界里。

曲凯接一句——马斯克说过现实世界虚拟的概率非常高。Albert 的回应是闭环："就是我刚刚那个推论——最后就是你预测世界的方式，未来的显化其实就是不断在预测未来。"