OpenClaw 之后,谁将定义主动式 AI 的新战场?|对谈 AirJelly 黄柏特 - 主题精读稿
OpenClaw 之后,谁将定义主动式 AI 的新战场?|对谈 AirJelly 黄柏特 - 主题精读稿
前言:重新定义 Enter 键的主动式 AI 新物种
当 OpenClaw 以一套简洁的派框架重新定义 Agent 的执行能力时,一个更根本的问题浮现出来:Agent 能执行得多好,取决于它对用户意图和上下文理解得有多深。AirJelly 创始人黄柏特给出的答案是重新定义键盘上那个被遗忘的键——Enter。在人与人(IM)、人与 AI(Chatbot)、人与信息(浏览器搜索)三种交互范式下,用户都通过 Enter 表达意图。捕捉 Enter 那一刻的截图,就是捕捉意图本身。本期对谈中,黄柏特与天使投资人李一豪讨论了从 MyContext 到 AirJelly 的演化路径、OpenClaw 浪潮下创业公司的壁垒构建、主动式 AI 的定义之争,以及为什么"童年是和平年代的假象"这句话能概括一个 24 岁创业者的紧迫感。
一、AirJelly:你的主动式上下文感知伙伴 (00:00 - 00:53)
Koji 在开场抛出一个暴乱式的判断:我们今天与 ChatGPT、OpenClaw、Manas、Cloud Code 的互动方式,很可能不是最有效率的方式。黄柏特正是相信这个判断并为之努力的创业者之一。
用一句话介绍,AirJelly 是一个主动式上下文感知伙伴,它能够记住你在任何地方做的事情,并在恰到好处的时候主动来帮助你。黄柏特今年 24 岁,毕业于西安电子科技大学,ENTP、摩羯座,公司八个人,刚完成天使轮,第二轮正在推进。
二、从 MyContext 到 AirJelly:从编年体到纪传体 (00:53 - 03:02)
黄柏特校招进字节,做了半年开源项目产品经理,开源项目叫 MyContext——在 GitHub 上有 5000 多个粉丝。MyContext 的核心思路是:所有 AI 对话都在通过 Chat 获取 context,但直接对视觉进行理解应该是更第一性、更本质的方式。它每 15 分钟做一次周期性截图,进行存储和分析。
从 MyContext 到 AirJelly 有两点关键升级。过去它是一部编年体史书,现在是一部纪传体史书——不再是周期性分析,而是去分析具体的事件,因此能更精确地了解任务和意图。另一点是叠加了执行能力:AirJelly 原生接入了 OpenClaw 底层的派框架,可以调用 Skill、操作电脑、使用浏览器,再叠加上过去获取到的各种记忆。这种组合形成了一加一大于十的效果:既有最强的 context,又有最前沿的模型执行能力。
三、AirJelly 重新定义 Enter 键:意图捕获的关键 (03:02 - 04:11)
AirJelly 过去的截图频率是 15 秒、30 秒,也尝试过很多方案,但现在他们想到了一件最 sharp 的事情。Cursor 重新定义了 Tab,Tablet 重新定义了 Fn,而 AirJelly 要重新定义的是 Enter。
当前乃至未来长期的趋势,人与人的聊天还是要通过 IM,人与 AI 的聊天其实是通过 Chatbot,人与外界信息交互的方式其实是通过浏览器的 search,这三种方式它表达意图其实都是通过 Enter。
所以 AirJelly 会在每次按下 Enter 的那一刻进行截图,获取用户那一刻的意图和相关的上下文,从而对用户的意图和行为轨迹有一个最棒的建模。用 Enter 之后,最大的改变是没有了噪音——过去到时间就截图,即便你在无序浏览也会被截下来,但 Enter 能确保一定是你的意图。这是一个可以理解为"高光"的时刻。
四、AirJelly 的魔法时刻:有人看着你工作 (04:11 - 05:13)
作为天使投资人,李一豪是 AirJelly 最早的用户之一。他说 AirJelly 最大的魔法时刻是"有人看着你工作"这样一种非常神奇的体验。Manas、OpenClaw 的体验也非常好,但它们的 context 主要来自对文件的理解;而实际上用户有大量跨 AI、跨 Facebook、跨不同工具的连续性 context,AirJelly 可以很好地感知这些,并基于这些主动性地与你交互,甚至规划特别长程和复杂的任务。
正如黄柏特所总结:我们捕获的就是最有价值的 context。
五、投资 AirJelly 的故事:独立思考与坚定信念 (05:13 - 06:56)
李一豪讲述了投资 AirJelly 的故事。去年 9 月底 Cloud Code Agent SDK 发布,伴随 Post Training 模型出来,QuickStone 一直关注垂直方向的 context 收集。9 月 30 号 MyContext 开源项目发布,投资豆包的小伙伴提到"有非常激进的 context 劫持方案"。李一豪觉得太 sharp,就找到了黄柏特,在北京星巴克喝了一次咖啡。
那次对话让李一豪感觉到两件事:第一,黄柏特对这个问题背后有非常长时间的连续性思考;第二,他身上散发着有代表性的年轻创业者的雄心,不设限,对任何事情都有非常主动性的思考——他做 proactive,他自己也是个 proactive 的人。更打动的是在来回碰撞的过程中,经历了 Cowork 发布、OpenClaw 出现的挑战,黄柏特展现出非常独立的思考、坚定的信念,对于打法、市场布局、优秀人才的渴望都自然而然地不断出来。
六、Cloud Code 的冲击与 AirJelly 产品定义的浮现 (06:56 - 09:16)
去年 12 月,黄柏特团队定的方向是 Task Engineering——围绕 Task 进行建模,把 Cloud Code 简易化。他们认为 Cloud Code 当时的 Todo 不够,要把它建模成 Task。一开始非常兴奋,感觉事情做得非常对。
但 12 月 20 号 Cowork 出来,一月多 Cloud Code 最新版也把 Todo 改成了 Task。这既兴奋又崩溃:兴奋在于产品直觉被验证了,悲伤在于团队完全处在了 Cloud Code 的延长线上,它的框架改进和简易化完全把自己吃掉了,12 月到 1 月的尝试相当于白费。
此后团队分三层分析产品机会。第一层是简易化——最容易想到,但没有价值;第二层是多进程和人机协作的编排流——效果不错,但 Cloud Code 很快在蚕食,长期没有壁垒;第三层是回到 MyContext 积累的 context 获取、存储、召回能力,因为 context 这块是 Cloud Code 没法直接涉猎的。最终产品形态是:把简易化带来的执行能力,加上过去积累的 context。
七、Web Coding 作为创业指南针:30 分才是好生意 (09:16 - 09:53)
被冲击之后,黄柏特团队总结出一条判断方向的规则:试着把它 Web Coding 出来,如果出来发现已经有 60 分或 80 分,那这样的产品就不需要做了,因为毫无壁垒。AirJelly 用很棒的 Web Coding 时间尝试后,只做出了 30 分——context 获取理解有大量 bad case,边缘的东西做得不好。黄柏特认为这就对了,因为这样才会让它有壁垒。
Web Coding 出来的产品不够好,才是创业的空间所在。
八、开源的理解:框架是最佳选择 (09:53 - 11:16)
黄柏特本科时参与过 Digiville 的开源项目,自己工作室做过一个叫 SurroundApp 的开源项目(模型训练监测的国产化替代),后来又做了 MyContext。他把开源分成几类:一类是面向普惠化的开源,另一类是作为框架的开源,第三类是像 MyContext 这样作为应用的开源。
现在他的感觉是,开源最应该做的是框架,因为框架能让社区真正去不断完善,也是让大家适配你生态的最好方式。对创业公司来说,如果有一个基建希望它成为某种生态,就一定要把它开源出来,借助社区的力量把它做大。
九、AirJelly 内部使用:用 AI 写 AI 与跨 App 简历检索 (11:16 - 14:03)
黄柏特团队内部的 AirJelly 使用 moment 非常多。
第一个是用 AirJelly 写 AirJelly。 最早的工作流程是在 Gemini 或 ChatGPT 聊天,然后去 Cursor 写代码,但 Gemini 上没有 AirJelly 相关信息,传输到 Cursor 时也有大量 context 损耗。有一天黄柏特尝试直接用 AirJelly 自己写 AirJelly,发现真的可以——跟 AirJelly 聊某个功能是怎么实现的,它就通过看过的文档和代码分析出来,然后给出改进方向,直接帮忙写代码、提交 PR。二月多实现了这个闭环后,现在每天都在 AirJelly 上问它"你怎么迭代自己"。设计同学也在 AirJelly 开发 AirJelly——让 AirJelly 写需求"让桌面的水母戴上一个帽子",很快真的就戴上了。那位设计同学看到 case 视频后,20 分钟直接从学校打车过来加入团队。
第二个是跨 App 召回简历。 招聘时简历散落各处,黄柏特让 AirJelly 帮忙找某人的简历。有个 case:对方没发 PDF,发的是图片,本地文件搜索后没找到。这时 AirJelly 召回了一段记忆——之前在 BOSS 直聘上看过 XXX,跟想找的那个人是同一个,于是它去 BOSS 直聘验证那条信息,再去本地的微信聊天记录把那张图片捞出来分析。黄柏特说这个 case 非常震惊:它不再是检索不到就断掉,而是会不断搜索相关事件。因为 AirJelly 存了所有跨 App 的 Contacts,所以它很有可能在某个地方找到蛛丝马迹,然后顺藤摸瓜把信息找出来。
微信的聊天数据是加密的,但文件会存在本地。传统应用因为缺少 context 很难解锁,而 AirJelly 因为有聊天相关的事件记忆,可以顺藤摸瓜找到。
十、主动式 AI 的定义与 AirJelly 的独特之处 (14:03 - 17:28)
主动式 AI 是 2026 年非常热门的方向。黄柏特用辩论人的思维先定义:广义的主动式 AI,只要是 AI 主动推送给你的都算——包括 Reminder、ChatGPT 的 Pulse、OpenClaw 的 Heartbeat 机制等。但他认为这太广义了,不是真正的主动式 AI 智能。
真正的主动式 AI 智能,需要走到两个东西:你在某个场景明确的意图,以及你在那个场景的上下文。基于意图和上下文才能对你进行主动式推送。
目前市面上的玩家,比如 Proactor 做会议场景,豆豆游戏伙伴做游戏场景——都不是真正 general 的 proactive,而是限定在某个场景。最大的原因是他们获取 context 的方式不够广泛,只能在小的场景里知道意图和上下文。
AirJelly 通过 Enter 获取了三类意图:人和人通过 IM、人和 AI 通过 Chatbot、人和信息通过互联网——这是最前沿的意图。然后会把 Enter 捕获的意图一系列加工成 Event 和 Task。Task 包含两部分:progress(当前进展)和 next step(根据进展和意图推测接下来要做的事)。基于 next step 做 proactive trigger,就能在 general 的生产力场景中获取上下文和意图,做最直接的推送。
十一、Context 的属性与组织形式:捕获高光时刻 (17:28 - 21:08)
黄柏特把 context 分成几种属性:意图 context 是对主动式最有帮助、也最有价值的;信息 context、文本 context 价值相对较小,因为可以通过读文件或网络搜索得到。
在组织形式上,为什么 Coding Agent 率先取得最好的发展?因为它的 context 不止是代码文件,还有代码目录,能获得很多增量信息。AirJelly 也做类似的加工,把 context 组织成两类:一类是 Event(事件),把原始意图和后续迭代组成事件,形成清晰的全局认知和下一步预测;另一类是 entity(人、关键事物),以 graph 形式组织。召回时只需要召回 entity 和 event 就足够。
Event 的获取本身很难——传统 Chat 很难获得全量上下文。AirJelly 采取 VOM + OCR 的方式,再加上一系列工程步骤,确保能获取某一刻的意图、当前所有上下文以及前因后果。对应还设计了 Event 的召回、合并、随时间衰减等配套记忆工作。
当 Koji 质疑"真正掌握最多 context 的还是电脑、手机、未来的眼镜耳机,你作为上面的软件只能拿到一部分"时,黄柏特给出了一个很好的类比:
我本身是一个大量读历史的人,历史其实有个特点,不是发生的每一个事件都是历史,不是发生的每一个事情都会被记录在历史书里。
历史书记录的是关键性的、对世界产生影响的事件。全量的录音、录屏其实包含大量噪音,所有 context 的权重是一样的,这是不对的。更本质的事情是去捕获其中的高光,把意图以及关键性节点记录下来。这是历史,也是人生——人生就是一些关键性节点组成的。
十二、AirJelly 的优势:激进的 Context 获取与隐私 Tradeoff (21:08 - 22:45)
对于 ChatGPT、Manas、Siri 这些产品是否可能拥有更多 context 的优势,黄柏特的判断是:它们本质还是 Chatbot,通过对话获取上下文。但对于人来说,视觉获取周围的上下文和意图占了 95% 以上,所以单一的对话模式拿到的上下文非常少。如果不从 context 获取的源头去改变,就无法达到 AirJelly 能实现的主动式。
Mac 或手机厂商确实可能从源头获取这部分机会,但 AirJelly 这么激进的 context 获取方式,本质是"用隐私去 tradeoff efficiency"。对大公司来说会有很多隐私方面的担忧,用户也担心大公司拿这部分隐私作恶。创业公司反而可以做更精准的冲锋,找到小部分死忠人群,这就够了。
十三、AirJelly 的壁垒:记忆与工程实践 (22:45 - 24:33)
黄柏特认为所有 2C Agent 应用最核心的壁垒是记忆。用户在 AirJelly 上使用一个月、三个月,会有大量记忆留存下来,这部分记忆想迁走是比较困难的——心智已经留在这里,迁不走记忆也就不容易迁走。
第二个壁垒是工程实践。屏幕截图记录这件事听上去很符合直觉、也比较简单,但想要做好有大量的工程细节要调试、大量的 case 要调整。海外有个产品叫 Dayflow 做过类似的事,效果远没达到 AirJelly 的程度。所以大厂一时半会儿也做不出同样的效果。
十四、AirJelly 的主动式 AI:顺着延长线推动 (24:33 - 26:14)
李一豪补充了一个 AI 时代的商业机会:最早第一批用户和核心 user case 群里,能发现高价值客户和高价值问题。到了 AI 时代,构建成本越来越低的过程中,定义问题本身就是价值——理论上存在你能定义出问题,它就能被解决。AirJelly 有机会第一批遇到这批人,并把他们的高价值问题 trap 进去。也许尖锐的问题会被巨头一波波撸走,但最终剩下的象牙塔可能就是 AirJelly。
这引出了黄柏特对主动式 AI 的一个非共识观点。他和团队看了国内外大量主动式 AI 项目(Proactor、Brawl、逗逗游戏伙伴、Pulse、OpenClaw Hobby 机制),发现大家经常在做的事情是发散——基于现有信息猜测你可能想额外了解什么。它做的是一个发散的事,某种程度是在增加你的认知负担。
AirJelly 的主动式是围绕用户的意图和下一步,顺着用户的延长线做一个推动。不会额外增加用户负担,而是推测你下一步要做什么,主动地递给你,帮你推进当前任务。用户是非常乐意说"那你帮我执行一下吧"的。
十五、主动式 AI 的提醒频率与 QuickStone 的重点方向 (26:14 - 28:14)
关于主动式 AI 的频率平衡问题,黄柏特把主动式分成两类:一类是提醒(Reminder),比如录播客要通知;另一类是执行或发散。目前团队观察到的经验是阅读用户的工作状态——当用户从一个应用 switch 到其他应用,说明处于相对没那么专注的状态,这时主动询问是否需要帮助,接受度会更高,也不会觉得受打扰。再加上用户反馈信号(Dismiss/Got),能反馈迭代频率,做到千人千面的适配。
李一豪确认主动式 AI 是 QuickStone 今年重点看的方向。去年八九月份已经投了两个团队(包括 AirJelly 和豆包的一个小团队),都是在 Proactive 方向激进的团队。在 right timing 给你最好的结果本身,这种神奇体验是最魔法时刻的。
十六、QuickStone 的三大投资方向 (28:14 - 30:12)
李一豪介绍 QuickStone 的三大方向:
第一是 Agent Talk——垂直追问、敢于做尖锐度探索。花精力最多,AirJelly、豆包、之前的 Mizen、Memobot 都在这个方向。随着更好的模型出来,23、24 年不敢探索的问题(社交、个人代理、对外深网络、社会性网络探索)现在可以探索了。
第二是 Agent Infra。OpenClaw 遇到很多现实落地问题——身份验证、安全、数据库、网络、云端本地结合,有太多工程漏洞。Web Coding 只能做 30 分的大部分场景都与这些有关。像 Resend、SoftBase、Memory 这样的重要基建会更多出现。
第三是 Built for Agent Hardware。硬件本身是为了获取更多 context——让你的人生、环境信息更多地给予 Agent。比如 QuickStone 的 ODIS,虽然 focus 在健康饮食,但实际上已经包含大量 context。一个程序员在关注健康饮食的同时,工作也一定同样被很好地劫持了。
十七、水母与龙虾的对比:感知能力与 Agent 框架 (30:12 - 31:32)
AirJelly 的宣传片里有水母和龙虾的对比。黄柏特的解释是:龙虾最典型的意象是钳子,代表执行能力非常强,但它在水底爬行,知道的事情非常少——因为核心还是通过 Chat,能获取的信息有限。而水母做到了更多的波态、更智能的意图获取,感知到的 context 是几何倍数增加。
AirJelly 的 Agent 框架参考了龙虾——龙虾最核心是它背后的派,那套框架非常简洁只有四个工具,配合模型能力有非常强的效果。AirJelly 同样用了派内核框架,搭配 Context 和 Memory,体验比龙虾要强非常多。
十八、AirJelly 如何在无限膨胀中保持效率 (31:32 - 33:01)
对于记忆不断膨胀的效率问题,黄柏特从两点说明。
第一是量级上限。 现在数据库和 rerank 的能力在企业场景能支持上万个 PDF 的海量切片,承载上限非常强。AirJelly 作为个人产品,一天可能就是 200 多张截图,量级很小,承载能力没有任何减损。
第二是效果。 信息污染问题通过两个机制解决。一是 merge——新的 entity 信息进来会和过去的 entity 合并更新,比如今年 24 岁,去年 23 岁;对 event 和 task 也有 merge,update the progress,确保是最新的。二是召回算法——带时间衰减系数,用混合检索和重排确保效果。
十九、龙虾的启发:Agent 框架与养成概念 (33:01 - 34:10)
OpenClaw(龙虾)发布对 AirJelly 有两点核心启发。
第一是 Agent 框架。 最早一版只想做记录然后分析,但接了龙虾的派之后发现真的很强大,有各种 Magic 效果,所以决定把龙虾这个底层框架接进来。
第二是"养龙虾"这个概念。 Manas 是一个很好用的工具,用户的耐心取决于"第一次进去能不能帮我完成任务"。龙虾是一个不断养成的过程,效果不好可能是你觉得自己没养好。AirJelly 作为海洋动物,也结合水母在 Enter 上有一个养的方式——Enter 得越多,水母积攒的记忆和 context 就越多,效果也会越来越好,这能最大化用户的耐心。
二十、Proactive 产品:长程陪伴与相互互动 (34:10 - 35:30)
Koji 观察到一个有趣变化:过去人们对工具的耐心是"出 bug 就是工具没做好",但现在龙虾出 bug,大家只会觉得"我的龙虾怎么又偷懒了,是不是我没养好",甚至去参加线下聚会学养虾心得。
李一豪总结了这种混合性变化:从 Proactive 产品出现以后,人是情感性的、信息驱动的生物,当与它有了一定的陪伴和交流属性以后,提高了容忍度、留存了更多记忆,这些记忆又反方向循环你和它的共情能力。也许从今年开始的产品本身就天然有这种属性——它已经不再是工具了,是长程陪伴、相互互动、主动性的产品。
黄柏特补充,从拉玛(羊驼)、千问、龙虾开始,有一个动物形象非常关键——它能延展出很多可能性,也更加亲切,尤其对 Personal 或 Proactive Agent 来说。
二十一、为什么选择通用方向:谦虚与相信 AI (35:30 - 37:49)
在主动式 AI 多数产品选择垂直方向的情况下,AirJelly 为什么坚定选通用?黄柏特给出两层原因。
表层原因是 Manas 的启发。 Manas 一开始用最前沿的模型能力加上套壳组合,让大家感受到 magical,大量用户涌进来后收敛到几个场景(PPT、Research 等模板)。所以先做通用、让大家涌进来、让用户的时间去收敛具体场景,是非常棒的产品思考。
更本质的原因是两件事情。
一是谦虚。作为产品开发者不是要教用户"这个东西必须这么用",而是相信用户会有奇思妙想,把好的用法吸收进产品。
二是相信 AI 的能力。如果把 AI 限定死功能,其实是一种隐性的 workflow——隐性框定了数据的流转和执行。作为 general,本质就是尊重最前沿模型能力的发展、尊重用户的奇思妙想、相信 AI 的能力。
二十二、创业公司的 CEO 也是一种供给:定义新框架的能力 (37:49 - 39:29)
李一豪从投资人视角做了补充。创业者最重要的是 self-positioning——如果创业公司的 CEO 也是一种供给,你怎么理解自己在市场里的定位。当你有极大的雄心和资源驾驭能力的时候,就应该走向 general。反过来要问自己:你有没有设计新框架、定义新游戏的能力,以及全球宣发能力。AirJelly 是这样的团队就应该合作,因为每年这样的窗口期越来越短。
但对大部分创业者,李一豪仍鼓励走推陈路径——用每年更新的框架解决垂直问题。而且 OpenClaw 出现那一刻,思维已经改变了,结合人格化产品本身,你本质上在造一个人。路径也可能不一样:一个垂直行业里只需要十个、最多一百个专家能把专业能力在你的产品里复制、代理出来,就已经是极好的产品了。
二十三、AirJelly 招聘:宣发、开发与 Research (39:29 - 41:30)
黄柏特插播招聘。首投会有几千万,公司分三块:一是宣发侧,marketing 会成为科技公司超级有价值的部分;二是开发,只要熟练使用 AI 工具的产品经理、后端、前端都欢迎;三是 Research,方向包括 Agentic AI Skill、GUI Agent 的 computer use、以及视觉理解召回所需的 VOM 模型微调。支持 project 和 remote 形式。
二十四、一家不开会的公司:古希腊广场式的运作 (41:30 - 43:44)
AirJelly 是一家不开会的公司。黄柏特认为会议本质是对信息的批次处理,是一种积压后统一对齐。
AirJelly 的做法是:日常线下坐在一起,简单问题直接流式沟通。内部在实验 AirJelly Team 版本实现两个功能:一是 AirJelly 之间对话,弥补团队信息 gap(比如你的 feature 和别人的可能 conflict 会被提醒);二是可以提问某个人的 AirJelly 来了解工作进度,不需要打断对方。但前提是伙伴自己选择 share,绝对不做监视。
客户会议仍要开(因为客户还没 AirJelly)。Team 版本完善后,投资人也可以通过 Group 直接问黄柏特的 AirJelly 了解团队进展。
至于长期战略讨论,他们轮流在黑板上写东西、发表演讲和构想:
我们把这个定义成古希腊的一种广场,就我们轮番上广场来发表演讲和改想,然后进行一个长期的愿景的规划。
二十五、持续低熵:有序、活力与真相 (43:44 - 45:18)
公司名字"持续低熵"有三层含义。
第一层是热力学的有序——熵衡量系统的混乱程度,低熵意味着有序,希望带给人们永续。
第二层是生物学的生命维持——薛定谔提出"生命以负熵为生",生命维持行动需要不断输入能量降低熵。AirJelly 想通过产品和 AGI 的 token,增强看屏人的有序性和活力。作为 startup 也不希望未来长大后染上大公司病,希望公司保持有活力、不僵死的状态。
第三层是信息学和 AI 的角度——信息学上熵衡量信息密度,AI 角度上交叉熵衡量预测分布和真实分布的接近程度。在这两点做到低熵,是希望通过产品让未来的人机协作越来越接近某种真相、接近更高级的知识形态。
二十六、如何建立信任:技术与情感 (45:18 - 47:09)
作为新创业公司,让用户把大量屏幕截图(包括微信)开放给你,信任怎么建立?黄柏特分两个方向。
技术上:符合当地法规、端到端加密,所有信息(图片、contacts)都存本地、不会上云。还有一套 PII 系统,自动将人名等机密信息脱敏化(比如改成 person1)。
情感上:设计可爱的水母形象,让用户感到更可以接受。
长期来看这也是用户教育问题。用隐私换便利,早期可能就是几十万量级的用户能接受——但这对创业公司反而是好事,这个量级对 AirJelly 已经是非常可口的美食,大公司觉得太少不会做。所以在竞争上,隐私其实是 AirJelly 的一个护城河。
二十七、手机端与硬件适配:全量 Context 获取 (47:09 - 49:32)
如果只有 PC 端,用户的手机记忆就是残缺的,会分不清水母知道什么。黄柏特的回应是:这某种程度是幸福的烦恼。
首先,PC 是最贴近生产力的,绝大多数生产力场景都在 PC 上完成闭环,已经覆盖 50%,整体效果已经非常棒。然后团队会逐步扩展 context 获取途径:第一步是手机(可能通过悬浮球或按键触发获取);长期会和硬件厂商合作。QuickStone Mafia 里有个叫 ODIS 的硬件做这方面探索。
一个巧合但本质必然的事情是:硬件获取的信息和屏幕截图都是通过 VOM——直接获取世界本身的样子和信息,所以它们天然是打通的。未来通过硬件适配,可以把硬件、手机和 PC 的信息打通,实现最全量的工作场景 context。
二十八、微信数据获取:Enter 与 Event 设计 (49:32 - 52:32)
微信是 Contacts 最大的宝藏之一,但像一座城堡。AirJelly 通过截图获取,但 Enter 的时机可能错过群聊上下文。黄柏特讲了两个应对措施。
第一是 Event 的设计。 绝大多数聊天场景是一问一答,当前回复和之前的提问能通过 event 设计合并在一起,短对话的来龙去脉都能联系起来。
第二是 Enter 习惯的泛化。 对于长段对话拿不到的情况,通过鼓励用户平时也按 Enter 来补充额外信息。长期设想是参考 Tablet 的短按、长按、连按双击的设计,结合 Enter 与 Command 等组合键,甚至在组合键时输入语音补充上下文。
Koji 总结:这是让用户把 Enter 也变成一种习惯,不断为水母主动提供 context。黄柏特回应:
其实我觉得 Enter 这个习惯是我认为是键盘上最重要的一个键,只是它一直被遗忘。让用户想起来,其实 Enter 是你表达意图最好的方式。
二十九、应对模型进步:动态学习与人才拓展 (52:32 - 54:13)
面对模型不断进步、巨头越来越狼性的背景,李一豪从投资人角度讲三件事。
第一是动态共同学习成长。 这个时代 VC 能提供价值是什么?是市场水位在哪里、有什么前沿方向。这些信息在有自己思考和总结后,对创业者很重要——不管选垂直还是 general、守正还是出奇,投资人可以作为 benchmark。
第二是人才网络。 现在有三四个团队的联创是通过 QuickStone 介绍进去的,未来希望能更多帮助。
第三是业务合作拓展。 从 HR、视频制作到和 Koji 这样的内容人合作。"问题是你能不能想到为创业者做这些事情,为创业者提供更多维度的服务。"
三十、QuickStone 的 AI Native 工作方式 (54:13 - 56:03)
随着 Cloud Code、OpenClaw 出来,对 QuickStone 这种新创、人少、激进的机构帮助实在太大。大量工作可以自动化——扫 GitHub、扫小红书项目,尤其是带着大量复杂零散 context 去寻找东西和人时效率非常高。
内部实践希望所有信息能结构化存储——聊项目、LP、业务合作方、大厂大佬、技术专家,所有信息以项目和人相互交叉的维度做知识结构化存储。好处是任何人对外都可以全量知识性输出、有更好的结构性表达,还能更统一表达机构的文化和沟通风格。等 AirJelly 做得更好以后,QuickStone 会用它把平时开会、对外讲的东西沉淀下来,塑造自己的水母——"我们就不做龙虾了,我们就做我们的水母"。
三十一、AirJelly 失败的可能性:不够快与火候的艺术 (56:03 - 58:15)
"假如三五年之后 AirJelly 失败了最大的失败会在哪里?"黄柏特先把时间尺度缩短:AI 时代三五年是伪命题,只聊一到两年内。
第一个失败可能是不够快。 提出了比较好的新范式但触达用户太慢,等到大厂下场时还没积累足够用户和记忆留存,会被大厂吃掉。
第二个是一个"点"——研发火候的艺术。 一方面要用隐私换 efficiency,要拿到足够多 context 让 agent 执行效果足够 magical;另一方面用户对隐私的接受程度有限。在用户还没准备好的时候要了太多隐私,团队声誉臭掉就不对了。所以需要一个丝滑的切入节点——少部分人能心安理得接受的营销度,同时具备足够好的 efficiency 提升。这是一个火候的艺术。
黄柏特还预告 AirJelly 将在 3 月 18 号左右开放内测。
三十二、未来的人机协作:高度共生与一人一 Agent (58:15 - 1:00:37)
如果人类和 AI 最佳的工作配合方式最终是 AirJelly 发明的,那会是什么画面?黄柏特畅想:未来的人机协作一定是人机高度共生的。每个人都有自己的 personal agent,拥有你最全量的生产力相关信息。大量 personal agent 组成网络或 group,AI 和 AI 之间可以进行协作,起两个作用:
第一是代替你进行打工或生产——把你的 personal skill 能力带过去。
第二是成为你的新型伙伴——非常了解你,和你一起协作,类似宠物小精灵的感觉。未来会是生产力极度发达、personal agent 让你感到不孤独、心灵有很好慰藉的时代。
为什么是 Personal Agent、一人一 Agent?这源自朴素的哲学思考:
婚姻制之所以是一对一,因为一对一其实它具备一种稳定的特殊性。
黄柏特认为一定是一夫一妻制式的人机关系。因为 agent 某种程度是自己的延伸或影子,如果是一对多,就是你的 slave,但在 agent 能力注定超过人类的情况下,它成为你的 slave 在哲学上就说不通。
三十三、辩论思维:不断深化与寻找最优场景 (1:00:37 - 1:02:53)
AI 创业圈有很多辩论队出身的人(明钊平、陈敏等)。黄柏特澄清了对辩论的常见误解,并讲了辩论对创业的两点帮助。
第一是认知不断深化。 辩论双方各持己见看似偏激,但简单地说"A 对 B 也对"就不够了。持各自观点才能拆解:A 的 A 部分是对的,A 的 B 部分没那么对但也不错,C 部分在某些场景成立——这样能找到 A 到底在哪些场景、什么情况下比 B 更对。
第二是辩论和创业非常像。 创业出来会被问"为什么别人没做,为什么现在做",一定是因为有某些问题长期能被解决、或者在某类 case、某个 vertical 成立。辩论也一样——抱着一个注定不那么完美的观点去不断打磨,想它在什么情况合适、什么场景最优。换算到创业:产品不需要在所有人群、所有场景、所有时刻都棒,只需要找到某类人群、某类场景,在现在或三个月后的某一刻是对的就足够。
李一豪补充:辩论对大学生特别好,因为大学生对社会各行各业还没有亲身体验,辩论是在没有实体绝对体感的情况下,持不同角度进行思维完善、互搏的动态过程。
三十四、AI 时代:童年是和平年代的假象 (1:02:53 - 1:04:39)
黄柏特刚毕业半年就选择创业而不在大厂积累。他用一句话概括:
童年是和平年代的假象。
和平时代每年都是一样的——18 岁迎接高考,充分准备,只和同届的 18 岁人竞争。但 AI 时代对所有人类都是一样的——2022 年底 ChatGPT 出现,2025 年 Agent 已经发展得非常不错,创业的时间窗口在缩紧。2026 年不管你在任何阶段,都应该去这个赛道尝试。刚校招的、工作几年的、二十几三十几岁的,其实大家时间都是一样的,大家一起冲刺。
它是一个 AI 时刻,我觉得某种情况是一个 AGI 对全人类现况的一个宣战,它是一个战争时刻,所以没有你的童年去发育了,就大家赶紧冲吧。
李一豪呼应:总有些人对时代浪潮和节点更敏感,敏感背后还有一种时不我待的 urge——"天将降大任于斯人也,必须冲出去"。作为投资人就要投这种人。
三十五、2026 的期待:成为年轻人想要加入的公司 (1:04:39 - 1:07:16)
关于 2026 的预期:
李一豪的答案: 尽快度过 OpenClaw 这个浪潮——它只是概念,真正要做的是更 AI 原生——关注 Contacts、关注 Proactive、关注模型最前沿的进展。今年在 computer use 方向、联合技术、更长程任务上会有更大突破,创业者要基于新的模型进展和框架找应用点。
黄柏特的答案更有意思。 聊 2026 前先聊 2025:2025 年 3 月他还是一个听 Manas 播客的人,一年之后就上了 Koji 的播客;2025 年底 Manas 被收购,他也已经出来创业了。2025 的发展完全超出预期,所以对 2026 不给自己设天花板。
2026 年他唯一希望达成的事情是:25 年底决定创业时看了大量创业公司也想过加入他们,当时作为一个有点代表作的年轻人身处迷茫,最终觉得自己出来做更好。那在 2026 年底——希望成为这样的一家公司:如果有一个可能也是做出了某个开源项目或者是发了一个很厉害 paper 的年轻人,他希望去找一个要加入的地方,那里就是 AirJelly。
Koji 在收尾时想到 2025 年初肖宏预言的"跳变"——2025 一定会跳跃式变化、但怎么变不知道。"2025 会跳变,我相信 2026 也会跳变。"