E231|从B2B到A2A:Agent新基建,如何让"一人企业"做全球生意? - 主题精读稿
E231|从B2B到A2A:Agent新基建,如何让"一人企业"做全球生意? - 主题精读稿
前言:当 AI Agent 坐上 B2B 贸易的高铁
全球 B2B 贸易交易额高达 30 万亿美元,但数字化渗透率依然低得惊人。本期硅谷 101 中,主持人泓君对话阿里巴巴国际业务部总裁张阔,从一个大厂核心业务掌舵人的视角,拆解 AI 如何重塑 B2B 贸易的全链路。张阔提出了一个锐利的判断标准:面对新模型,你的组织是兴奋、焦虑还是毫无感觉——最后一种才是最危险的。围绕阿里巴巴的 AI 工具 Accio 和升级版 Accio Work,他详细阐释了从 B2B 走向 A2A(Agent to Agent)的路径,以及为什么衡量 AI 成功的标准不是消耗了多少 token,而是单位 token 能产生多少价值。
一、硅谷 AI 创业生态:多元化、分层与价值导向 (00:01 - 04:53)
硅谷与国内 AI 发展的最大差异,不在于信息的快慢,而在于创业生态的结构性不同。张阔观察到,硅谷的 AI 创业呈现出明显的多元化和分层特征——不只有应用层的热闹,底层基础设施同样涌现出大量角色。Together AI、Fireworks 这类公司的存在,是为了帮助上层应用更容易地获取模型、更低成本地做推理。再往上一层,有专注于语音转文字等垂直能力的小公司(如 WhisperFlow),它们在某个细分领域始终保持领先身位。
你感觉好像是大模型前面会去做这些方向,但就是有非常多的小公司在某一些垂直领域里面能做得比别人快一步。永远你感觉在推土机前面几十米在跑,但一直能保持一定的身位。
这种分层生态意味着大公司也愿意采用中小企业提供的技术领先产品,而非什么都自己做。
与此同时,SaaS 行业并非如外界所说的"已死"。张阔看到不少 SaaS 公司成功转型——一家帮助连锁餐饮和线下超市招聘小时工的公司,用 Agent 替代了传统的短信通知系统。蓝领工人跟 Agent 交互后,了解穿什么衣服、车停哪里、社会保障如何计算等细节,到岗率显著提升。AI 的加持让 SaaS 产品更好用,而基于 token 的计量方式,可能是比传统订阅制更优的下一代商业模型基础。
不过,硅谷的资金涌入和创业热情背后,核心问题仍然是能否产生实际价值。北美中小企业并不理解"token economy"是什么,但它们一定理解 ROI 是什么。
二、OpenClaw 与 Claude Cowork:技术门槛与价值留存的差异 (05:51 - 11:10)
GTC 期间,黄仁勋力推 OpenClaw,核心逻辑是 token 经济——单 token 算力成本的指数级下降将催生大量应用。但张阔认为,OpenClaw 还不是一个开箱即用的产品,配置门槛挡住了很多人,更关键的是长期留存下来的工作流非常有限。相比之下,Claude Cowork 虽然仍处于 research preview 阶段,但其分层开放架构、产品设计体系,以及与 Anthropic 模型之间的高度匹配,已经展现出下一代工作台或 Agent Platform 的雏形。
两者的差异并不简单是"2C 对 2B"。OpenClaw 开源、泛化能力强,可以接入多个模型和工具,但开放性过强反而成了问题——用户进去之后不知道该做什么,强化学习的设计和安全性也面临挑战。Claude Cowork 的定位更清晰:面向知识工作者——开发人员、分析师、律师——处理邮件、文档、电子表格和互联网信息交互的问题。
关于"AI 应该一步到位还是分步执行"的争论,张阔提供了一个精确的数学直觉:如果一个播客制作有 18 个步骤,每步误差 10%,那么 90% 的 18 次方约等于一个不可用的结果。Agentic 工具的核心在于成为"工具的工具",允许用户在每一步进行校正和验证,把差错率压到最低。 不同的人用同一个产品,最终要用出自己的样子,因为想要完成的事情不一样。用户基于自身专业知识给出反馈,AI 不断强化学习,一旦学会,后续的推理和执行成本就大幅降低,单位投入产生的经济价值更大。
而且不同行业对准确性的要求完全不同。如果只是收集外部信息,准确性可能只是一个偏好问题;但如果基于这个信息做量化交易,那就是另一个层级的严肃性;如果要指导未来一年的生产作业并影响整个生意的 ROI,又是更高的要求。对于每一个不同的领域,工具本身和背后的模型都需要重新设计。
三、从 B2B 到 A2A:Accio 如何将 Sourcing 从五天压缩到一天 (12:01 - 16:34)
张阔团队做了一个推演:B2B 的生意未来都会走向 A2A——Agent to Agent。 阿里巴巴目前运行着两个平行业务系统:Alibaba.com 这个 Marketplace 本身在用 AI 快速重构搜索、沟通、推荐、交易、物流的全链路;另一条线是 Agent-to-Agent 的 Accio(accio.com / accio.ai),到 2026 年 3 月 MAU 已达一千万,且月环比增长速度仍然很快。
Accio 要解决的核心问题是围绕 sourcing 的全流程:从 Research 产生 idea,到产品设计(design),到供应商筛选、沟通,再到交易、运输、售后。基于 Agent-based 模式,从输入一个 idea 到建立 solid 的商业关系,时间缩短到原来的五分之一——原来用一个礼拜做的事,现在一天内完成。
为什么能这么快?AI 做了几件关键的事:首先,帮助理解和索引全网信息——类似商品在 Amazon 等平台上的搜索量、交易情况、评价、定价,再据此计算 margin 是否合理。这些碎片化的 research 工作,在没有 AI 之前要做到既宽又准是极其困难的。其次,AI 可以直接帮买家生成专业的 design pack(包含图片、文字、3D 模型的技术设计文档),让买卖双方的交互从一个"比较潦草的 idea"变成高效专业的沟通。再加上消除了语言和时差的障碍,整个 sourcing 过程发生了质变。
四、Accio 的四层护城河:准确性、强化学习、安全性与超长周期推理 (16:34 - 23:43)
与 ChatGPT、Claude、Gemini 等通用大模型相比,Accio 在四个方向上有深度投入。
第一是信息的准确性。 商品的真实价格是 B2B 交易中最关键的信息——要找到隐藏价格和额外费用,计算扣除物流和关税后的到手价。Alibaba.com 上每天上百万条沟通中积累的 signal(设计细节、技术规格),结合 26 年的行业数据,让 Accio 在这方面远超通用模型容易产生的幻觉。
第二是强化学习机制。 因为 B2B 的 stake 很高,用户天然会给出大量反馈——这个设计方向好不好、技术能不能满足、margin 合不合理。平台记录整个逻辑链条,让每个 token 产生更大价值,避免漫无目的的推理和搜索。国际业务的独特优势在于能形成闭环:一个 idea 最终是否形成交易、用户是否持续复购,这些长期信号都能回流到系统中。
第三是安全和可靠性保障。 2B 场景的高 stake 要求信息完整、推理严谨、数据隔离。如果推理链条出错,需要能向前回滚,确保上下文一直传递下去。
第四是超长周期的上下文设计。 从 idea 到 sourcing 完成大约一个月,进入销售周期后可能是半年到一年。需要将无限长的上下文信息分层存储——有些像大模型的实时推理,有些多模态内容需要持久索引,有些信息(如客户反馈)需要按需访问,最终都服务于下一轮商业决策。
五、新模型来了:AI Native 产品应该自动变聪明 (23:43 - 26:08)
对于底层大模型更新的态度,张阔的标准很明确:每当有新的 SOTA 模型出现,整个产品应该变得比以前更聪明,体验更好——这才能体现你是一个 AI native 的产品。 如果新模型出来跟你没关系,那才是更大的问题。
Accio 并非绑定单一模型。以通义千问为基础底座,同时在多模态、coding 能力、Agent 推理能力等不同维度接入各家表现最好的模型。在 Agent 不断执行的过程中,持续压缩 token 消耗,让每次执行效率更高。张阔形容这不是"来一代新模型就全部重做"的关系,而是模型升级自然带来产品升级的有机关系。
六、Accio Work:从 Sourcing 工具到一人企业的全栈操作系统 (26:08 - 31:35)
Accio Work 相比初版 Accio 有两个关键升级。
第一是闭环经营。原来 Accio 覆盖从 research 到 sourcing 的环节,Accio Work 要延伸到 daily operation——开店、经营线上线下店铺、补货、商品设计迭代、客服售后、甚至 HR/Payroll/Finance/Tax。自有能力覆盖核心的 research-to-sourcing 链路;利用 browser use、computer use 等泛化 AI 能力帮用户在 Shopify 等平台经营;垂直领域则接入硅谷优秀的 Agent 产品作为 sub-agent。
第二是真正的个性化。中小企业的痛点不是需要"若干个 SaaS",而是需要一个能理解自己独特流程的工具。大部分北美线下小店的 back office 还在用纸笔办公。基于 Agentic 体验,每个中小企业都可以把自己的成功标准输入模型,生成专属的工作流——这在传统 SaaS 世界中,除非预算百万美金以上才有人帮你定制。 考虑到 30%-40% 的用户是 Solopreneur(一人企业),把产品设计之外的发布、社媒运营、库存管理、客户反馈等琐事自动化,意义重大。
Accio 面向的用户是分层的——从年采购几百万美金的沃尔玛、Amazon,到个体经营者。很多 solid 企业最初也是从一个人做咖啡店开始的。但无论给这些实体经济中小企业一个 OpenClaw 还是 Claude Cowork,前端展示的 Skills、Hook、Agent、Connector、Plugin 等技术概念都让他们犯晕。Accio Work 的核心诉求是开箱即用、解决日常 critical 问题、ROI 在合理范围内。
七、商业模式:Token Based 与 Marketplace 双轨并行 (31:35 - 38:53)
Accio 的商业模式分两条轨道。
Token based 轨道: 使用 Accio 的工具会消耗 token,接入的三方 partner(Tax、HR Payroll、Finance 等)作为 sub-agent 也消耗 token。用户可以选择月费套餐(如 20 美金/月),超出后可以升级 plan 或使用免费额度。
Marketplace 轨道: 供需匹配中的广告和服务费用(担保交易、物流、支付等)延续传统电商的商业模式。
AI 并没有削弱广告模式,反而让搜索量变多了。因为 AI 更好地理解了用户意图,用户可以更丰富地表达需求——各种参数、上下文、限制条件都说清楚,多模态输入(语音、图片、PDF)进一步提升了匹配精度。供应商的匹配也不再只依赖标题和关键词,而是基于商品的全部上下文信息,包括工厂能力、certificate、用户 use case 等。结果更好,用户就愿意更多地搜索和交互;搜索量变多,供需匹配变大,广告也更精准——这与 Google 在 AI overview 推出后广告数据反而提升的逻辑一致。
当然,从更长远看,当所有人效率都提升后,ROI 优势会被慢慢拉平。张阔认为,未来商业模式的核心逻辑不变——创造什么价值。最终大家要衡量的"赢的标准"就是单位 token 的智力密度更高,或单位 token 产生的价值更高,这类服务就会胜出。
八、阿里的核心优势:26 年数据飞轮与闭环信号 (39:20 - 43:06)
相比创业公司,Accio 基于阿里巴巴 26 年的积累,平台侧每天上百万到上千万的沟通、query、transaction 都是 signal,能帮系统完成 reinforcement 的闭环。背靠阿里集团与通义千问的紧密合作,保持模型理解和使用的领先性,同时注入自有数据进行中期和早期训练。
Agentic 产品还有数据飞轮效应:更多人使用,就记住更多工作流,更多工具在什么场景下表现更好。而 Accio 的客户群体可能比一般 AI 产品用户更挑剔、预算更少、对 ROI 更敏感——这反过来 push 团队必须让单位 token 的价值密度持续提升。
面对亚马逊等潜在竞争者,张阔认为,亚马逊擅长的是自有后台系统的优化,但如果要泛化到多平台经营、更广泛的产品设计、利用全球供应链,Accio 起步更早、投入更多、knowhow 也更深。未来 B2B 走向 A2A 时,胜出的方式是在核心方向上做到极致、成为 master agent,与用户的其他 agent 协同完成服务。
评估 Accio 成功与否的核心指标是 retention——用户持续使用产品进行设计和采购就是好信号。本质问题不是消耗多少 token,而是能产生多少价值。 总 token 用量甚至可能是一个有害指标,因为它会激励团队让用户多浪费 token。真正的目标是让跨境 B2B 的 28 个步骤像 online shopping 一样简单。
九、AI 时代的人才与工程:从招聘标准到 Coding Agent (44:58 - 51:01)
AI 时代的人才标准发生了结构性变化。对于模型训练、infra、算法方向的人才,有 solid 的工作成果比学历重要——面试就是打开 paper 一起讨论原创思想和贡献。对于产品经理,要求更高:需要设计面向模型能力的产品,对未来六个月模型的走向有基础预判,而不是看新闻做决定。产品、交互设计和技术三个角色正在融合——一个人要对闭环结果负责。
团队已经在深度使用 coding agent。具体做法是设计一个 master agent 来管理多个 sub-agent——有的写代码,有的读文档,有的做 code review,有的做 check-in。还需要设置 guardrail 和沙箱环境,防止内部代码意外开放到外部。张阔分享了一个有趣的案例:一家做量化交易的硅谷公司,几个 researcher 在 Slack 里讨论,聊到一定程度就 @ agent 说"我们谈完了你看一下",agent 读完对话、写文档、生成代码,人看一看就 commit,因为可以保证一定量的灰度不影响全局。
另一个插曲是:某天 Anthropic 服务波动了三个小时,一家硅谷创业公司的工程师全部停摆——因为没人直接写代码了,大家都是基于上下文输入让模型生成代码。生成的越多,人越看不懂,code review 也越困难。这既说明工程方式已经发生质变,也暴露了对 AI 工具的深度依赖。
十、组织对新模型的态度:兴奋、焦虑与无感 (51:01 - 58:35)
衡量 AI 是否真正渗透组织,张阔给出了一个感性但精准的标准:当新模型框架出现时,你的组织是兴奋还是焦虑?
最差的结果就是你没感觉。就是外边模型出现速度很快,就像一个高速列车一样,但你在边上开一个自己的老列车,无论开得多快,边上有个高铁已经从你身边呼啸而过了,除非说你自己已经坐上高铁了,你在高铁上有个相对速度。
产品和组织必须构架在 Agent 和最新模型之上,这样每次新模型出来,所有产品都自动变得更聪明。 如果反过来——来了新模型,适配不适配都无所谓,产品跟原来一样——那就不是一个 AI native 的产品。最好的状态是兴奋:新模型出来,原来解决不了的问题现在能解决了。最差的不是焦虑(焦虑说明你在高铁上,只是可能是 wrapper),而是没感觉。
张阔以多模态能力的提升为例:Nanobanana 等模型让商品图片生成变得精准——原来要花大量时间写 prompt 调试尺寸比例(大机器放在桌子上、小机器显得很大),现在相对简单的上下文就能产出逼真的结果。加上 browser use、computer use、长程上下文等能力的成熟,Accio Work 的推进速度变得非常快——这也是团队春节就开始加班的原因:OpenClaw 和 Claude Cowork 已经证明这个范式成立,可以在此基础上快速推进。
当然,阿里巴巴也面临 26 年系统包袱的挑战——CEO 吴永明最早的代码可能还在代码库里。要让整个工程都基于 AI native 重写,是一个 step by step 的过程,但目标明确:未来只要有新模型,Alibaba.com 的每一个角落理论上都应该比原来更好用,而不是每个团队各自适配、每次都重新研究。