
视频会议巨头 Zoom 刚刚在人工智能界投下了一枚重磅炸弹。在被誉为“人类最后的考试”的顶尖 AI 基准测试“Humanity's Last Exam”(HLE)中,Zoom 的 AI 系统以 48.1% 的惊人成绩刷新了世界纪录,一举超越了此前由谷歌 Gemini 3 Pro 创下的 45.8%。这就像是足球场上,一支业余球队突然击败了拥有超级巨星的豪门俱乐部。
更令人意外的是,Zoom 并没有像谷歌、OpenAI 那样投入巨资去训练自己的“超级大模型”。Zoom 的首席技术官黄学东,这位曾经在微软 AI 领域叱咤风云的人物,给出了一个完全不同的答案:Zoom 玩的是“兵法”,而不是硬碰硬地比拼算力。
Zoom 的秘密武器是一套名为“联邦式人工智能方法”的精妙设计。你可以把它想象成一个超级聪明的“AI 调度中心”。它不自己培养“大力士”(底层模型),而是召集了 OpenAI、Google、Anthropic 等多家顶尖 AI 模型,让它们各显神通。
具体怎么操作呢?Zoom 有一个叫做 Z-Scorer 的“大脑”,它能实时听取不同 AI 模型给出的答案,然后从中挑选出最棒的那一个来完成任务。同时,它还有一个“探索-验证-联合”的工作流程,有点像让一群 AI 专家开会讨论,互相质疑,互相补充,最终得出一个更严谨的结论。简单来说,Zoom 通过巧妙地整合(集成)现有最强的 AI 模型,而不是从零开始训练,实现了“1+1+1 > 3”的效果,超越了任何单一模型的极限。
这个成绩一出来,科技圈立刻炸开了锅。有人批评 Zoom 只是在利用 API “搭积木”,在一些脱离实际的测试里“刷分”,是在“偷”别人的劳动成果。但也有人认为,在 AI 评估领域,“模型联邦”才是未来的趋势,就像在数据竞赛平台 Kaggle 上,获胜者往往是善于组合不同模型的。这种策略对 Zoom 来说,不仅省下了天文数字的研发费用,还能随时切换供应商,摆脱对任何一家 AI 巨头的依赖,这在商业上简直是“神来之笔”。
当然,对于 Zoom 来说,真正的考验还在后面。即将上线的 AI Companion 3.0 将是这场“联邦式 AI”战略的实战演习。虽然在 HLE 这种涉及高等数学和哲学的“烧脑考试”中取得高分,证明了 AI 的前沿进展,但对于全球 3 亿 Zoom 用户来说,他们更关心的是:当大家用它来总结会议、提取待办事项时,这套“联邦大脑”能否真正比单一模型更省时、更准确,带来实实在在的便利。毕竟,用户最终要的,是能解决问题的 AI,而不是排行榜上的数字。