AI Agent集体“撞衫”:三栏布局背后,藏着一个更大的野心

作者: 智享AI发布日期: 2026/5/12阅读时间: 5分钟
AI Agent集体“撞衫”:三栏布局背后,藏着一个更大的野心 封面图

最近,Codex、Claude桌面版、Cursor3.0这几款AI Agent产品,不约而同地换上了同一种“皮肤”——三栏布局。左边是对话栏,中间是代码或文件编辑区,右边是工作结果预览区。这不是谁抄袭谁,而是行业在回答同一个问题:当AI能自主写代码、调文件、调用工具时,用户到底需要什么样的界面?

答案很直接。过去的聊天机器人,两栏布局就够了:左边输入,右边输出。但现在的Agent时代,AI不仅能回答问题,还能动手干活——它帮你生成了一整个网页,你总得亲眼看看跑起来什么样吧?它改了你电脑里的Excel表格,你总得检查下数字对不对吧?于是,右侧的工作区变成了刚需。更关键的是,用户和Agent打交道的时间越来越长,以前干完活还得切到VSCode、PPT里手动调一调,现在大家更希望干脆别切了,在Agent里一口气搞定。

Codex在4月的大版本更新里,改动最大的就是这个右侧工作区。它不再只是“查看记录”的窗口,而变成了能直接编辑、预览、甚至交互的多功能面板。有意思的是,Codex这次喊出的口号是“Codex for (almost) everything”——它的野心不光是帮你写代码,而是想覆盖从文档到演示文件的各种专业工作流。不过,目前它还不能直接编辑PPTX这类格式的文件,这大概不是技术做不到,而是策略上先放一放。

为什么放?因为更急的事儿在后面。目前Agent的能力拼图里,MCP协议已经解决了“怎么连接工具”的问题,Agent Skills解决了“怎么做某件事”的知识储备问题。但用户最头疼的那“最后5%”——不管AI多强,总有些地方需要人类亲手微调,比如改个字号、调个布局、加个注释——却还是个明显的空白。单纯靠Agent自带的Markdown编辑器来应付,显然不是长久之计。

那怎么填这个坑?最可行的路线是:插件生态。Agent只负责核心的调度和推理,把文件预览、二次编辑、垂直领域的专业功能,统统开放给社区开发者做插件。用户想编辑图片?装个插件。想一键生成PPT?再装个插件。每个人都能拼出自己的专属工作流。更重要的是,插件比Skills更难被复制——Skills是几行代码就能抄走的“小技巧”,而插件可以像App Store那样建立成熟的收费和版权保护机制,开发者有钱赚,生态才能跑起来。

Codex已经悄悄推出了早期的插件市场,Cursor也露出了类似的方向。这意味着,继模型能力竞赛之后,下一轮竞争的高地,正在转向“谁能让生态先繁荣”。对中小团队来说,这可能是一个不错的窗口——不用去烧钱拼底层模型,而是专注做那“最后一公里”的编辑和优化体验,先冲进去的人,有望吃到冷启动的红利。

三栏布局只是表象,真正的战场,在右侧那个小小的工作区里。

aitechtoolupdateproduct
精选评论
评论加载中…
发表讨论 »