Agent Skills:Apps of LLM OS
Agent Skills:大模型操作系统的应用
Agent Skills 看似是一段 Markdown 写成的流程提示,实则是一种新型可执行程序。
传统软件开发是“硬编码”:固定输入输出,编译打包。Agent Skills 则是“软描述”:用自然语言定义触发条件、调用工具与输出格式。它无需环境配置,不涉编译部署,却自带迭代与热更新能力。
核心定义:Computer Use 的载体
Skill 不仅是脚本,更是 AI 的“计算机使用”能力。
它借助 Shell 或 API 调用,赋予 AI 与人类相当的系统权限:执行程序、管理文件、进行网络交互。无需重复造轮子,Skill 通过自然语言指令,直接接管并复用计算机积累数十年的软件生态。
在 Cloud Code、Open Code 等平台中,Skill 填补了“模糊意图”与“精确执行”之间的空隙。在 AI 实现端到端全自动编程之前,Skill 是关键的过渡形态——将自然语言转化为受约束、可执行的系统动作。
核心差异
Skill 究竟新在何处?
-
Skill vs MCP
MCP 如“积木”,是面向开发者的重型协议,需编码封装工具、配置环境,门槛高。
Skill 如“说明书”,是轻量级客户端应用,无需编写服务端代码,直接指挥 AI 组装现有积木。 -
Skill vs Workflow
Workflow 是“静态管道”,依赖图示连线,复杂时易僵化,难以维护调整。
Skill 是“动态逻辑”,依语义定义目标,AI 在运行时动态规划路径,而非执行固定流程。将来workflow可能只剩一种存在场景:一个定时出发,固定步骤的skill。 -
Skill vs GPTStore Prompt
Prompt是“沙盒游戏”,局限于浏览器用web API call所能触及的范围,无法触及系统底层。
Skill 具备“副作用”,可真实干预现实包括修改代码、部署服务、调整系统。它是能干活的程序,不止于对话。拥有更广阔的能力边界。
未来:从工具到AI native 应用
当前 Skill 仍带强烈开发者工具色彩。运行时常需人工确认,其载体是LLM前就已存在的软件,脚本。skill native的运行时还不存在。
原生智能,自主升级,认证权限,安全隐私,是Skill native运行时需要解决的问题。
无论运行时位于本地或云端,Skill 将重塑AI时代的软件格局。其本质是LLM后时代对以下进化的一次有效探索,即AI native应用结合LLM OS as native runtime,取代现有的操作系统与传统软件。