返回首页

Agent Skills:Apps of LLM OS

2026年1月17日1 分钟阅读

Agent Skills:大模型操作系统的应用

Agent Skills 看似是一段 Markdown 写成的流程提示,实则是一种新型可执行程序。

传统软件开发是“硬编码”:固定输入输出,编译打包。Agent Skills 则是“软描述”:用自然语言定义触发条件、调用工具与输出格式。它无需环境配置,不涉编译部署,却自带迭代与热更新能力。

核心定义:Computer Use 的载体
Skill 不仅是脚本,更是 AI 的“计算机使用”能力。

它借助 Shell 或 API 调用,赋予 AI 与人类相当的系统权限:执行程序、管理文件、进行网络交互。无需重复造轮子,Skill 通过自然语言指令,直接接管并复用计算机积累数十年的软件生态。

在 Cloud Code、Open Code 等平台中,Skill 填补了“模糊意图”与“精确执行”之间的空隙。在 AI 实现端到端全自动编程之前,Skill 是关键的过渡形态——将自然语言转化为受约束、可执行的系统动作。

核心差异
Skill 究竟新在何处?

  1. Skill vs MCP
    MCP 如“积木”,是面向开发者的重型协议,需编码封装工具、配置环境,门槛高。
    Skill 如“说明书”,是轻量级客户端应用,无需编写服务端代码,直接指挥 AI 组装现有积木。

  2. Skill vs Workflow
    Workflow 是“静态管道”,依赖图示连线,复杂时易僵化,难以维护调整。
    Skill 是“动态逻辑”,依语义定义目标,AI 在运行时动态规划路径,而非执行固定流程。将来workflow可能只剩一种存在场景:一个定时出发,固定步骤的skill。

  3. Skill vs GPTStore Prompt
    Prompt是“沙盒游戏”,局限于浏览器用web API call所能触及的范围,无法触及系统底层。
    Skill 具备“副作用”,可真实干预现实包括修改代码、部署服务、调整系统。它是能干活的程序,不止于对话。拥有更广阔的能力边界。

未来:从工具到AI native 应用
当前 Skill 仍带强烈开发者工具色彩。运行时常需人工确认,其载体是LLM前就已存在的软件,脚本。skill native的运行时还不存在。 原生智能,自主升级,认证权限,安全隐私,是Skill native运行时需要解决的问题。

无论运行时位于本地或云端,Skill 将重塑AI时代的软件格局。其本质是LLM后时代对以下进化的一次有效探索,即AI native应用结合LLM OS as native runtime,取代现有的操作系统与传统软件。