大模型为什么需要 skill

张开发
2026/4/4 1:47:48 15 分钟阅读
大模型为什么需要 skill
像 OpenClaw、Claude Code 这类 agent 系统表面上是在和大模型对话真正做事时用到的往往不只是 LLM 本身也不只是预制的那几个功能。任务一复杂就会碰到一串很实际的问题现有工具怎么接进来新工具怎么安装和调用多步流程怎么衔接上一段结果怎么顺着传给下一段。这些事很多不是模型临场猜一猜就能稳定做好的。这里缺的通常不是再补几句 prompt而是把知识、工具和流程整理成一套可复用、可调用的东西。这部分就是 skill 要补上的内容。1 为什么不能直接把程序丢给模型一句话skill 是给大模型补 how。大模型常常不缺“是什么”缺的是“这事该怎么做”。skill 做的就是先把某类任务里关键的知识、步骤和约束整理好需要时再接上工具、脚本和资料。那为什么不直接把程序丢给模型因为程序不会自己变成可用能力。模型还是得知道这个工具解决什么问题输入输出是什么参数怎么传什么时候该用什么时候不该用。比如一个 5000 行的 PDF 工具模型每次都临时读代码再猜命令和参数既慢也不稳。用 skill 先把这些信息整理好调用就稳定很多。2 skill 到底在补什么从这个角度看skill 更像大模型的外挂。它不替代工具而是先把工具的用途、接口和用法讲清楚减少模型临场猜测。所以 skill 不只是 prompt也不只是说明书更像一个随用随取的工作流模块。这个模块通常做三件事让 LLM 知道什么时候该用这套东西告诉它这类任务该怎么做如果需要再接上外部知识和工具有些 skill 很轻主要是在教方法有些很重后面直接连着命令行工具、本地脚本甚至完整流程。3 CLI 和 Harness很多时候缺的不是说明文档而是软件和 agent 之间那层可稳定调用的中间层。CLI命令行接口层是这层的核心。它会把软件里零散的功能收敛成统一的子命令、参数格式和 JSON 输出。这样 agent 调用时不用猜命令怎么拼执行一条子命令就能拿到结构化结果。Harness是包在 CLI 外面的整体适配结构。它不只是 CLI 脚本本身还包括安装入口、REPL 模式支持多轮有状态交互、测试以及一份说明文档用来告诉 agent 这个工具能干什么、怎么启动、返回什么格式。两者放在一起才算把“软件”真正变成“可调用能力”。有了 CLI Harnessagent 对接的是清晰接口没有的话agent 面对的就还是一堆程序只能临场猜。4 三层怎么配合完整结构通常是三层最底下是真实软件或真实后端中间是 CLI harness 这类可执行的适配层最上面才是让 agent 知道怎么触发、怎么调用、怎么组织流程的 skill这样就能看清 skill 的位置它不替代程序也不替代适配层。它负责告诉模型这套能力什么时候用、怎么用、结果怎么往下接。很多热门 skill本质上不是在发明新能力而是在把现成能力包装成 LLM 能稳定调用的接口。它可以很轻只是几段描述也可以很重后面直接连着完整的 harness 和流程。归根结底skill 做的是两件事给模型补上 how以及把相关知识、流程和工具稳定地交到大模型手里。

更多文章