7 个实战问题教会我的 AI Skill 设计原则

作者： Fred 日期： 2026-04-01 阅读时间： 约 8 分钟

写在前面

过去一周，我完成了一个 AI Skill 的完整开发周期：从大模型生成初稿，到实战测试，再到基于反馈快速迭代到 V0.3.1 版本。

这个过程让我深刻意识到：好的 AI Skill 不是设计出来的，而是从实战中"长"出来的。

今天我想分享的，不是这个 Skill 有多厉害，而是实战中暴露的 7 个问题，以及它们教给我的7 个设计原则。这些原则不仅适用于我正在开发的 research-framework Skill，也适用于任何 AI Skill 的设计。

背景：一个 Skill 的诞生

这个 Skill 叫 research-framework，定位是"框架驱动的渐进式研究协作"。

简单来说，它不是直接给你一份研究报告，而是：

先和你一起搭建研究框架
然后逐节点辩论（AI 先表态，然后和你辩论）
最后整合成完整报告

听起来很美好，对吧？但实战测试中，它被"打"得遍体鳞伤。

问题 1：概念前置缺失

场景还原

研究进行到节点 2 时，用户突然说："这里有一个很重要的概念没有去声明——Skills。"

原来，我们在讨论 OpenClaw 和 Dify 的区别时，频繁提到"Skills"这个概念。但听众如果不理解 Skills 是什么，后续所有讨论都缺乏基础。

最后我们不得不回填一个节点 1.5，专门解释 Skills。

问题本质

框架生成逻辑有一个盲区：只考虑"研究课题本身的子命题"，没有考虑"理解这些子命题所需的前置概念"。

设计原则 1：概念前置自检

在生成框架后，AI 应该主动审视：讨论这些节点是否依赖某个尚未被显性定义的核心概念？如果有，主动建议插入"概念澄清"节点。

实现方式：

框架生成后增加自检环节
识别核心概念（如 Skills、Agent、Pipeline 等）
主动询问用户："是否需要先解释 XX 概念？"

收益： 避免后续讨论因概念模糊而跑偏。

问题 2：类型刚性

场景还原

研究开始时，我们识别主线类型为"B（技术选型对比）"。但节点 2 的辩论中，浮现了"D（抽象理论研究）"的特征——关于"人辅助 AI"的思考、关于 B 端 C 端博弈的判断。

这些不是作为独立节点出现的，而是嵌套在其他节点的辩论过程中自然涌现的。

问题本质

研究类型在开头一次性锁定，但实际讨论是动态演化的。

设计原则 2：动态标签优于静态分类

主线类型用于确定框架骨架，但每个节点可以有自己的类型倾向。讨论方式根据实际走向自适应，不在开头一次性锁死。

实现方式：

课题层面：识别主线类型（可复合），向用户确认
节点层面：每个节点标注自己的类型倾向，不要求和主线一致
动态调整：如果辩论过程中类型特征发生变化，AI 自然切换讨论方式

收益： 既保持框架稳定性，又允许节点级灵活性。

问题 3：开场格式太重

场景还原

节点 1 的辩论，AI 用了完整的四板块开场格式：判断→论据 1/2/3→薄弱点→讨论点。体验还行。

但到了节点 2 和节点 3，对话越来越深入后，这个格式开始显得机械——有时候一个节点的判断本身就很复杂需要分几段话来表达，硬塞进"一段话表达立场"反而会丢失细节。

问题本质

单一格式无法适配不同深度的讨论场景。

设计原则 3：轻重模式自适应

开场格式分轻重两种模式：轻模式用于信息确认型节点（直接给判断 + 关键依据 + 讨论点），重模式用于需要深度辩论的节点（保留完整的四板块结构）。AI 根据节点的预估深度自动选择。

实现方式：

轻模式（用于轻度节点）：

  🔍 节点 X：[名称]
  【判断】[简要立场]
  【依据】[关键支撑，1-2 条]
  【讨论点】[一个具体问题]

重模式（用于中度/重度节点）：

  🔍 节点 X：[名称]
  【我的判断】[可以分多段表达]
  【支撑论据】1/2/3
  【薄弱点】[主动暴露不确定处]
  【讨论点】[引导辩论]

收益： 格式服务于内容，而非内容迁就格式。

问题 4：用户注入信息无处理

场景还原

辩论过程中，用户多次注入大量 AI 未掌握的一手信息：

个人部署体验（Win vs Linux 能力差异）
听众画像（文科背景、学 Dify 一年仍半吊子）
组织洞察（两类项目不做区分导致设计问题）
行业判断（B 端 C 端 AI 隐性博弈）

这些信息不是对 AI 判断的"回应"，而是全新的输入，直接改变了讨论的走向。

但 AI 的流程设计是"AI 开场→用户回应→辩论→收尾"，隐含假设是 AI 先说、用户后说。

问题本质

缺少处理"用户主动注入信息导致讨论维度扩展"的机制。

设计原则 4：走向 D 机制

当用户提供了 AI 未预料到的一手信息时，AI 不应该急着收拢到原来的讨论点上，而应该先消化这些信息、评估其对当前节点乃至整个框架的影响，然后再决定是继续当前讨论点还是调整方向。

实现方式：

辩论过程增加"走向 D"：用户注入新信息导致维度扩展
AI 响应流程：消化信息 → 评估影响 → 显性说明"你提供的信息改变了我的判断方向" → 决定继续或调整
如果新信息需要触发框架调整，走向 C（命题重新定义）

收益： 用户的智慧被充分吸纳，而非被流程压制。

问题 5：框架变更呈现被动

场景还原

节点 2 辩论中，我们新增了一个节点 1.5（Skills 概念澄清）。这是辩论中最有价值的产出之一。

但 V0.1 的设计是"如果辩论过程中框架有调整就说明变了什么"，这是一个被动的记录行为，作为收尾模板的一个字段一笔带过。

问题本质

框架变更往往是辩论中最有价值的产出，不应该只是收尾时的一句附注。

设计原则 5：变更单独成段说明

每个节点收尾时，如果有框架变更，应该单独成段说明变更的原因和对后续节点的影响，而不是作为收尾模板的一个字段一笔带过。如果没有框架变更，也可以主动说明"经过本节点讨论，现有框架依然适用，无需调整"，这样用户对框架的稳定性也有感知。

实现方式：

有变更时：

  【框架变更】
  变更内容：[具体变了什么]
  变更原因：[为什么需要变]
  对后续影响：[哪些节点的讨论角度或重心因此调整]

无变更时：

  【框架状态】经过本节点讨论，现有框架依然适用，无需调整。

收益： 框架变更被显性呈现，用户对研究进展有清晰感知。

问题 6：跨节点洞察缺失

场景还原

讨论中出现了几个贯穿多个节点的重要洞察：

"人辅助 AI 而非 AI 辅助人"
"透明度是衡量人机协作质量的关键维度"
"OpenClaw 是万能胶水层"

这些洞察不属于任何单一节点，而是在多个节点的讨论中逐渐浮现的。但 V0.1 没有机制来捕捉和积累这类跨节点洞察。

问题本质

缺少超越单一节点的、贯穿性重要判断的捕捉机制。

设计原则 6：洞察积累板块

在进度同步时，除了展示各节点状态外，增加一个"研究洞察积累"板块，用来记录讨论过程中浮现的、超越单一节点的重要判断。这些洞察在最终整合输出时会成为报告最有价值的部分。

实现方式：

进度同步增加"💡 研究洞察积累"板块
只记录超越单一节点的、贯穿性的重要判断
每条洞察用一句话概括
最终整合输出时，从"研究洞察积累"中整理

收益： 高价值洞察不丢失在单个节点中，成为报告的核心资产。

问题 7：隐性信息无处理

场景还原

用户在辩论中明确说过："这是我的心里话，你懂就好不用显性拿出来说。"

这是关于组织内部的政治洞察（领导觉得商业价值普世性应用更重要，员工提效会导致老板派更多活）。用户不希望这些信息出现在最终的研究产出中。

但 V0.1 没有这个机制——AI 收到的所有信息默认都会被用于讨论和输出。

问题本质

缺少处理"用户标记为背景理解用"的隐性信息的规则。

设计原则 7：隐性信息内化但不外显

当用户明确标记某些信息为"背景理解用"时，AI 应该将其作为判断的隐性输入，在讨论中可以基于这些信息调整自己的判断角度和表达分寸，但不在节点结论或最终报告中显性引用。

实现方式：

识别用户隐性信息标记（"你懂就好"、"不用拿出来说"等）
作为判断的隐性输入，调整判断角度和表达分寸
不在节点结论或最终报告中显性引用

收益： 用户信任被尊重，AI 判断更贴合实际但不越界。

总结：7 个原则一张表

问题	原则	核心做法
概念前置缺失	概念前置自检	框架生成后审视是否需要插入"概念澄清"节点
类型刚性	动态标签优于静态分类	主线 + 节点级类型，讨论方式自适应
开场格式太重	轻重模式自适应	轻模式（信息确认）vs 重模式（深度辩论）
用户注入信息无处理	走向 D 机制	消化信息 → 评估影响 → 显性说明 → 决定方向
框架变更呈现被动	变更单独成段说明	有变更详细说明，无变更主动说明稳定性
跨节点洞察缺失	洞察积累板块	进度同步增加"研究洞察积累"
隐性信息无处理	隐性信息内化但不外显	作为隐性输入，调整判断但不显性引用

写在后面

这 7 个原则，不是我在办公室里想出来的，而是实战中被打出来的。

它们可能不适用于所有 AI Skill，但我相信其中蕴含的思维方式是有价值的：

框架先行，但框架是活的
用户主导，但 AI 要表态
格式服务于内容，而非内容迁就格式
用户的智慧应该被充分吸纳
高价值洞察要持续积累
用户信任比完整输出更重要

如果你也在开发 AI Skill，希望这些原则能给你一些启发。如果你有不同的经验，欢迎交流。

（完）

7 个实战问题教会我的 AI Skill 设计原则

7 个实战问题教会我的 AI Skill 设计原则

写在前面

背景：一个 Skill 的诞生

问题 1：概念前置缺失

场景还原

问题本质

设计原则 1：概念前置自检

问题 2：类型刚性

场景还原

问题本质

设计原则 2：动态标签优于静态分类

问题 3：开场格式太重

场景还原

问题本质

设计原则 3：轻重模式自适应

问题 4：用户注入信息无处理

场景还原

问题本质

设计原则 4：走向 D 机制

问题 5：框架变更呈现被动

场景还原

问题本质

设计原则 5：变更单独成段说明

问题 6：跨节点洞察缺失

场景还原

问题本质

设计原则 6：洞察积累板块

问题 7：隐性信息无处理

场景还原

问题本质

设计原则 7：隐性信息内化但不外显

总结：7 个原则一张表

写在后面

文章目录

评论