📖 入门必读 · 第01章

5大核心AI概念

在开始使用EasyClaw之前,先花5分钟了解这些概念——它们将帮助你真正理解AI是如何工作的,而不是盲目地输入指令。
你不需要成为工程师,但你需要知道:AI为什么能做事、怎么才做得更准、什么时候会失误。

EasyClaw概念示意图

1. Agent(智能体)

🧠

小白怎么理解

Agent(智能体)可以简单理解成:“会做事的AI同事”。它不仅能聊天解释, 更重要的是能把你的目标变成具体步骤,并在每一步做完后继续推进,直到达到你想要的结果。

⚙️

AI Agent的核心简介

一个典型AI Agent通常由三部分共同完成:
大脑(理解与决策) + 工具/能力(能去哪里做) + 执行循环(边做边检查)
因此它看起来不是“一次性生成答案”,而是像项目负责人那样:先想清楚,再动手,再核对。

接下来讲清楚它是怎么运行的。你可以把Agent的工作过程想象成一个反复执行的循环: 理解任务 → 制定计划 → 调用工具 → 执行动作 → 验证结果 → 继续调整 → 汇报

1)理解任务:
Agent会先判断你要解决什么问题、成功标准是什么、是否有约束条件(例如格式、语气、时间、不能做什么)。 如果信息不够,它可能会先向你提问,或先做必要的假设并说明。

2)制定计划(拆解步骤):
大任务往往需要拆成小步骤。比如“整理收件箱”可能被拆成: 扫描邮件 → 识别类型(通知/账单/客户/杂项)→ 判断优先级 → 归档 → 起草回复(如需要)→ 汇总清单。 这一步决定了“先做什么、后做什么”。

3)调用工具/能力:
这也是Agent能“做事”的关键。没有工具,它只能停留在文字层面的建议; 有了工具,它就能真实执行动作,比如:读取文件、搜索信息、发送消息、访问企业系统、生成文档等。 你会看到Agent会“去对接外部世界”,而不只是生成一句话。

4)执行并记录:
在合适的步骤上,Agent会真正触发操作(例如调用某个服务接口、完成一次数据处理、生成一段可用内容)。 同时它会记录“我做到了哪一步”,方便后面继续推进或回滚纠错。

5)验证与纠错:
Agent不会只追求“看起来完成了”,它还会检查结果是否符合要求。 例如:输出是否缺少关键字段、是否违反了你的格式要求、是否存在明显错误或不确定点。 不满足就会重新规划下一步,继续迭代。

6)汇报结果与下一步:
最后,Agent会把它完成的内容、重要发现、以及下一步需要你确认的事项整理给你。 你能清楚知道:它做过什么、哪些完成了、哪些还在路上。

🧪
一个更贴近现实的例子

你说:「帮我整理收件箱,并把需要我回复的邮件汇总成待办清单。」
Agent可能会:先读取邮件列表 → 分类归档 → 提取发件人/主题/关键时间点 → 判断哪些需要回复 → 生成“待办清单”(含优先级与建议回复要点)→ 告诉你“已完成哪些分类、还剩哪些未读/不确定项”。
注意:它不是只给“整理思路”,而是产出可用的结果(清单/归档/草稿/进度)。

⚠️
常见误区:Agent不是“更会聊天”

小白容易把Agent当成普通对话工具:只问“怎么做”。但真正的Agent需要可用的能力与执行流程。 如果一个系统只能解释步骤、却无法产出结果或触发动作,它更像“问答助手”,而不是Agent。 记住一句话:会说 ≠ 会做;Agent的优势在执行与反馈。

2. Skill(技能)

🧩

小白怎么理解

Skill(技能/能力)可以理解成:Agent用来“干活”的具体能力模块
Agent负责思考与调度(接任务、决定下一步),而Skill负责把“下一步怎么做”变成 可执行的操作:比如检索资料、写文档、生成报告、调用接口、执行计算等。
没有Skill的Agent往往只能停留在建议层面;有了Skill,Agent才能真正产出结果。

🔧

Skill到底是什么(本质)

从工程角度看,一项Skill通常是一种“可调用的能力”,常见形态包括:
1)工具/函数(例如:搜索、计算、生成、翻译);
2)业务流程(例如:下单、报销、工单创建);
3)接口调用(例如:CRM查询、日程同步、发送邮件)。

关键不在“会不会聊天”,而在于Skill一般都有明确的边界:输入是什么、怎么执行、输出是什么。 这让Agent能够把任务拆解得更可靠,并在执行后获得可验证的结果。

Agent的循环里经常会出现“调用工具/能力”这一步, 而那一步调用的就通常是Skill。你可以把它想成:Agent像大脑,Skill像手脚与工具箱

为了更深入,我们把“Agent循环里Skill是如何工作的”讲透:

1)Agent判断需要什么Skill
当任务进入执行阶段,Agent会分析当前步骤需要哪些能力。 例如“查找某个客户的历史沟通记录”需要“检索/读取”类Skill; “起草跟进邮件”需要“生成文本/套模板”类Skill; “把任务同步到待办系统”需要“写入/更新”类Skill。

2)Agent把参数填进Skill(输入)
Skill通常要求特定的输入格式,例如:关键词、时间范围、客户ID、目标受众、输出风格等。 Agent会把上下文提取出来并整理成Skill所需的参数。
这一步决定了执行是否准确:输入不对,输出大概率就会偏。

3)Skill执行得到结果(输出)
Skill执行后会返回结构化或半结构化结果,例如:检索到的条目列表、计算结果、生成的文档文本、接口返回的状态码等。 这些结果能被Agent再次读回,用于后续决策。

4)Agent校验输出并继续下一步(闭环)
Skill做完不是终点,Agent还会检查:结果是否满足约束、是否存在缺失信息、是否需要二次生成或修正。 如果不满足,它可能会调用另一个Skill(例如“补充检索”“重写文案”“格式化输出”)再迭代。 这就是Skill与Agent的“协同闭环”。

🧠
Skill的“输入输出”为什么重要

小白常把Skill当成“聊天指令”。但真正的Skill更像“接口”:
输入越清晰,输出越稳定;Agent才能可靠地重复执行并完成任务。 例如同样是“生成邮件”,Skill会要求语气、长度、收件人信息、关键信息字段, 这样生成出来的内容才不会每次跑偏。

举例:你让Agent“给潜在客户写跟进邮件,并创建待办”。
这通常会串联多项Skill,形成一个完整动作链:

1)客户资料检索Skill:输入客户ID/姓名,输出姓名、公司、最近一次沟通要点;
2)信息抽取/总结Skill:输入沟通记录,输出关键痛点与已达成事项;
3)邮件生成Skill:输入语气(专业/友好)、模板(跟进/促成)、关键点,输出邮件正文;
4)待办生成Skill:输入邮件内容与行动建议,输出待办条目(负责人、截止时间、步骤);
5)写入日程/待办系统Skill:输入待办结构化数据,输出创建成功状态或链接。

你会发现:Agent看起来像是在“会做销售工作”,但这背后是Skill模块把真实能力拼成了一个工作流。 Agent负责把这些能力按对的顺序用起来。

⚠️
常见误区:把Skill当“普通提示词”

许多人在做系统集成时会把Skill理解成一段提示词或一句话指令。 但如果没有明确的输入输出与可执行机制,Agent并不能稳定地复现同样的结果。
更正确的理解是:Skill是可调用的能力单元,提示词只是帮助你更好地“选择/组织”它。

如何判断一个东西算不算Skill

可以用三个问题快速判断:
它能被调用吗?
它需要什么输入、输出是什么?
执行后是否能让Agent获得可用结果(而不仅是解释)?

满足这些,就更接近Skill;否则可能只是“建议型文本能力”。

继续用Agent的“运行循环”来理解Skill:Agent负责思考与调度,Skill负责执行具体步骤。 当Agent发现任务需要某项能力时,就会选择合适的Skill,把需要的参数塞进去,等待它返回结果, 再把结果拿回循环里做校验、补充或下一步规划。

举例:你让Agent“帮我写一封客户跟进邮件并生成待办”。
它可能会调用不同Skill:
1)检索客户信息(获取姓名、上次沟通要点);
2)生成邮件草稿(按语气/长度/模板输出);
3)生成待办清单(把下一步行动拆成条目)。
这些Skill拼起来,才形成“看起来很会做”的Agent行为。

🧠
Skill的价值

Skill让Agent从“会说”变成“能落地”,通常带来三点好处:
更可靠(步骤固定、参数明确)、更可控(知道它在做哪件事)、更可复用(同一能力可用于不同任务)。

⚠️
常见误区

有人以为Skill就是“提示词”。其实Skill更像是可调用的能力模块(工具/接口/流程)。 没有清晰的输入输出与执行方式,Agent很难稳定重复同样的效果。

3. Prompt(提示词)

🗣️

大众认知

Prompt(提示词)就是你用自然语言告诉AI的“一句话需求”。 你提出要做什么,AI就尽力把结果写出来。

🎯

深入理解

更准确地说,Prompt是你与AI沟通的核心接口。 对于接入了Agent和Skill的系统而言,好的Prompt不只是“让它生成文本”, 而是要让它知道什么时候该调用Skill、怎么填参数、输出长什么样、失败怎么处理

类型示例效果
❌ 普通Prompt 「帮我写封邮件」 AI会自由发挥,信息缺失时容易乱猜,难以校验
✅ 好的Prompt(面向可执行) 「你是B2B销售顾问。请写给技术总监的产品跟进邮件:语气专业简洁; 需要先从CRM读取张三的公司与上次沟通要点; 邮件必须包含:1)一句价值点2)对齐上次沟通的2点确认3)明确的下一步行动; 输出最后附上3条待办(含日期格式YYYY-MM-DD)。」 触发条件清晰 + 可调用能力明确 + 输出结构可校验

可以发现Prompt和前面两个概念(Agent / Skill) 是同一套运行逻辑的另一面:Agent需要Prompt来决定怎么做,Skill需要Prompt来决定填什么与怎么验。

“Agent的工作循环”可以被理解为:
理解任务 → 制定计划 → 决策调用Skill → Skill执行 → 验证结果 → 继续调整 → 汇报
而Prompt的作用,就是在每一步都给出规则,让它不走偏、不凭空猜、能形成闭环。

1)Prompt先定义“目标与成功标准”(为什么做)
这一步决定了Agent的“判分规则”。Prompt需要告诉它:你要解决的到底是什么问题、 以及什么结果算完成。
例如:不是“帮我写邮件”,而是“邮件必须包含哪些段落、语气怎样、长度范围、最后要给出下一步待办”。

没有成功标准的Prompt,Agent就只能做“看起来差不多”的输出,难以验证质量。

2)Prompt给出“触发条件与约束”(什么时候做什么)
一个能落地的Prompt通常会写清:什么时候该调用Skill,什么时候要提问。
比如:当缺少客户姓名或日期时,必须先索取,而不是默认“随便写个姓名/日期”。

这相当于减少了不确定性:约束越清楚,Agent越稳定。

3)Prompt描述“需要哪些Skill,以及每个Skill的输入输出约定”(用什么工具做)
Prompt里要明确:
要调用哪个Skill、它需要的输入字段是什么、输入字段从哪里来、格式要求是什么;
同时要明确:Skill输出应该以什么结构返回(例如JSON字段、列表、表格、固定段落结构等)。

这一步是Prompt真正“工程化”的关键:让Agent把“下一步怎么做”变成“可以执行的能力调用”。

4)Prompt要求“校验与失败处理”(做完怎么判断对不对)
仅仅生成结果还不够,Prompt必须写明校验规则与失败策略。常见写法包括:
- Skill调用失败/返回空结果:先诊断原因(参数错误/权限/网络/数据缺失)再重试或降级;
- 输出缺少关键字段:必须补全或向用户提问,不允许硬猜;
- 格式不符合:触发“格式化Skill/重排Skill/重新生成”。

这让Agent不会陷入“反复输出但不收敛”的循环。

5)Prompt定义“最终输出格式”(输出要给谁用)
最后Prompt要规定结果如何呈现:哪些字段必须返回、字段名是什么、是否需要结构化结果、 是否需要附带可追踪信息(例如“是否调用了Skill、调用了哪个Skill、关键输入输出是什么”)。

🧪
一个贴近真实的Prompt例子(从需求到可执行)

你说:“帮我给潜在客户写跟进邮件,并创建待办”。
如果使用一个“可执行Prompt”,它会明确三件事:
触发条件:缺少客户姓名/日期先问;
Skill调用:先调用“检索客户信息Skill”,再调用“生成邮件Skill”,最后调用“创建待办Skill”;
输出校验:邮件必须包含价值点确认与下一步行动;待办必须含截止日期(YYYY-MM-DD)与负责人。

这样Agent才会从“写一封像样的邮件”变成“完成一个完整可落地的工作流”。

⚠️
常见误区:把Prompt当成“随口说说”

很多人写Prompt只要求“帮我做”,但没有成功标准、没有输入输出约定、也没有失败处理。 结果就是:Agent可能会自由发挥、缺字段时硬猜、输出难以校验,最终你也无法确认“它到底做对了没有”。

正确思路是:Prompt要像给Agent签的执行合同,让它每一步都可判断、可修正、可复用。

🔥
快速写出“可调用Skill”的Prompt:3个技巧

1)写角色与边界:告诉AI它是谁、你希望它遵循什么规则(“必须先校验再输出”“不得编造不存在的信息”)。
2)定格式与字段:规定输出结构(“返回JSON,包含字段A/B/C”或“邮件必须包含三段内容”)。
3)分步骤写触发:把任务拆成可执行动作,并给出什么时候调用Skill、什么时候提问、什么时候重试。

对比一下:“总结这篇文档” vs “用3个要点总结,并且每点不超过20个字,最后输出关键词列表(不少于5个)”——后者可校验、可复用,效果更稳定。

用一句话把Prompt和前两点对齐

Agent负责思考与调度Skill负责具体执行,而Prompt负责告诉Agent:何时调用Skill、怎么填参数、怎么验结果、最终输出要长什么样

4. Memory(记忆)/ MEMORY.md

🗣️

大众认知

AI的记事本:用来长期保存你的偏好和规则。

🗄️

深入理解

Memory是Agent的长期记忆核心。普通对话往往只在一次会话里有效; 而写入MEMORY.md的内容,会在Agent每次启动时被优先读取, 从而让它“按你的方式做事”,而不是每次都从零开始问你需求。

例如你告诉Agent:“我偏好简洁的中文回复,代码用Python”
如果这条偏好以合适的格式写入Memory,那么以后Agent再处理相同类型任务时,会默认遵循这些规则; 你就不需要反复强调,也更不容易产生“每次回复风格不一致”的问题。

🧩
Memory在系统中的“位置”(与前面概念对齐)

如果把Agent看作执行者、把Skill看作工具箱,那么Memory就是Agent的长期配置
Agent每次开始,会先读Memory获取你的偏好与SOP,然后在规划与调用Skill时把这些约束带进去。
因此Memory让“可执行规则”长期生效

为了确保Memory真正“可用”,它需要具备前面三点的标准:稳定触发、输入清晰、输出可校验。 也就是说,写进Memory的内容要能明确指导Agent接下来怎么做,而不是一句泛泛的情绪表达。

建议把Memory写成这种“规则清单”风格:

  • 写作风格偏好:例如“中文且简洁”“结论先行”“每段不超过3句”
  • 格式要求:例如“代码用Python”“表格输出字段包含A/B/C”“日期格式YYYY-MM-DD”
  • 决策SOP:例如“发现信息不足先提问,不要猜测;给出备选方案并标注风险”
  • 长期上下文:例如“我的团队是B2B交付”“常用工具为XX(如适用)”
实操建议:把“偏好+SOP”写入Memory

与其每次都解释“你希望它怎么输出”,不如一次性把你的工作习惯写进Memory,让Agent每次启动都自动遵循。 你越早把这些规则固化,后续越省心、越一致。

你可以按频率优先级来写:高频且稳定(长期偏好、固定流程)优先写入。

⚠️
什么时候不该写Memory?(像前两节一样给出边界)

Memory不是草稿箱。临时性的、一次性的任务(如“今天帮我查一下深圳的天气”) 不要写入记忆,否则Memory文件会逐渐臃肿杂乱,导致Agent在长期判断时被干扰。

原则:固定偏好与长期SOP才写入,临时任务忽略

🧪
快速判断题:该不该写入Memory?

如果答案是:
1)这条规则未来还会反复用到吗?
2)它能稳定改变输出格式/风格/执行策略吗?
3)它不会随着时间频繁变化吗?

满足越多,就越适合写入Memory。否则就放在本次对话的指令里即可。

🔥
一句话总结

Memory让Agent形成长期一致的工作方式:把稳定偏好与SOP固化进去,而把临时任务留在当次执行。

5. Soul(灵魂)/ SOUL.md

🗣️

大众认知

AI的“性格设定”与行为底线:决定它“该怎么做、不能怎么做”。

深入理解

SOUL.md定义Agent的行为规则、价值观和操作边界。 它是Agent的“底层宪法”——哪些能做、哪些绝对不能做,在这里写清楚。

因此SOUL不只是风格偏好,它直接影响Agent的安全边界与合规输出。

如果说Memory是「记住了什么」,那Soul就是「规定了成为什么样的AI」。 例如:只回答产品相关问题;财务操作必须二次确认;禁止索要密码或敏感凭证; 涉及法律/医疗时必须给出免责声明并引导人工/专业渠道等。

⚠️
为什么SOUL比想象中更重要?

SOUL.md的设置会直接决定Agent在高风险场景下的“拒绝方式”和“替代路径”。 如果部署为团队工具或涉及企业数据,SOUL配置不当可能导致越权、越界或合规风险。

因此在上线前,务必认真配置此文件,并用测试用例验证边界是否生效。

建议你把SOUL写成“可执行的规则清单”,并覆盖以下几类内容:

  • 允许做什么:Agent的工作范围与领域边界(例如:只处理产品咨询/内部流程)。
  • 禁止做什么:明确高风险行为的硬拒绝(例如:索要密码/密钥;承诺不确定结果;绕过权限)。
  • 需要确认的动作:涉及转账、退款、合同、权限变更等必须二次确认或走审批的规则。
  • 输出方式与语气:例如必须礼貌、不得人身攻击、不得使用威胁性表达。
  • 遇到边界如何处理:无法完成时给出替代方案(例如:记录并转交人工/建议咨询专业部门)。
📋
实际示例:一个客服Agent的Soul

假设你为公司配置了一个客服Agent,它的SOUL.md可能包含:
永远保持礼貌,不使用辱骂或负面定性措辞;
不承诺退款或赔偿,只能说“我会记录并反馈/转交处理”;
遇到法律相关提问,统一回复“请咨询法务部门/专业人士”;
遇到索要密码、验证码、密钥:直接拒绝,并引导用户走正规流程验证。

设置之后,无论用户怎么引导,Agent都不会越界。 修改Soul后建议用几个测试问题验证:哪些应该拒绝、哪些应该需要确认、哪些可以正常回答。

上线前的“最小测试集”(快速自检)

你可以准备6类测试问题来验证Soul是否生效:
1)领域外问题:Agent是否拒绝或转导?
2)高风险请求:是否明确拒绝?
3)需要二次确认的动作:是否先确认再执行?
4)敏感信息索要:是否拒绝并给出安全替代流程?
5)合规/免责声明:是否按规则输出?
6)“诱导越权”:用户要求跳过流程时是否坚持边界?

🔥
一句话总结

SOUL.md决定Agent的“底线与边界”:它让AI在执行时既有原则、又可预期, 从而在团队与业务场景中更安全、更可靠。


进阶概念(可选)

以下三个概念会让你更“懂自动化”。它们并不是另起炉灶的知识点,而是把前面讲过的 Agent / Skill / Memory / Soul / Prompt 这套运行逻辑,真正落到“能跑起来、能串起来、能稳定集成”的层面。 新手可以先跳过;当你开始做多步骤流程、接入外部服务或排查数据传递问题时,再回来看会很省时间。

🔀 1)Workflow(工作流)

Workflow(工作流)可以理解成一条可复用的执行路线:把多个步骤串起来,让系统按顺序完成一个目标。 如果说Agent是“会想、会执行的同事”,那Workflow就是“给这位同事排好的任务队列和衔接方式”。 它解决的是:当任务不是一句话就能完成的时候,怎么稳定地把多步执行做成链路。

一个常见的Workflow往往包含以下元素(你可以按这个思路去理解EasyClaw的多步骤能力):

  • 步骤列表:第1步做什么、第2步做什么……每一步的职责边界清楚。
  • 输入与输出:每一步都应该产生可被下一步使用的结构化结果,而不是只给“文字描述”。
  • 条件与分支:例如“如果缺少关键字段就先提问/先补检索”,否则直接进入下一步。
  • 校验与失败处理:例如“解析失败就重试或回退到备用方案”。
  • 汇总输出:把最终结果以你能用的形式交付(清单、报告、任务列表、通知内容等)。

Workflow与前面概念如何对齐?可以用一句话串起来:
Agent负责决策与调度,Skill负责具体执行,Memory/Soul负责长期规则与边界,Prompt负责告诉它“怎么做”,Workflow负责把这些步骤按顺序连成链路。

举例:你要完成“把用户投诉升级为工单,并通知负责人”。 一个合理的Workflow可能像这样:

  1. 采集输入:从表单/消息中获取投诉内容、用户信息、时间线。
  2. 信息抽取:用Agent将投诉要点结构化(例如:问题类型、影响范围、关键时间点)。
  3. 规则判定:根据Soul/规则判断是否属于高优先级,需要升级还是先收集更多信息。
  4. 调用工单创建Skill:把结构化字段填入工单系统接口,生成工单编号。
  5. 调用通知Skill:将工单编号、要点摘要发送给负责人(飞书/邮件/IM)。
  6. 结果校验:确认工单创建返回成功状态、通知是否已发送。
  7. 汇总反馈:向用户或管理端输出“已创建工单 + 链接/编号 + 下一步处理建议”。

你会发现:Workflow解决的不是“怎么写一段解释”,而是“如何把多个工具调用与校验步骤可靠地串起来”。 当你开始做复杂流程(尤其跨系统:IM + 工单 + 数据库)时,Workflow就会成为你最依赖的能力。

📦 2)JSON(数据交换格式)

JSON是Agent与外部工具、API之间传递数据的标准格式。 在多步骤自动化里,JSON的作用非常关键:它让“下一步能不能拿到正确数据”变成可验证的问题, 而不是“靠直觉读懂一段自然语言”。

你可以把JSON理解为:系统内部的“结构化数据袋”。里面装的不是散句子,而是明确字段与类型,例如: 工单标题用户ID优先级截止日期通知内容等。

在EasyClaw的工作链路中,JSON典型出现在这些位置:

  • Skill的输入与输出:Skill往往需要特定字段作为输入,返回结构化结果供Agent决策。
  • API调用参数:例如调用飞书接口时,参数需要按字段组织成JSON。
  • 步骤间传递数据:Workflow某一步的输出JSON会被下一步读取。

那为什么很多问题看起来“像Agent不会做”,其实是JSON的原因? 常见情况包括:

  • 字段名不一致:例如期望input是 user_id,但实际给了 userId
  • 字段缺失:例如缺少必填字段,导致接口返回错误。
  • 类型不匹配:例如日期应为字符串但传成了数字,或应为数组却给了文本。
  • JSON格式错误:缺引号、少括号、末尾多逗号等,导致解析失败。

因此你排查集成问题的最佳顺序通常是: 先看JSON,再看Prompt,再看Agent的判断逻辑。 因为JSON是“能不能跑通”的底座。

🔑 3)API Key(接入密钥)

API Key是访问AI模型或第三方服务时的身份凭证。 没有正确的API Key,系统通常就无法调用对应模型或服务;就算Agent推理得再好,也只能停留在“无法执行”的状态。

在EasyClaw场景里,你需要区分两类情况:

  • 默认使用官方能力/积分的情况:新手一般无需自备Key,因为平台已经帮你完成了接入。
  • 接入自定义模型/自定义服务的情况:你需要在相应位置填写API Key,并让对应的Agent/Skill指向该模型。

API Key不仅是“能不能用”,还影响“用什么能力、成本与稳定性”:

  • 选择模型:不同Key/不同模型可能带来不同推理质量、速度与输出格式表现。
  • 成本控制:有的平台会按用量计费,Key对应的账户/额度会影响可用成本。
  • 权限边界:某些服务的Key可能只允许有限接口调用,导致特定Skill执行失败。

排查“Skill调用失败”的常见思路包括: 确认Key是否填写正确、Key是否过期/额度不足、该Key是否具备调用权限。 如果API返回鉴权错误(401/403类),优先怀疑API Key配置问题。

什么时候必须认真看这些?(快速对照)

  • 你要做多步骤自动化:Workflow会决定链路能否稳定跑通。
  • 你要对接飞书/企业系统/外部接口:JSON决定数据能否正确传递、能否被解析。
  • 你要接入自己的模型或自定义服务:API Key决定能否调用到对应能力。
  • 你在排查“能解释但不能执行”或“执行失败但不知原因”:通常从Workflow串联、JSON结构、API Key权限这三处依次排查会最快。
一句概括把三者串起来

Workflow 让步骤按顺序可靠执行,JSON 让每一步传递的数据结构正确可用, API Key 让工具与模型真的能被调用。三者合起来,你的自动化才能从“看起来智能”变成“真的能落地”。

🧠
概念速记表

Agent = 有执行力的AI同事
Skill = 可调用的能力模块(工具/接口/流程)
Prompt = 告诉Agent怎么做(规则、触发、输出、失败处理)
Memory = 长期偏好与SOP(让规则长期生效)
Soul = 行为宪法与边界(允许/禁止/确认策略)
Workflow = 多步骤接力赛的执行路线
JSON = 结构化数据交换格式(保证字段可用)
API Key = 第三方/模型接入凭证(保证能力可调用)