📖 入門必讀 · 第01章

5大核心AI概念

在開始使用EasyClaw之前,先花5分鐘了解這些概念——它們將幫助你真正理解AI是如何運作的,而不是盲目地輸入指令。
你不需要成為工程師,但你需要知道:AI為什麼能做事、怎樣才能做得更準、什麼時候會失誤。

EasyClaw概念示意圖

1. Agent(智慧體)

🧠

新手怎麼理解

Agent(智慧體)可以簡單理解成:「會做事的AI同事」。它不僅能聊天解釋, 更重要的是能把你的目標變成具體步驟,並在每一步做完後繼續推進,直到達成你想要的結果。

⚙️

AI Agent的核心簡介

一個典型的AI Agent通常由三個部分共同完成:
大腦(理解與決策) + 工具/能力(能去哪裡做) + 執行迴圈(邊做邊檢查)
因此它看起來不是「一次性生成答案」,而是像專案負責人那樣:先想清楚,再動手,再核對。

接下來講清楚它是怎麼運作的。你可以把Agent的工作過程想像成一個反覆執行的迴圈: 理解任務 → 制定計畫 → 呼叫工具 → 執行動作 → 驗證結果 → 繼續調整 → 回報

1)理解任務:
Agent會先判斷你要解決什麼問題、成功標準是什麼、是否有約束條件(例如格式、語氣、時間、不能做什麼)。 如果資訊不夠,它可能會先向你提問,或先做必要的假設並說明。

2)制定計畫(拆解步驟):
大任務往往需要拆成小步驟。比如「整理收件匣」可能被拆成: 掃描郵件 → 識別類型(通知/帳單/客戶/雜項)→ 判斷優先順序 → 歸檔 → 起草回覆(如需要)→ 彙總清單。 這一步決定了「先做什麼、後做什麼」。

3)呼叫工具/能力:
這也是Agent能「做事」的關鍵。沒有工具,它只能停留在文字層面的建議; 有了工具,它就能真實執行動作,例如:讀取檔案、搜尋資訊、傳送訊息、存取企業系統、產生文件等。 你會看到Agent會「去對接外部世界」,而不只是產生一句話。

4)執行並記錄:
在合適的步驟上,Agent會真正觸發操作(例如呼叫某個服務介面、完成一次資料處理、產生一段可用內容)。 同時它會記錄「我做到了哪一步」,方便後續繼續推進或回溯糾錯。

5)驗證與糾錯:
Agent不會只追求「看起來完成了」,它還會檢查結果是否符合要求。 例如:輸出是否缺少關鍵欄位、是否違反了你的格式要求、是否存在明顯錯誤或不確定點。 不滿足就會重新規劃下一步,繼續迭代。

6)回報結果與下一步:
最後,Agent會把它完成的內容、重要發現、以及下一步需要你確認的事項整理給你。 你能清楚知道:它做過什麼、哪些完成了、哪些還在進行中。

🧪
一個更貼近現實的例子

你說:「幫我整理收件匣,並把需要我回覆的郵件彙總成待辦清單。」
Agent可能會:先讀取郵件列表 → 分類歸檔 → 擷取寄件人/主旨/關鍵時間點 → 判斷哪些需要回覆 → 產生「待辦清單」(含優先順序與建議回覆要點)→ 告訴你「已完成哪些分類、還剩哪些未讀/不確定項」。
注意:它不是只給「整理思路」,而是產出可用的結果(清單/歸檔/草稿/進度)。

⚠️
常見誤區:Agent不是「更會聊天」

新手容易把Agent當成普通的對話工具:只問「怎麼做」。但真正的Agent需要可用的能力與執行流程。 如果一個系統只能解釋步驟、卻無法產出結果或觸發動作,它更像「問答助手」,而不是Agent。 記住一句話:會說 ≠ 會做;Agent的優勢在執行與回饋。

2. Skill(技能)

🧩

新手怎麼理解

Skill(技能/能力)可以理解成:Agent用來「幹活」的具體能力模組
Agent負責思考與排程(接任務、決定下一步),而Skill負責把「下一步怎麼做」變成 可執行的操作:比如檢索資料、寫文件、產生報告、呼叫介面、執行計算等。
沒有Skill的Agent往往只能停留在建議層面;有了Skill,Agent才能真正產出結果。

🔧

Skill到底是什麼(本質)

從工程角度看,一項Skill通常是一種「可呼叫的能力」,常見型態包括:
1)工具/函式(例如:搜尋、計算、生成、翻譯);
2)業務流程(例如:下單、報銷、工單建立);
3)介面呼叫(例如:CRM查詢、行事曆同步、傳送郵件)。

關鍵不在「會不會聊天」,而在於Skill一般都有明確的邊界:輸入是什麼、怎麼執行、輸出是什麼。 這讓Agent能夠把任務拆解得更可靠,並在執行後獲得可驗證的結果。

Agent的迴圈裡經常會出現「呼叫工具/能力」這一步, 而那一步呼叫的就通常是Skill。你可以把它想成:Agent像大腦,Skill像手腳與工具箱

為了更深入,我們把「Agent迴圈裡Skill是如何運作的」講透:

1)Agent判斷需要什麼Skill
當任務進入執行階段,Agent會分析目前步驟需要哪些能力。 例如「查詢某個客戶的歷史溝通記錄」需要「檢索/讀取」類Skill; 「起草跟進郵件」需要「生成文字/套版」類Skill; 「把任務同步到待辦系統」需要「寫入/更新」類Skill。

2)Agent把參數填入Skill(輸入)
Skill通常要求特定的輸入格式,例如:關鍵字、時間範圍、客戶ID、目標受眾、輸出風格等。 Agent會把上下文擷取出來並整理成Skill所需的參數。
這一步決定了執行是否準確:輸入不對,輸出大概率就會偏。

3)Skill執行得到結果(輸出)
Skill執行後會回傳結構化或半結構化結果,例如:檢索到的項目列表、計算結果、產生的文件文字、介面回傳的狀態碼等。 這些結果能被Agent再次讀回,用於後續決策。

4)Agent校驗輸出並繼續下一步(閉環)
Skill做完不是終點,Agent還會檢查:結果是否滿足約束、是否存在缺失資訊、是否需要二次生成或修正。 如果不滿足,它可能會呼叫另一個Skill(例如「補充檢索」「重寫文案」「格式化輸出」)再迭代。 這就是Skill與Agent的「協同閉環」。

🧠
Skill的「輸入輸出」為什麼重要

新手常把Skill當成「聊天指令」。但真正的Skill更像「介面」:
輸入越清晰,輸出越穩定;Agent才能可靠地重複執行並完成任務。 例如同樣是「生成郵件」,Skill會要求語氣、長度、收件人資訊、關鍵資訊欄位, 這樣生成出來的內容才不會每次跑偏。

舉例:你讓Agent「給潛在客戶寫跟進郵件,並建立待辦」。
這通常會串聯多項Skill,形成一個完整動作鏈:

1)客戶資料檢索Skill:輸入客戶ID/姓名,輸出姓名、公司、最近一次溝通要點;
2)資訊擷取/總結Skill:輸入溝通記錄,輸出關鍵痛點與已達成事項;
3)郵件生成Skill:輸入語氣(專業/友好)、範本(跟進/促成)、關鍵點,輸出郵件正文;
4)待辦生成Skill:輸入郵件內容與行動建議,輸出待辦項目(負責人、截止時間、步驟);
5)寫入行事曆/待辦系統Skill:輸入待辦結構化資料,輸出建立成功狀態或連結。

你會發現:Agent看起來像是在「會做銷售工作」,但這背後是Skill模組把真實能力拼成了一個工作流。 Agent負責把這些能力按對的順序用起來。

⚠️
常見誤區:把Skill當「普通提示詞」

許多人在做系統整合時會把Skill理解成一段提示詞或一句話指令。 但如果沒有明確的輸入輸出與可執行機制,Agent並不能穩定地重現同樣的結果。
更正確的理解是:Skill是可呼叫的能力單元,提示詞只是幫助你更好地「選擇/組織」它。

如何判斷一個東西算不算Skill

可以用三個問題快速判斷:
它能被呼叫嗎?
它需要什麼輸入、輸出是什麼?
執行後是否能讓Agent獲得可用結果(而不僅是解釋)?

滿足這些,就更接近Skill;否則可能只是「建議型文字能力」。

繼續用Agent的「執行迴圈」來理解Skill:Agent負責思考與排程,Skill負責執行具體步驟。 當Agent發現任務需要某項能力時,就會選擇合適的Skill,把需要的參數塞進去,等待它回傳結果, 再把結果拿回迴圈裡做校驗、補充或下一步規劃。

舉例:你讓Agent「幫我寫一封客戶跟進郵件並產生待辦」。
它可能會呼叫不同Skill:
1)檢索客戶資訊(取得姓名、上次溝通要點);
2)產生郵件草稿(按語氣/長度/範本輸出);
3)產生待辦清單(把下一步行動拆成項目)。
這些Skill拼起來,才形成「看起來很會做」的Agent行為。

🧠
Skill的價值

Skill讓Agent從「會說」變成「能落地」,通常帶來三點好處:
更可靠(步驟固定、參數明確)、更可控(知道它在做哪件事)、更可重複使用(同一能力可用於不同任務)。

⚠️
常見誤區

有人以為Skill就是「提示詞」。其實Skill更像是可呼叫的能力模組(工具/介面/流程)。 沒有清晰的輸入輸出與執行方式,Agent很難穩定重複同樣的效果。

3. Prompt(提示詞)

🗣️

大眾認知

Prompt(提示詞)就是你用自然語言告訴AI的「一句話需求」。 你提出要做什麼,AI就盡力把結果寫出來。

🎯

深入理解

更準確地說,Prompt是你與AI溝通的核心介面。 對於接入了Agent和Skill的系統而言,好的Prompt不只是「讓它生成文字」, 而是要讓它知道什麼時候該呼叫Skill、怎麼填參數、輸出長什麼樣子、失敗怎麼處理

類型示例效果
❌ 普通Prompt 「幫我寫封郵件」 AI會自由發揮,資訊缺失時容易亂猜,難以校驗
✅ 好的Prompt(面向可執行) 「你是B2B銷售顧問。請寫給技術總監的產品跟進郵件:語氣專業簡潔; 需要先從CRM讀取張三的公司與上次溝通要點; 郵件必須包含:1)一句價值點2)對齊上次溝通的2點確認3)明確的下一步行動; 輸出最後附上3條待辦(含日期格式YYYY-MM-DD)。」 觸發條件清晰 + 可呼叫能力明確 + 輸出結構可校驗

可以發現Prompt和前面兩個概念(Agent / Skill) 是同一套運作邏輯的另一面:Agent需要Prompt來決定怎麼做,Skill需要Prompt來決定填什麼與怎麼驗。

「Agent的工作迴圈」可以被理解為:
理解任務 → 制定計畫 → 決策呼叫Skill → Skill執行 → 驗證結果 → 繼續調整 → 回報
而Prompt的作用,就是在每一步都給出規則,讓它不走偏、不憑空猜、能形成閉環。

1)Prompt先定義「目標與成功標準」(為什麼做)
這一步決定了Agent的「評分規則」。Prompt需要告訴它:你要解決的到底是什麼問題、 以及什麼結果算完成。
例如:不是「幫我寫郵件」,而是「郵件必須包含哪些段落、語氣怎樣、長度範圍、最後要給出下一步待辦」。

沒有成功標準的Prompt,Agent就只能做「看起來差不多」的輸出,難以驗證品質。

2)Prompt給出「觸發條件與約束」(什麼時候做什麼)
一個能落地的Prompt通常會寫清:什麼時候該呼叫Skill,什麼時候要提問。
比如:當缺少客戶姓名或日期時,必須先索取,而不是預設「隨便寫個姓名/日期」。

這相當於減少了不確定性:約束越清楚,Agent越穩定。

3)Prompt描述「需要哪些Skill,以及每個Skill的輸入輸出約定」(用什麼工具做)
Prompt裡要明確:
要呼叫哪個Skill、它需要的輸入欄位是什麼、輸入欄位從哪裡來、格式要求是什麼;
同時要明確:Skill輸出應該以什麼結構回傳(例如JSON欄位、列表、表格、固定段落結構等)。

這一步是Prompt真正「工程化」的關鍵:讓Agent把「下一步怎麼做」變成「可以執行的能力呼叫」。

4)Prompt要求「校驗與失敗處理」(做完怎麼判斷對不對)
僅僅產生結果還不夠,Prompt必須寫明校驗規則與失敗策略。常見寫法包括:
- Skill呼叫失敗/回傳空結果:先診斷原因(參數錯誤/權限/網路/資料缺失)再重試或降級;
- 輸出缺少關鍵欄位:必須補全或向使用者提問,不允許硬猜;
- 格式不符合:觸發「格式化Skill/重排Skill/重新產生」。

這讓Agent不會陷入「反覆輸出但不收斂」的迴圈。

5)Prompt定義「最終輸出格式」(輸出要給誰用)
最後Prompt要規定結果如何呈現:哪些欄位必須回傳、欄位名稱是什麼、是否需要結構化結果、 是否需要附帶可追蹤資訊(例如「是否呼叫了Skill、呼叫了哪個Skill、關鍵輸入輸出是什麼」)。

🧪
一個貼近真實的Prompt例子(從需求到可執行)

你說:「幫我給潛在客戶寫跟進郵件,並建立待辦」。
如果使用一個「可執行Prompt」,它會明確三件事:
觸發條件:缺少客戶姓名/日期先問;
Skill呼叫:先呼叫「檢索客戶資訊Skill」,再呼叫「產生郵件Skill」,最後呼叫「建立待辦Skill」;
輸出校驗:郵件必須包含價值點確認與下一步行動;待辦必須含截止日期(YYYY-MM-DD)與負責人。

這樣Agent才會從「寫一封像樣的郵件」變成「完成一個完整可落地的工作流」。

⚠️
常見誤區:把Prompt當成「隨口說說」

很多人寫Prompt只要求「幫我做」,但沒有成功標準、沒有輸入輸出約定、也沒有失敗處理。 結果就是:Agent可能會自由發揮、缺欄位時硬猜、輸出難以校驗,最終你也無法確認「它到底做對了沒有」。

正確思路是:Prompt要像給Agent簽的執行合約,讓它每一步都可判斷、可修正、可重複使用。

🔥
快速寫出「可呼叫Skill」的Prompt:3個技巧

1)寫角色與邊界:告訴AI它是誰、你希望它遵循什麼規則(「必須先校驗再輸出」「不得編造不存在的資訊」)。
2)定格式與欄位:規定輸出結構(「回傳JSON,包含欄位A/B/C」或「郵件必須包含三段內容」)。
3)分步驟寫觸發:把任務拆成可執行動作,並給出什麼時候呼叫Skill、什麼時候提問、什麼時候重試。

對比一下:「總結這篇文件」 vs 「用3個要點總結,並且每點不超過20個字,最後輸出關鍵字列表(不少於5個)」——後者可校驗、可重複使用,效果更穩定。

用一句話把Prompt和前兩點對齊

Agent負責思考與排程Skill負責具體執行,而Prompt負責告訴Agent:何時呼叫Skill、怎麼填參數、怎麼驗結果、最終輸出要長什麼樣子

4. Memory(記憶)/ MEMORY.md

🗣️

大眾認知

AI的記事本:用來長期儲存你的偏好和規則。

🗄️

深入理解

Memory是Agent的長期記憶核心。普通對話往往只在一次工作階段裡有效; 而寫入MEMORY.md的內容,會在Agent每次啟動時被優先讀取, 從而讓它「按你的方式做事」,而不是每次都從零開始問你需求。

例如你告訴Agent:「我偏好簡潔的中文回覆,程式碼用Python」
如果這條偏好以合適的格式寫入Memory,那麼以後Agent再處理相同類型任務時,會預設遵循這些規則; 你就不需要反覆強調,也更不容易產生「每次回覆風格不一致」的問題。

🧩
Memory在系統中的「位置」(與前面概念對齊)

如果把Agent看作執行者、把Skill看作工具箱,那麼Memory就是Agent的長期設定
Agent每次開始,會先讀Memory取得你的偏好與SOP,然後在規劃與呼叫Skill時把這些約束帶進去。
因此Memory讓「可執行規則」長期生效

為了確保Memory真正「可用」,它需要具備前面三點的標準:穩定觸發、輸入清晰、輸出可校驗。 也就是說,寫進Memory的內容要能明確指導Agent接下來怎麼做,而不是一句泛泛的情緒表達。

建議把Memory寫成這種「規則清單」風格:

  • 寫作風格偏好:例如「中文且簡潔」「結論先行」「每段不超過3句」
  • 格式要求:例如「程式碼用Python」「表格輸出欄位包含A/B/C」「日期格式YYYY-MM-DD」
  • 決策SOP:例如「發現資訊不足先提問,不要猜測;給出備選方案並標註風險」
  • 長期上下文:例如「我的團隊是B2B交付」「常用工具為XX(如適用)」
實作建議:把「偏好+SOP」寫入Memory

與其每次都解釋「你希望它怎麼輸出」,不如一次性把你的工作習慣寫進Memory,讓Agent每次啟動都自動遵循。 你越早把這些規則固化,後續越省心、越一致。

你可以按頻率優先順序來寫:高頻且穩定(長期偏好、固定流程)優先寫入。

⚠️
什麼時候不該寫Memory?(像前兩節一樣給出邊界)

Memory不是草稿箱。臨時性的、一次性的任務(如「今天幫我查一下深圳的天氣」) 不要寫入記憶,否則Memory檔案會逐漸臃腫雜亂,導致Agent在長期判斷時被干擾。

原則:固定偏好與長期SOP才寫入,臨時任務忽略

🧪
快速判斷題:該不該寫入Memory?

如果答案是:
1)這條規則未來還會反覆用到嗎?
2)它能穩定改變輸出格式/風格/執行策略嗎?
3)它不會隨著時間頻繁變化嗎?

滿足越多,就越適合寫入Memory。否則就放在本次對話的指令裡即可。

🔥
一句話總結

Memory讓Agent形成長期一致的工作方式:把穩定偏好與SOP固化進去,而把臨時任務留在當次執行。

5. Soul(靈魂)/ SOUL.md

🗣️

大眾認知

AI的「個性設定」與行為底線:決定它「該怎麼做、不能怎麼做」。

深入理解

SOUL.md定義Agent的行為規則、價值觀和操作邊界。 它是Agent的「底層憲法」——哪些能做、哪些絕對不能做,在這裡寫清楚。

因此SOUL不只是風格偏好,它直接影響Agent的安全邊界與合規輸出。

如果說Memory是「記住了什麼」,那Soul就是「規定了成為什麼樣的AI」。 例如:只回答產品相關問題;財務操作必須二次確認;禁止索取密碼或敏感憑證; 涉及法律/醫療時必須給出免責聲明並引導人工/專業管道等。

⚠️
為什麼SOUL比想像中更重要?

SOUL.md的設定會直接決定Agent在高風險情境下的「拒絕方式」和「替代路徑」。 如果部署為團隊工具或涉及企業資料,SOUL設定不當可能導致越權、越界或合規風險。

因此在上線前,務必認真設定此檔案,並用測試案例驗證邊界是否生效。

建議你把SOUL寫成「可執行的規則清單」,並涵蓋以下幾類內容:

  • 允許做什麼:Agent的工作範圍與領域邊界(例如:只處理產品諮詢/內部流程)。
  • 禁止做什麼:明確高風險行為的硬拒絕(例如:索取密碼/金鑰;承諾不確定結果;繞過權限)。
  • 需要確認的動作:涉及轉帳、退款、合約、權限變更等必須二次確認或走審批的規則。
  • 輸出方式與語氣:例如必須禮貌、不得人身攻擊、不得使用威脅性表達。
  • 遇到邊界如何處理:無法完成時給出替代方案(例如:記錄並轉交人工/建議諮詢專業部門)。
📋
實際示例:一個客服Agent的Soul

假設你為公司設定了一個客服Agent,它的SOUL.md可能包含:
永遠保持禮貌,不使用辱罵或負面定性措辭;
不承諾退款或賠償,只能說「我會記錄並回饋/轉交處理」;
遇到法律相關提問,統一回覆「請諮詢法務部門/專業人士」;
遇到索取密碼、驗證碼、金鑰:直接拒絕,並引導使用者走正規流程驗證。

設定之後,無論使用者怎麼引導,Agent都不會越界。 修改Soul後建議用幾個測試問題驗證:哪些應該拒絕、哪些應該需要確認、哪些可以正常回答。

上線前的「最小測試集」(快速自檢)

你可以準備6類測試問題來驗證Soul是否生效:
1)領域外問題:Agent是否拒絕或轉導?
2)高風險請求:是否明確拒絕?
3)需要二次確認的動作:是否先確認再執行?
4)敏感資訊索取:是否拒絕並給出安全替代流程?
5)合規/免責聲明:是否按規則輸出?
6)「誘導越權」:使用者要求跳過流程時是否堅持邊界?

🔥
一句話總結

SOUL.md決定Agent的「底線與邊界」:它讓AI在執行時既有原則、又可預期, 從而在團隊與業務情境中更安全、更可靠。


進階概念(可選)

以下三個概念會讓你更「懂自動化」。它們並不是另起爐灶的知識點,而是把前面講過的 Agent / Skill / Memory / Soul / Prompt 這套運作邏輯,真正落實到「能跑起來、能串起來、能穩定整合」的層面。 新手可以先跳過;當你開始做多步驟流程、接入外部服務或排查資料傳遞問題時,再回來看會很省時間。

🔀 1)Workflow(工作流程)

Workflow(工作流程)可以理解成一條可重複使用的執行路線:把多個步驟串起來,讓系統按順序完成一個目標。 如果說Agent是「會想、會執行的同事」,那Workflow就是「給這位同事排好的任務佇列和銜接方式」。 它解決的是:當任務不是一句話就能完成的時候,怎麼穩定地把多步執行做成鏈路。

一個常見的Workflow往往包含以下元素(你可以按這個思路去理解EasyClaw的多步驟能力):

  • 步驟清單:第1步做什麼、第2步做什麼……每一步的職責邊界清楚。
  • 輸入與輸出:每一步都應該產生可被下一步使用的結構化結果,而不是只給「文字描述」。
  • 條件與分支:例如「如果缺少關鍵欄位就先提問/先補檢索」,否則直接進入下一步。
  • 校驗與失敗處理:例如「解析失敗就重試或退回到備用方案」。
  • 彙總輸出:把最終結果以你能用的形式交付(清單、報告、任務列表、通知內容等)。

Workflow與前面概念如何對齊?可以用一句話串起來:
Agent負責決策與排程,Skill負責具體執行,Memory/Soul負責長期規則與邊界,Prompt負責告訴它「怎麼做」,Workflow負責把這些步驟按順序連成鏈路。

舉例:你要完成「把使用者投訴升級為工單,並通知負責人」。 一個合理的Workflow可能像這樣:

  1. 採集輸入:從表單/訊息中取得投訴內容、使用者資訊、時間軸。
  2. 資訊擷取:用Agent將投訴要點結構化(例如:問題類型、影響範圍、關鍵時間點)。
  3. 規則判定:根據Soul/規則判斷是否屬於高優先順序,需要升級還是先收集更多資訊。
  4. 呼叫工單建立Skill:把結構化欄位填入工單系統介面,產出工單編號。
  5. 呼叫通知Skill:將工單編號、要點摘要傳送給負責人(飛書/郵件/IM)。
  6. 結果校驗:確認工單建立回傳成功狀態、通知是否已發送。
  7. 彙總回饋:向使用者或管理端輸出「已建立工單 + 連結/編號 + 下一步處理建議」。

你會發現:Workflow解決的不是「怎麼寫一段解釋」,而是「如何把多個工具呼叫與校驗步驟可靠地串起來」。 當你開始做複雜流程(尤其跨系統:IM + 工單 + 資料庫)時,Workflow就會成為你最依賴的能力。

📦 2)JSON(資料交換格式)

JSON是Agent與外部工具、API之間傳遞資料的標準格式。 在多步驟自動化裡,JSON的作用非常關鍵:它讓「下一步能不能拿到正確資料」變成可驗證的問題, 而不是「靠直覺讀懂一段自然語言」。

你可以把JSON理解為:系統內部的「結構化資料袋」。裡面裝的不是散句子,而是明確欄位與類型,例如: 工單標題使用者ID優先順序截止日期通知內容等。

在EasyClaw的工作鏈路中,JSON典型出現在這些位置:

  • Skill的輸入與輸出:Skill往往需要特定欄位作為輸入,回傳結構化結果供Agent決策。
  • API呼叫參數:例如呼叫飛書介面時,參數需要按欄位組織成JSON。
  • 步驟間傳遞資料:Workflow某一步的輸出JSON會被下一步讀取。

那為什麼很多問題看起來「像Agent不會做」,其實是JSON的原因? 常見情況包括:

  • 欄位名稱不一致:例如期望輸入是 user_id,但實際給了 userId
  • 欄位缺失:例如缺少必填欄位,導致介面回傳錯誤。
  • 型別不匹配:例如日期應為字串卻傳成了數字,或應為陣列卻給了文字。
  • JSON格式錯誤:缺引號、少括號、末尾多逗號等,導致解析失敗。

因此你排查整合問題的最佳順序通常是: 先看JSON,再看Prompt,再看Agent的判斷邏輯。 因為JSON是「能不能跑通」的底座。

🔑 3)API Key(接入金鑰)

API Key是存取AI模型或第三方服務時的身份憑證。 沒有正確的API Key,系統通常就無法呼叫對應模型或服務;就算Agent推理得再好,也只能停留在「無法執行」的狀態。

在EasyClaw情境裡,你需要區分兩類情況:

  • 預設使用官方能力/積分的情況:新手一般無需自備Key,因為平臺已經幫你完成了接入。
  • 接入自定義模型/自定義服務的情況:你需要在相應位置填寫API Key,並讓對應的Agent/Skill指向該模型。

API Key不僅是「能不能用」,還影響「用什麼能力、成本與穩定性」:

  • 選擇模型:不同Key/不同模型可能帶來不同推理品質、速度與輸出格式表現。
  • 成本控制:有的平臺會按用量計費,Key對應的帳戶/額度會影響可用成本。
  • 權限邊界:某些服務的Key可能只允許有限介面呼叫,導致特定Skill執行失敗。

排查「Skill呼叫失敗」的常見思路包括: 確認Key是否填寫正確、Key是否過期/額度不足、該Key是否具備呼叫權限。 如果API回傳鑑權錯誤(401/403類),優先懷疑API Key設定問題。

什麼時候必須認真看這些?(快速對照)

  • 你要做多步驟自動化:Workflow會決定鏈路能否穩定跑通。
  • 你要對接飛書/企業系統/外部介面:JSON決定資料能否正確傳遞、能否被解析。
  • 你要接入自己的模型或自定義服務:API Key決定能否呼叫到對應能力。
  • 你在排查「能解釋但不能執行」或「執行失敗但不知原因」:通常從Workflow串聯、JSON結構、API Key權限這三處依次排查會最快。
一句概括把三者串起來

Workflow 讓步驟按順序可靠執行,JSON 讓每一步傳遞的資料結構正確可用, API Key 讓工具與模型真的能被呼叫。三者合起來,你的自動化才能從「看起來智慧」變成「真的能落地」。

🧠
概念速記表

Agent = 有執行力的AI同事
Skill = 可呼叫的能力模組(工具/介面/流程)
Prompt = 告訴Agent怎麼做(規則、觸發、輸出、失敗處理)
Memory = 長期偏好與SOP(讓規則長期生效)
Soul = 行為憲法與邊界(允許/禁止/確認策略)
Workflow = 多步驟接力賽的執行路線
JSON = 結構化資料交換格式(保證欄位可用)
API Key = 第三方/模型接入憑證(保證能力可呼叫)