← 補充單元 相關等級:L2
🔄
架構 · Agent

AI Agent 工作流:讓 AI 自主完成多步驟任務

從單次問答到自主執行,AI 的下一個階段

從聊天到 Agent:差在哪裡?

一般 AI 對話:你問一個問題,AI 給一個答案。每次對話是獨立的。

AI Agent:你給一個目標,AI 自行規劃步驟、使用工具、執行任務、根據結果調整,直到完成目標。

對話是一問一答,Agent 是自主執行。


Agent 的四個核心元素

1. 感知(Perception)

Agent 能接收的輸入:

  • 文字、圖片、文件
  • 工具執行的結果
  • 環境回饋(成功 / 失敗 / 錯誤訊息)

2. 規劃(Planning)

Agent 如何分解任務:

  • ReAct 框架:Reasoning(推理)+ Acting(行動),交替進行思考與執行
  • Chain of Thought:把複雜問題拆成步驟逐步推理
  • Task Decomposition:把大任務分解成可執行的子任務

3. 工具使用(Tool Use)

Agent 能呼叫的外部能力:

  • 搜尋網路(Web Search)
  • 執行程式碼(Code Execution)
  • 讀寫檔案(File System)
  • 呼叫 API(External Services)
  • 操作瀏覽器(Browser Automation)

4. 記憶(Memory)

  • 短期記憶:當前對話的 context window
  • 長期記憶:向量資料庫(Vector DB)儲存的知識
  • 工作記憶:任務執行過程中的中間結果

Orchestrator-Worker 架構

複雜任務通常用多個 Agent 協作:

Orchestrator(總協調)
├── Worker Agent A(負責研究)
├── Worker Agent B(負責撰寫)
└── Worker Agent C(負責審查)

Orchestrator 負責任務分配與結果整合,Worker 各自專注特定能力。


主流 Agent 框架

框架 特點 適合場景
LangChain 最多社群資源、模組最豐富 快速原型、學習
LangGraph 有狀態的 Agent 圖形流程 複雜多步驟工作流
CrewAI 角色扮演式多 Agent 協作 模擬團隊協作
AutoGen Microsoft 出品,多 Agent 對話 企業場景
Claude Code Anthropic 出品,操作本地環境 開發自動化

Human-in-the-Loop

Agent 不是完全自主,良好的設計會在關鍵節點等待人類確認:

  • 執行危險操作前(刪除資料、發送郵件)
  • 結果不確定時
  • 需要創意判斷時

Hitl(Human-in-the-Loop) 是讓 Agent 可信賴、可落地的關鍵設計原則。


相關專有名詞

AI Agent Autonomous Agent ReAct Chain of Thought Task Decomposition Tool Use Function Calling Orchestrator Worker Agent Multi-Agent LangChain LangGraph CrewAI AutoGen Vector DB Human-in-the-Loop Agentic AI Context Window Memory

L2「Agent 工作流」課程中,我們會設計一個完整的 Orchestrator-Worker 架構,讓 AI 自主完成一個五步驟的工作任務。