
從「被動」到「主動」;從「問答」到「執行」
自從 ChatGPT 問世以來,人們見證了生成式 AI 的驚人能力。但是對於大多數企業而言,AI 仍然停留在百科全書、生圖趣味、簡報製作或文案助理的角色。我們已經非常習慣在 對話框中輸入提示詞 (Prompt) 給 AI,然後等待它給我們回應。這種互動模式本質上是被動的,人類要管理好每一個步驟,AI 是在被「召喚」時才發揮作用。
2024 年當我剛跨入 AI 這條全新賽道時,提出設計開發 AI Agent 的商業計畫去募資時,資金方一直要我提出「算力」預估,我一直解釋:我們不是要開發大型語言模型 (LLM),是建構在 OpenAI 的算力所提供的 LLM 認知與推理的能力上,連吳恩達第一次提出 Agentic 這個概念的影片都當成簡報內容了,但仍然有溝沒有通,募資告吹。
直到 2025 年底,Agentic AI 正在行程一個新的典範,並預估在 2026 年達到爆發點。
與 LLM 不同,Agentic AI 不只是回答問題,它的核心使命在於解決問題。它不再等待人類一步一步拆解任務,而是 (1). 能夠理解高層次的模糊目標,例如:「幫我規劃下一季的行銷預算,並與供應商確認報價」;(2). 自主拆解步驟、調用工具、在遇到錯誤時自我修正;(3). 最終交付成果。
SoftClouds 副總 Shankar Sitapati 說:
Agentic AI represents one of the most significant architectural shifts in the history of software. For decades, digital systems have relied on humans to orchestrate actions, clicking buttons, moving data, and stitching processes together across dozens of tools. Agentic AI finally breaks this pattern.
Agentic AI 代表了軟體歷史上最重要的架構轉變之一。幾十年來,數位系統依賴人類來編排行動:——點選按鈕、搬動數據。Agentic AI 終於打破了這種模式。
2026 是關鍵
多家權威機構預測,2026 年就是爆發關鍵,Agentic AI 將從實驗室走進企業的核心業務。
1. 40% 的企業應用程式嵌入 AI Agent
根據 Gartner 的預測,到 2026 年底,超過 40% 的企業應用程式將嵌入特定任務的 AI Agents,這一比例在 2025 年僅不到 5%。這意味著在短短一年內,AI 將從企業軟體的選配變成標配。
2. 從實驗到生產的「大過濾」
目前的現狀是,雖然近三分之二的組織正在實驗 AI Agent,但僅有不到四分之一成功擴展到生產環境。然而,SAS 認為 2026 年將是一個分水嶺,並稱 2026 年為 Great AI Reality Check (偉大的 AI 現實檢驗),各組織會意識到,缺乏資料品質、治理和變革管理,都會阻礙實現 AI 價值。
Shankar Sitapati 預估:
- 成功的專案:將不再只是將 AI 疊加在舊流程上,而是重新設計工作流程,並專注於治理與數據品質。
- 失敗的專案:那些工作流程不明確、目標模糊 (例如,喊說要「一切皆自動化」之類的口號) 的專案將被淘汰。Gartner 預測,到 2027 年底,將有 40% 設計不良的 Agentic AI 專案被取消。
3. 市場規模的爆發
Deloitte 估計,全球 Agentic AI 市場規模將在 2026 年達到約 85 億美元,到 2030 年可能增長至 350-450 億美元以上。
定義 Agentic AI
要理解 Agentic AI 為何能從被動到主動,從問答到執行,就必須先釐清它與流程自動化 (Robotic process automation,RPA) 及聊天機器人 (Chatbot) 的區別。
核心定義:四大基石
SoftClouds 與 NVIDIA 將 Agentic AI 定義為:能夠在有限監督下追求特定目標的系統。
一個真正的 Agent 必須具備以下四項核心能力:
- 理解目標 (Understand a goal):能解讀模糊的高層次指令,例如:「結清 EMEA 地區客戶的逾期發票」,而非僅限於死板的關鍵字觸發。
- 規劃工作流 (Plan a workflow):能夠運用推理能力,將大目標拆解為可執行的步驟序列。
- 調用工具 (Call tools and APIs):能夠主動使用外部軟體、資料庫或 API 來執行動作,而不僅僅是生成文字。
- 監控與適應 (Monitor and adapt):這是最關鍵的差異。當遇到錯誤,例如 API 連線失敗或資料格式錯誤時,Agent 能感知環境變化並嘗試替代方案,而非直接顯示錯誤而停止。
與 Chatbot 的差異對照表
| 特性 | Chatbot / LLM | Agentic AI |
|---|---|---|
| 互動模式 | 被動回應 (Prompt-Response) | 主動規劃與執行 (Plan-Execute) |
| 任務範圍 | 單次對話、資訊檢索 | 跨應用程式、長週期任務 |
| 錯誤處理 | 依賴人類重新輸入提示 | 自主推理、重試、修正路徑 |
| 工具使用 | 有限或無 | 深度整合 (MCP, API, UI 操作) |
| 記憶與上下文 | 依賴對話視窗,易遺忘 | 具備專案級記憶與狀態追蹤 |
| 角色定位 | 數位助理 (Copilot) | 流程擁有者 (Process Owner) |
從 Copilot 到 Default Workflow UI
2026 年的 AI 將不再只是瀏覽器旁的一個側邊欄 (Copilot),而是逐漸演變為工作流程的預設使用者介面 (Default Workflow UI)。 未來的財務人員可能不再需要打開 ERP 系統的複雜表單,而是對著 Agent 說:「處理上個月的差旅報銷」,Agent 就會自動登入系統、核對收據、填寫欄位並標註異常。人類的角色從操作者,轉變為審核者與決策者。
「虛擬同事」概念:HR 開始管理 AI
McKinsey 稱 AI Agent 為 virtual coworkers (虛擬同事)。隨著 Agentic AI 的能力提升,企業對待 AI 的方式將發生結構性轉變 (structural shift)。2026 年,前瞻企業將開始像對待人類員工那樣對待關鍵的 AI Agent,將它當作「數位勞動力」(Digital Worker)。
數位員工的入職與管理
這不僅僅是 IT 部門的事,舉例來說,人力資源 (HR) 部門將接入 AI 的管理。這聽起來像科幻小說,但其實際意義在於:
- Agent 有主管 (Owner):每個 Agent 都會有明確的管理者,負責監督與調適。
- 職務說明書 (Job Descriptions):每個 Agent 都會有明確的職責定義。例如,「發票核對Agent」的職責是「處理 5000 美元以下的標準發票,錯誤率需低於 0.1%」。
- 績效指標 (KPIs):每個 Agent 都會有明確的 KPI。企業將透過「解決問題的時間 (Time-to-resolution)」、「錯誤率 error rates」和「成本節省 cost saving」考核 Agent 的表現。
- 入職與離職 (Onboarding & Offboarding):當引入一個新 Agent 時,需要賦予它權限 (存取 CRM、Slack、Jira)、知識庫 (Agent Skills) 和工具;當它不再適用時,則需撤銷權限並除役。
邊界自主性 (Bounded Autonomy)
雖然我們稱之為「自主」,但企業環境下的 Agent 實行的是邊界自主性。這意味著 Agent 在明確定義的安全邊界內自由行動,但遇到高風險決策,例如批准大額退款或修改核心程式碼時,必須觸發「人工介入 (Escalation)」路徑,主動尋求人類主管的批准。這種「人機協作」(Human-in-the-loop) 不再是為了修正 AI 的無能,而是為了控制風險。
技術驅動力:讓虛擬同事「動」起來的關鍵
是什麼技術突破讓 2026 年成為可能?除了各家模型本身的智力提升之外,還有三個關鍵的基礎設施正在成熟,本篇文章先簡潔地說明,之後會有專文介紹:
第一、Agent Skills:數位員工的「培訓手冊」
過去,要讓 AI 學會特定任務需要繁瑣的 Prompt Engineering。現在,透過 Agent Skills 架構,開發者可以將專業知識封裝成標準化的目錄與文件。 這就像是發給新員工的「入職培訓手冊」。透過「漸進式披露」(Progressive Disclosure) 機制,Agent 平時只讀取目錄 (Metadata),知道自己有哪些技能;當遇到特定任務,如「審查法律合約」時,才會深入讀取具體的操作指南 (SKILL.md) 和調用工具。這讓 Agent 能夠擁有近乎無限的專業知識,而不會被資訊淹沒。
第二、MCP (Model Context Protocol):通用的「連接器」
如果 Skills 儲存的是大腦的知識,那麼 MCP 就是 Agent 的手腳。這是一個由 Anthropic 發起並捐贈給 Linux 基金會的開放標準,目的是在解決 AI 與數據源連接的破碎問題。 MCP 就像是 AI 界的 USB-C 接口。它讓 Agent 能以標準化的方式連接到 Google Drive、Slack、GitHub 或企業內部的 SQL 資料庫,讀取數據並執行操作。這使得 Agent 不再是封閉的聊天機器人,而是能真正深入企業 IT 系統的行動者。
第三、計算機使用能力 (Computer Use)
另一個新的進展是 AI 的 Computer Use 能力。現在的 Agent 可以像人類一樣看懂螢幕截圖,並控制滑鼠和鍵盤來操作任何軟體。這打破了 API 的限制,當遇到沒有 API 的老舊應用程式,Agent 也能像人類員工一樣點選,判斷介面並且操作。這真的就像是一位「虛擬同事」在工作的樣子:它能幫你打開瀏覽器、登入網站、下載報表,甚至填寫複雜的表單。
實際場景:虛擬同事的一天
Shankar Sitapati 用以下三個具體事例,說明 Agentic AI 如何改變工作:
- 銷售營運 (Sales Ops):
- 現狀:業務員花費大量時間在 CRM 系統中輸入數據、搜尋 LinkedIn 補充客戶資料、打字撰寫跟進郵件。
- 2026:銷售 Agent 自動監控收件箱,辨別潛在客戶,利用 MCP 連接 LinkedIn 豐富資料,自動更新 CRM,並起草個性化的跟進郵件。業務員只需審核,然後點選「發送」。
- 財務結算 (Finance):
- 現狀:月底結算時,會計師需要打開十幾個 Excel 表格和 ERP 視窗,手動比對數字。
- 2026:月底結算 Agent 自動從 ERP 抓取數據,比對銀行細項,自動調節差異。它只會把「奇怪的邊界案例」標記出來,例如一筆未經授權的大額支出。然後透過 Slack Channel 請求人類會計師處理。
- 軟體開發:
- 現狀:工程師花時間寫重複的測試程式碼或更新文件。
- 2026:工程師提交程式碼後,程式審查 Agent 自動運行,檢查是否符合安全規範,利用 Skills 中的知識庫建議修改,甚至自動發起 Pull Request 補充缺失的測試案例。
結語:準備迎接你的數位新同事
2026 年是 AI 從「工具」向「同事」的演變。Agentic AI 不再是被動等待指令的 Chatbot,而是目標導向、能夠主動規劃並與現有系統整合的自主實體。
對於企業領導者而言,這不僅僅是技術採購的問題,更是組織設計的挑戰。如何定義這些虛擬同事的角色?如何確保它們的安全與治理?如何讓人類員工與它們協作而非競爭?這些將是未來幾年企業轉型的核心議題。
正如 McKinsey 所言,這是一場從「實驗性展示 experimental demos」到「實質業務成果 practical business outcomes」的轉移。那些能夠成功駕馭 Agentic AI 的企業,將擁有一支 24 小時不間斷工作、可無限擴展且訓練有素的數位團隊,從而在效率與創新上取得決定性的優勢。