2024 8月專題 AI Agent 是甚麼?引領AI新浪潮 革新醫療服務的新力量
目錄
引言:AI Agent 時代的來臨
在人工智慧技術日新月異的今天,AI Agent(智慧型代理)正迅速成為科技界的新寵兒。這種由大型語言模型(LLMs)驅動的人工智慧系統,正在徹底改變我們與AI互動的方式。與傳統的AI應用不同,AI Agent擁有更強的互動性、感知能力和主動性,能夠在複雜多變的環境中獨立行動和決策。
AI Agent的應用範圍極為廣泛,從客戶服務到製造業,甚至醫療產業,都展現出巨大潛力。它們不僅能提高業務效率,還能降低成本,帶來顯著的經濟效益。隨著開發工具的普及,AI Agent的開發正變得越來越容易,這無疑將加速其在各行各業的應用和創新。但什麼是AI Agent?為什麼它們如此重要?
從單一模型到複合式AI系統
傳統AI模型的局限性
傳統的AI模型,無論多麼強大,都面臨著一些根本性的限制。這些限制主要體現在兩個方面:
- 知識範圍的局限性:模型的知識和能力都局限於訓練數據的範圍內。
- 適應性的不足:模型難以靈活應對新的、未見過的情況。
讓我們通過一個具體的醫療就診例子來說明這些限制。假設一位病人想知道自己應該去哪個科室就診,以及需要服用多少藥物。如果將這個問題輸入到一個傳統的AI模型中,很可能得到的答案是籠統或不適用的。為什麼?因為模型不知道病人的具體症狀、病史和當前身體狀況,也無法訪問醫院的科室安排和藥物資料庫。它只能基於其訓練數據給出一個通用的、可能完全不適合該病人情況的建議。
複合式AI系統的優勢
為了克服單一模型的局限性,研究人員們開始開發複合式AI系統。這些系統的特點是:
- 模塊化設計:系統由多個專門的組件組成,每個組件負責特定的任務。
- 靈活性:可以根據需要選擇和組合不同的組件。
- 可擴展性:易於添加新功能或改進現有功能。
在複合式AI系統中,我們可能會看到以下的組合:
- 自然語言理解模型
- 數據庫查詢接口
- 邏輯推理模組
- 語言生成器
這種組合使得系統能夠處理更複雜、更具體的特定任務。讓我們重新審視病人就診的例子,看看複合式AI系統如何處理:
- 系統首先理解病人描述的症狀和問題。
- 然後,它會查詢病人的電子病歷,獲取過往病史和當前用藥情況。
- 使用診斷推理模組分析症狀和病史,確定最可能的診斷和建議就診科室。
- 根據推測的診斷和病人的具體情況,使用疾病的藥物劑量資料庫確定合適的用藥方案。
- 最後,它生成一個個人化的回答。
這個回答不僅針對性強,而且考慮到了病人的具體情況,這正是複合AI系統在醫療諮詢中的強大之處。當然,這樣的系統僅作為輔助工具,最終的診斷和用藥決定仍需由專業醫生作出。
更多精彩內容:
AI Agent:複合式系統的進化
什麼是AI Agent(智慧型代理)?
AI Agent代表了複合式AI系統的進一步發展,這些系統不僅僅是將不同的模型拼湊在一起,而是在核心植入了一個"大腦"——通常是一個強大的大型語言模型(LLMs)。這個"大腦"負責整個系統的決策和控制,使得AI Agent具備了前所未有的自主性和靈活性。
在討論AI Agent時,我們經常會遇到"agent"和"agentic"這兩個相關但略有不同的詞。"Agent"指的是智慧型代理本身,而"agentic"(具有代理特性的)則是其形容詞形式。AI專家吳恩達(Andrew Ng)強調了使用"agentic"這個詞的重要性,認為它能在討論快速發展的AI技術時提供更多細微差別和靈活性。 「這種表述方式允許我們更準確地描述AI系統的特性。不同於將系統簡單地分類為代理或非代理」,吳恩達表示,「與其爭論哪些工作應該被納入或排除在真正的代理之外,不如我們承認系統可以在不同程度上表現出代理特性(agentic)。」
AI Agent的基本工作流程 實現工作目標
在人工智慧技術領域,AI代理(AI agents)依靠大型語言模型(LLMs)運行,常被稱為LLM代理。傳統的LLMs是基於訓練數據生成回應,但受限於知識和推理能力。然而,代理技術則通過後端工具呼叫獲取最新資訊,優化工作流程,並自主創建子任務以實現複雜目標。在此過程中,自主代理能夠適應用戶期望,儲存過去的互動並計劃未來行動,從而提供個性化體驗和全面回應。這種工具呼叫無需人工幹預,拓寬了AI系統在實際應用中的可能性。
目標初始化與規劃
儘管AI代理在決策過程中是自主的,但它們需要人類定義的目標和環境。對自主代理行為的影響主要有以下三個面向:設計和訓練代理人工智慧系統的開發團隊、部署代理並向用戶提供存取權限的團隊,以及為AI代理提供特定目標並建立可用工具的使用者。根據使用者的目標和代理的可用工具,AI代理會執行任務分解以提高效能,建立特定任務和子任務的計畫來完成複雜目標。對於簡單任務,計劃不是必要步驟,代理可以迭代反思回應並改進。
利用可用工具推理
AI代理基於其感知的資訊行動。通常,AI代理不具備處理所有子任務所需的完整知識庫。為解決此問題,AI代理使用可用工具,包括外部資料集、網路搜尋、API及其他代理。檢索到遺失資訊後,代理更新知識庫,重新評估行動計劃並自我糾正。舉例來說,假設用戶計劃假期並要求AI代理預測希臘衝浪之旅的最佳天氣週,代理會從外部數據庫收集希臘過去數年的天氣報告,並與專業衝浪代理通訊,最終結合資訊識別模式,預測最佳衝浪週,並將結果呈現給用戶。這種工具之間的信息共享使AI代理比傳統AI模型更具通用性。
學習與反思
AI代理通過回饋機制(如其他AI代理和人機循環)提高回應準確性。在形成回應後,代理儲存學習到的信息及用戶反饋以提高性能,調整未來目標。如果使用其他代理達成目標,也會使用其反饋。多代理回饋有助於減少人類用戶提供指導的時間,同時用戶也可在代理行動和推理過程中提供反饋,使結果更符合預期目標。回饋機制提高了AI代理的推理能力和準確性,稱為迭代細化。為避免重複錯誤,AI代理還能在知識庫中儲存先前障礙的解決方案。
AI Agent無標準架構 靈活解決問題
人工智慧代理的建構並無標準架構,但存在多種解決多步驟問題的範例。以下介紹兩種主要的推理範例:
- ReACT(Reasoning and Acting)
是目前實現AI Agent的一種流行方法。它強調推理和行動的緊密結合,使AI代理能夠在複雜的環境中做出明智的決策。ReACT的工作流程如下:
- 接收用戶查詢
- 分析問題並制定初步計劃
- 執行計劃,必要時調用外部工具
- 評估結果,如果不滿意則調整計劃
- 重複步驟3-4直到得到滿意的答案
- 生成最終回答
讓我們通過一個醫療場景來說明 ReACT 的強大之處。假設你問 AI 醫療代理:
"我最近被診斷出糖尿病,需要開始使用胰島素。我應該如何確定每日的胰島素用量?"
一個配備 ReACT 的 AI 醫療代理可能會這樣處理這個問題:
分析問題:確定需要哪些信息來做出準確的建議。這可能包括患者的血糖水平、年齡、體重、糖尿病類型、飲食習慣、運動情況、以及胰島素類型等。
收集信息:
- 查詢患者的電子病歷來確定糖尿病的具體類型和嚴重程度
- 搜索最新的糖尿病治療指南來了解胰島素使用建議
- 查找特定胰島素類型的使用說明和劑量範圍
- 如果缺少某些信息(如患者的詳細血糖監測記錄),可能會詢問患者更多問題
計算和推理:
- 根據患者的體重和血糖水平估算初始胰島素劑量
- 考慮患者的日常活動模式,制定分次注射的時間表
- 設計血糖監測計劃
- 制定劑量調整方案
生成回答:不僅給出具體劑量,還提供全面的用藥和生活方式建議。例如: "根據您的情況(2 型糖尿病、體重 80kg、空腹血糖平均值為 180mg/dL),我建議您從以下方案開始:
- 胰島素用量:開始時使用長效胰島素,每天晚上睡前注射 10 單位。監測一週後,如果空腹血糖仍高於 130mg/dL,每週增加 2 單位,直到達到目標。
- 血糖監測:每天至少測量 2 次血糖:起床後空腹和晚餐前。記錄所有測量結果。
- 飲食建議:採用低糖、低脂、高纖維的均衡飲食。每餐控制碳水化合物攝入量。
- 運動計劃:每天進行 30 分鐘中等強度的有氧運動,如快走。運動前後額外檢測血糖。
- 定期複查:兩週後進行首次複查,評估胰島素效果和調整需求。每 3 個月進行一次 HbA1c 檢測。
請注意,如果出現低血糖症狀(如出汗、心悸、頭暈),立即食用 15 克快速作用的碳水化合物(如葡萄糖片),並在 15 分鐘後重新檢測血糖。如有任何不適或疑問,請立即聯繫您的主治醫生。"
- ReWOO(Reasoning WithOut Observation)
與 ReAct 不同,ReWOO 方法消除了對行動規劃工具輸出的依賴。相反,代理商會提前計劃。
ReWOO 工作流程由三個模組組成:
- 規劃模組:代理人會根據使用者的提示預測下一步的步驟。
- 資料收集模組:收集透過呼叫這些工具所產生的輸出。
- 回應生成模組:代理將初始計劃與工具輸出配對以製定回應。
ReWOO 的優點:
- 使用者可以在執行計劃之前確認計劃。
- 透過在收到用戶的初始提示後預測要使用哪些工具,可以避免冗餘工具的使用。
- 這種提前規劃可以大大減少詞元(token)的使用和計算複雜性。
- 減少中間工具故障的影響。
AI Agent 的類型
人工智慧代理可以開發為具有不同程度的能力。簡單的代理可能更適合直接目標,以限制不必要的計算複雜度。以下是五種主要的代理類型,按從簡單到複雜的順序排列:
- 簡單反射代理Simple Reflex Agents
這是最簡單的代理形式,根據當前的感知採取行動,並且不具備記憶功能。這些代理僅在完全可觀察的環境中有效。
例:每晚定時開啟暖氣系統的恆溫器。
- 基於模型的反射代理Model-based reflex agent
這類代理使用當前的感知和記憶來維護世界的內部模型,並在部分可觀察和變化的環境中運行,但仍受到其規則的限制。
例:機器人吸塵器,能感知並繞過障礙物,記錄已清潔區域。
- 基於目標的代理Goal-based agents
這些代理不僅具有內部模型,還具備一組目標,透過搜尋和規劃達到目標,從而提高效能。
例:推薦最快路線的導航系統。
- 基於效用的代理Utility-based agent
這類代理選擇實現目標並最大化效用或獎勵的行動序列,效用是使用效用函數計算的。
例:優化燃油效率、最小化交通時間和通行費的導航系統。
- 學習代理Learning agent
學習代理具備學習能力,能夠將新的經驗添加到其知識庫中,增強在陌生環境中的操作能力。
例:電子商務網站的個性化推薦系統。
這些不同類型的人工智慧代理為解決各種複雜問題提供了多樣化的方法,從簡單的反射行為到複雜的學習和決策過程。選擇合適的代理類型取決於具體的應用場景和需求。
實現 AI 落地應用Agent Hospital 的誕生
智慧醫療因其場景的重要性和廣泛的應用價值,廣受醫療界、科技業的高度關注,中國清華大學於2024年7月發表了一篇論文,世界上第一家由人工智慧驅動的「AI代理醫院」(Agent Hospital)正在開發,人工智慧醫院將為醫療專業人員和大眾帶來巨大的好處,虛擬醫生代理與虛擬病人代理互動並不斷學習、改進。研究人員表示,在治療大約一萬名病人後,進化的虛擬醫生代理在涵蓋主要呼吸系統疾病的Med QA數據集子集上達到了93.6%的準確度。研究人員表示,憑藉其模擬環境和自主進化的能力,人工智慧醫生將能夠在幾天內治療多達 10,000 名患者。
醫療Agent的發展
近幾年,大語言模型(LLMs)的快速發展,包括代碼生成、信息生成和問題解答。受到基於大語言模型代理技術的啟發,一些研究採用了它們來模擬人類互動和行為,如史丹佛研究團隊所研發的生成代理 《AI 虛擬小鎮》。
史丹佛研究團隊所研發的生成代理 《AI 虛擬小鎮》,模擬人類行為的互動 圖片來源:generative_agents
AI Agent技術也被應用於各類任務的規劃和協作過程中,但這些過程大多依賴於高品質的人工標註數據。這引出了相關的問題:真實環境模擬能否提高語言模型代理在特定任務上的表現?
智慧醫療因其場景的重要性和應用價值廣受關注,研究團隊高度關注大型語言模型和AI Agent技術在醫療場景的應用研究。為了解決上述研究問題,團隊認為真實的模型環境能夠助力AI Agent的任務能力提升和進化,因此開展了結合真實世界模擬和醫學能力提升的Agent Hospital研究。團隊致力於構建醫院模擬環境,探索醫學AI Agent在該環境下的自主進化,使AI Agent能像人類醫生一樣在診療和學習過程中自主積累醫學知識,實現醫學能力的持續進化。
代理醫院的設計與運作
研究人員開發了一個名為代理醫院(Agent Hospital )的模擬情境,涵蓋了醫院內幾乎所有的醫療過程。圖中顯示了其概述,主要有兩種類型的代理:居民(病人)和醫療專業人士(14名醫生、4名護士),所有的角色資訊都是由大模型(GPT-3.5)生成。每個病人會在患病後選擇訪問醫院,在他們的住院期間,會經歷一系列與現實世界醫療過程相似的程序,包括發病、分診、掛號、問診、檢查、診斷、開藥和康復。
Agent Hospital概覽 圖片來源:清華大學智能產業研究院
在代理醫院中,病人在接受治療計劃後,健康狀況的變化會通過語言模型進行預測,並在康復後主動向醫院回報,所有環節流程均由大型語言模型支持,並且角色間能夠進行自主交流。
在上述醫療模擬過程中,疾病的產生是其中的關鍵。具體來說,當前的病歷信息由大型語言模型結合醫學知識為患者生成完整的病歷,包括疾病類型、症狀、持續時間、各項檢查結果等。為了盡可能保證整個模擬流程的準確性,患者代理只會感知到自己的疾病症狀但不知道具體疾病,醫生代理則只能通過和患者代理對話問診和檢查來了解信息。
患者代理需要進行的檢查、所患疾病類型和疾病嚴重程度判斷,評價醫學AI Agent對虛擬病人的診療能力的三個關鍵任務。
虛擬角色的資訊簡介 圖片來源:清華大學智能產業研究院
下圖展示了診療的環節演示:
當患者代理角色Kenneth Morgan有患病症狀後,他會前往醫院求助。分診護士代理Katherine Li了解Morgan的症狀進行分析後,將他分診到具體科室就診。Morgan會根據醫囑完成掛號、咨詢和醫學檢查後,醫生代理Robert會給他最終的診斷和治療方案。Morgan將會根據醫囑回家休息並反饋給醫院康復情況,直至下次生病再前往醫院。
主要診療環節範例 圖片來源:清華大學智能產業研究院
「MedAgent-Zero」演算法 醫療代理自我進化
基於這個項目,研究人員旨在訓練能夠處理醫療任務(如診斷和治療建議)的高效醫生代理,這些任務在醫院環境中至關重要。傳統的大部分醫學模型訓練方法依賴於預訓練、微調等技術,因此需要大量的醫學數據以及部分高品質人工標註數據的支持。然而,研究團隊認為,人類醫生能力提升過程不依賴於這樣的大量數據,他們往往能從臨床實踐的診療過程中積累經驗,也會通過閱讀醫學文獻積累關鍵知識實現提升。
因此,團隊設計了名為“MedAgent-Zero”的AI Agent自我進化算法,它如同AlphaGo-Zero一樣不依賴人工標註數據,而是在虛擬醫院中利用學習(即閱讀醫學文獻)與實踐(即與虛擬病人交互並做診療決策)兩種途徑實現能力提升:一方面,醫學AI Agent可以按照上述診療流程,與病人代理進行診療交互,在開具檢查、疾病診斷和治療建議三個任務上自主積累經驗;另一方面,醫生代理也會進行自主學習,基於LLM生成的醫學問題模擬醫學文檔的學習過程。
MedAgent-Zero策略流程示意圖 圖片來源:清華大學智能產業研究院
如上圖所示,MedAgent-Zero的進化方式包括兩種途徑:
- 從成功案例中總結經驗:對於能夠答對的診療問題,AI Agent會像人類醫生一樣進行病歷庫經驗積累。
- 從失敗案例中反思教訓:在回答錯誤時,AI Agent會主動進行錯誤反思並進行改進。如果反思的經驗教訓能夠幫助AI Agent回答對該問題,它將被保留下來並存儲在經驗庫中。
醫學能力評價 在虛擬醫院展現驚人成果
在虛擬醫院中,研究團隊成功建構了上萬名虛擬病人的病歷,用於醫學代理的自主進化實驗。這些病歷涵蓋了甲流、乙流、新冠等八種呼吸道相關疾病,並涉及十餘種不同的醫學檢查。相比於人類醫師一週診療約100名病人的速度,醫生代理僅需幾天即可完成診斷10,000名病人的任務,展現出極高的效率。
醫生代理在訓練集(左圖)和測試集(右圖)上的任務準確率狀況 圖片來源:清華大學智能產業研究院
研究團隊主要從兩個方面對虛擬醫院中的醫生代理進行能力評價。首先是在虛擬環境中的評價:在醫生代理的訓練過程中,隨著診療病人的增加,代理在三個關鍵任務上的準確率持續上升並逐漸趨於穩定。而針對500個測試病歷的實驗則顯示,隨著診療病人數量增加,代理的準確率雖有波動,但整體呈現上升趨勢。
研究團隊還比較了代理進化前後在各個疾病上的診斷準確率,結果顯示均有大幅提升,驗證了其自主進化的有效性。
進化前後在不同疾病的診斷表現 圖片來源:清華大學智能產業研究院
此外,團隊還使用了外部資料集MedQA的呼吸道疾病子集,評估醫生代理在真實世界中的醫學能力。令人驚訝的是,代理在進化過程中未使用任何人工標註數據,但在診療近萬名病人後,依然能在該資料集上超越現有最佳方法,達到93.06%的最高準確率,進一步證明了模擬環境中自主進化的有效性。
不同方法在MedQA子集上的正確率 圖片來源:清華大學智能產業研究院
無所不在的智慧助手 AI Agent時代來臨
AI Agent正在各個產業領域展現出巨大的潛力和應用前景,將大型語言模型的力量實際落地應用於各個領域,從客戶支援、數據科學到個人助理,或是更專業的醫療產業,AI Agent正在重塑企業運營和日常生活的方方面面。以客戶支援為例,金融科技領先企業Klarna的AI助手已能處理三分之二的客戶服務請求,實現了700名全職人員的工作自動化,並帶動了估計4000 萬美元的額外收入。數據科學方面,Delphina的AI代理可自動化整個數據科學生命週期,大幅提升效率。而在個人助理領域,Mindy和Ario等公司正在努力實現科幻小說中的場景,致力於打造由AI Agent驅動的個人助理。
隨著大型語言模型技術的不斷進步,AI Agent的能力有望持續提升,為更多行業帶來革命性變革。在醫療領域,中國清華大學所發表的 Agent Hospital,已經開始展現其巨大潛力,有望改變醫療體系,從精準診斷到個性化治療,除了減少醫護人員的行政作業時間,更為患者提供更高效、更準確的醫療服務。
未來幾年,AI Agent將在更多細分領域嶄露頭角,為醫療機構降低成本、提高效率,並改善患者體驗,實現智慧醫療的美好願景。這一新興技術正以驚人的速度推動變革,未來充滿無限可能。
更多精彩內容:
更多資訊及參考資料:
AI Agent Hospital - Autonomous Doctor Agents and Nurses Treating PatientsAI 代理醫院 - 自主醫生代理和護士治療患者, 2024.
AI Agent來了,但它是什麼?AI代理介紹、趨勢全解讀 | 遠見雜誌 [WWW Document], 2024. . 遠見雜誌 - 前進的動力. URL https://www.gvm.com.tw/article/113965 (accessed 7.28.24).
AI Agent:智慧應用新篇章 – 微軟新聞中心 [WWW Document], n.d. URL https://news.microsoft.com/zh-tw/features/ai-agent/ (accessed 7.28.24).
AIR科研|AIR打造虚拟医院,实现AI医生自我进化-清华大学智能产业研究院 [WWW Document], n.d. URL https://air.tsinghua.edu.cn/info/1007/2246.htm (accessed 7.28.24).
Apple’s Gen AI Strategy, Stability’s Copyright-Clear Audio Generator, and more [WWW Document], 2024. . Apple’s Gen AI Strategy, Stability’s Copyright-Clear Audio Generator, and more. URL https://www.deeplearning.ai/the-batch/issue-253/ (accessed 7.31.24).
awesome-generative-ai-guide/resources/agents_101_guide.md at main · aishwaryanr/awesome-generative-ai-guide [WWW Document], n.d. . GitHub. URL https://github.com/aishwaryanr/awesome-generative-ai-guide/blob/main/resources/agents_101_guide.md (accessed 7.30.24a).
awesome-generative-ai-guide/resources/agents_101_guide.md at main · aishwaryanr/awesome-generative-ai-guide [WWW Document], n.d. . GitHub. URL https://github.com/aishwaryanr/awesome-generative-ai-guide/blob/main/resources/agents_101_guide.md (accessed 7.29.24b).
Chen, T., 2024. 什麼是 AI Agent?. ChatGPT 落地研究 | Ted. URL https://chatgptlanding.substack.com/p/ai-agent (accessed 7.28.24).
Chi, T.W., 2023. Octane AI CEO 談自主代理人入門指南 — 你需要知道的一切. Medium. URL //medium.com/@TsengWenChi/octane-ai-ceo-%E8%AB%87%E8%87%AA%E4%B8%BB%E4%BB%A3%E7%90%86%E4%BA%BA%E5%85%A5%E9%96%80%E6%8C%87%E5%8D%97-%E4%BD%A0%E9%9C%80%E8%A6%81%E7%9F%A5%E9%81%93%E7%9A%84%E4%B8%80%E5%88%87-410bc1817e9d">https://medium.com/@TsengWenChi/octane-ai-ceo-談自主代理人入門指南-你需要知道的一切-410bc1817e9d (accessed 7.28.24).
Intelligent Agent, n.d. . 臺灣人工智慧行動網 Taiwan AI Wise Agent Network. URL https://ai.iias.sinica.edu.tw/glossary/intelligent-agent/ (accessed 7.28.24).
Kan, M.-Y., n.d. Intelligent Agents.
Li, J., Wang, S., Zhang, M., Li, W., Lai, Y., Kang, X., Ma, W., Liu, Y., 2024. Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents. https://doi.org/10.48550/arXiv.2405.02957
Lin, J., 2020. 人工智慧筆記《二:Agent》. Medium. URL https://jimmystore.medium.com/人工智慧筆記-二-agent-2f6908b899c6 (accessed 7.28.24).
Lukyanenko, A., 2023. Paper Review: Generative Agents: Interactive Simulacra of Human Behavior. Medium. URL https://artgor.medium.com/paper-review-generative-agents-interactive-simulacra-of-human-behavior-cc5f8294b4ac (accessed 7.28.24).
Toews, R., n.d. Agents Are The Future Of AI. Where Are The Startup Opportunities? [WWW Document]. Forbes. URL https://www.forbes.com/sites/robtoews/2024/07/09/agents-are-the-future-of-ai-where-are-the-startup-opportunities/ (accessed 7.31.24).
What Are AI Agents? | IBM [WWW Document], 2024. URL https://www.ibm.com/think/topics/ai-agents (accessed 7.28.24).
What are AI Agents?什麼是人工智慧代理?, 2024.
Xu, B., 2024. billxbf/ReWOO.
世界上首家AI醫院 每天可看診 3000 人, 2024. URL https://www.technice.com.tw/issues/ai/115475/ (accessed 7.28.24).
天瓏網路書店 | 大模型應用開發 動手做 AI Agent [WWW Document], n.d. . 天瓏網路書店. URL https://www.tenlong.com.tw/products/9787115642172 (accessed 7.28.24).