今年是AI代理全面起飛的一年,各大公有雲業者相繼推出功能更完整的AI代理框架和工具,就連相關的溝通協定也逐步到位。老牌數據分析大廠SAS也不缺席,近年轉型為AI供應商的他們,在今年產品大會中,跟進許多科技大廠的腳步,將代理型AI(Agentic AI)列為AI新戰略,成為一大產品新亮點。
生成式AI難解偏見,SAS看準AI代理實務潛力
為什麼AI代理如此重要,值得全力押寶?SAS的理由不是因為潮流,而是因應實務需求。
SAS執行長暨技術長Bryan Harris在大會首日主題演講中指出,單靠大型語言模型(LLM)和提示工程,無法滿足企業對生成式AI應用的期待。「研究表明,提示可以減少一些模型偏見,但效果不穩定,也難以重現。」
他進一步說明,研究發現,主流LLM在房貸核准的應用中,會因訓練資料的偏見,導致黑人申請者面臨更高利率與更低通過率。「如果一個人申請房貸被拒,原因只是模型從網路學到了偏見,這樣的結果是不能接受的。」
面對這樣的挑戰,Bryan Harris強調,企業需要一種更強大的方法,來調度LLM、模型治理和API,兼顧公平性、準確性和治理能力。他認為,導入具備治理機制的代理型AI,正是解決這些問題的解方。
這也是為何他觀察到,越來越多企業正快速從生成式AI轉向代理型AI,而且「一份研究顯示,今年將有52%的組織,將代理程式工作流程融入到業務中。」
定義代理型AI的兩種應用情境
SAS產品策略聚焦兩種代理AI情境,AI自主決策(Human-out-of-the-loop)和AI人機協作(Human-in-the-loop)情境。以詐欺偵測為例,在「AI自主決策」場景中,代理可以自主偵測並拒絕詐欺交易,而在「AI人機協作」中,代理會分析不規則交易,並查詢其他資料來源理解上下文、計算綜合風險評分,然後產出摘要,交由人工判讀與最終決策。
SAS應用AI和建模研發副總監Udo Sglavo進一步說明,SAS提供3種代理AI部署方式,一是Viya平臺內建的原生代理,可直接支援即時決策和流程自動化;二是使用該平臺工具自行客製代理,但只能在平臺上執行。三是獨立型代理,無需Viya平臺也能執行特定任務,可用於多代理環境。
他指出,無論採用哪種代理類型,SAS都支援如A2A(Agent-to-Agent)、MCP等代理標準通訊協定,可整合不同代理之間的協作流程。還沒採用Viya平臺的企業,也可從獨立型代理切入,逐步評估實務效益與導入價值。
升級既有平臺,導入AI代理功能
在代理AI戰略方向下,SAS將既有的即時智慧決策平臺Intelligent Decisioning擴充為代理型AI平臺,新添AI代理工作流程設計、執行與監控的能力。
企業用戶可以透過拖拉式介面建置代理工作流程,整合至既有系統架構中,也可以在不同風險和任務複雜度條件下,設計完全自主決策的AI代理,或是彈性調整AI代理的自主決策程度,並加入人類審核流程。
在SAS Intelligent Decisioning平臺中,使用者除了能拖拉建置AI代理工作流程,還能查看、調整既有節點(也就是流程方塊),來讓整體流程更符合業務需求。
Bryan Harris現場展示代理AI平臺的功能,他打開一個自製的抵押貸款(Mortgage loan)申請儀表板,畫面顯示AI代理分析了6,200份申請,其中1,800份需要人工審核。
但仔細看,有位VIP客戶的申請被拒,有點奇怪。為釐清原因,Bryan Harris透過儀表板旁的聊天室,用自然語言詢問該客戶為何被拒,此時LLM給出「查看決策邏輯」和「查看模型卡(Model Card)」兩種選項,來讓使用者理解決策背後的原因。
點擊「查看決策邏輯」,就能看到一張桑基圖(Sankey Diagram),視覺化顯示AI代理工作流程中,各節點的邏輯依據與決策流程。
以這個例子來說,共有20個代理工作流程步驟,比如第一步的申請核准判斷、LLM解釋和最終決策等。若發現步驟有問題,使用者可直接編輯節點,加入新的流程來調整。Bryan Harris強調,這些節點可重複利用,來加速建置代理工作流程。
模型卡與供應鏈追蹤,強化治理與可解釋性
除了代理決策流程透明化,前面聊天室給出的另一個「查看模型卡」選項,也能加強企業對AI代理的理解,尤其是代理背後的模型效能。
這個「模型卡」是SAS去年亮相、內建於Viya平臺的功能,可自動為每個註冊模型產出一份重要資訊摘要,包括準確性、公平性和模型漂移(即適用性)等指標,以及模型修改時間、負責人員,甚至是模型預期用途、使用建議等,就像是模型的營養標示一樣,方便技術與非技術部門掌握模型效能與使用風險。
不只掌握模型效能,Intelligent Decisioning平臺還提供「AI供應鏈追蹤(Lineage)」功能,清楚列出企業所使用的所有模型、流程和資料來源,並可追溯從資料ETL、模型訓練、部署到決策輸出的全部過程,可用於遵循透明性和可解釋性的法規要求。
在代理AI新戰略下,SAS除了亮相AI代理平臺Intelligent Decisioning新功能,還將其納入AI供應鏈追蹤(Lineage)功能中,使用者可一眼查看代理應用狀況、資料ETL、模型版本等資訊。
Bryan Harris現場示範這個功能,畫面會秀出一張流程表,列出企業採用的所有AI流程,比如Intelligent Decisioning平臺的AI代理流程、模型管理器、模型工作室、資訊目錄表和SAS工作室等,各個流程內還會列出子流程,比如模型管理器使用了哪些模型、用模型工作室訓練了哪些模型、目錄表包含了哪些使用資料,以及SAS工作室如何進行ETL。
也就是說,從資料ETL流程、模型訓練、版本管理、模型部署到最後輸出決策的邏輯,都能視覺化呈現給使用者查看,因應合規需求。
不過,SAS數據道德實務副總裁Reggie Townsend坦言,多代理協作環境的治理仍有挑戰性,SAS已著手開發代理層級的治理工具,要進一步強化AI代理的可監管性。
資料對映代理登場,還預告預建代理策略
為進一步降低企業導入門檻,SAS還在大會上宣布預建(Prepackaged)代理策略,首先揭露一款資料對映代理Data Mapper Agent,要來簡化資料表結構(Schema)對映任務。
Udo Sglavo點出,資料表結構對映是個非常常見但耗時的任務,通常,開發者需要寫程式來將來源資料表結構,對映到目標資料表結構。而SAS這款資料對映代理,可自動將來源資料表結構,對映到SAS解決方案或SAS模型所需的資料表結構。
他現場示範,將一個來源資料表結構上傳到Data Mapper後,驅動代理的LLM會分析來源資料表結構的後設資料(Metadata),並將來源資料表結構的欄位對映到目標結構的欄位,還會附上每個對映的信心水準。
要是使用者要是對信心水準低的對映有疑慮,能進一步要求Data Mapper重新評估。若還是不滿意,使用者也可以手動更改LLM建議的對映,「這回到了AI人機協作的概念,」Udo Sglavo說,人類可以隨時介入這個流程。
對映都確認無誤後,下一步,Data Mapper會產出可執行的SQL程式碼,來實際對映資料表結構。同時,它還會自動產出一份JSON格式對映檔,以及一份完整的流程說明文件,包含整個對映過程與手動更改部份,來讓使用者更容易整合、追蹤。
SAS今年首度揭露資料對映代理Data Mapper Agent,要來簡化資料表結構(Schema)對映任務。透過代理背後的大型語言模型分析來源Schema和目標Schema,可產出對映建議和信心水準,分高、中、低三個等級。
Udo Sglavo表示,Data Mapper Agent是AI人機協作的一個實例,未來,SAS還將在供應鏈領域和資料工程領域,推出更多預建AI代理。
生成式AI掀起應用熱潮,但代理型AI成了產業落地的關鍵。老牌數據分析大廠SAS將代理型AI整合至主力產品,推出開箱即用的AI代理,也跟進支援多代理協作協定,反映出積極卡位企業級AI代理生態系的野心。
然而,面對跨模型、跨部門的多代理運用場景,確保AI代理效能穩定且可控,將是AI代理深化應用的最大挑戰,也是SAS接下來必須解答的一道題。
其他AI新戰略:數位雙生和量子AI
不只代理型AI,SAS今年還端出其他AI新戰略:數位雙生和量子AI。
數位雙生雖然不是新東西,但在今年有了新突破,SAS聯手遊戲業者Epic Games,將其遊戲引擎Unreal Engine的強大模擬功能,結合SAS Viya平臺數據分析功能,拓展了模擬真實世界的數位雙生應用,成功替美國最大造紙大廠Georgia Pacific打造出虛擬工廠無人搬運車AGV模擬場景。
SAS今年也揭露數位雙生戰略新進展,聯手遊戲業者Epic Games,將其遊戲引擎Unreal Engine強大模擬功能,結合SAS Viya平臺數據分析功能,成功替美國最大造紙大廠Georgia Pacific打造出虛擬工安模擬場景。圖片來源/SAS
Georgia Pacific廠區長達400公尺,相當於4個足球場,AGV必須避開高風險路線,找出最佳搬運路線,且互不干擾。Georgia Pacific AI副總監Roshan Shah表示,想用數位雙生的模擬系統,來找出安全又有效率的AGV路線。
於是,他們先輸入場域真實資料至SAS平臺,再將數據輸入Unreal Engine模擬環境,來進行虛擬演練,模擬不同路線與數量的AGV調度。最終,他們實作出最佳路線,成功減少8%的平均作業時間,還提高安全性。
不只是AGV路線調度,雙方也利用Unreal Engine和SAS平臺,設計出數位人形員工,來模擬工安事故現場。也就是說,他們用攝影機生成高度擬真的工安影像,像是工人、危險動作和工作環境,來訓練電腦視覺模型,加強AI模型對工安辨識的準確率。這些合成資料,也能提高模型對不同膚色、姿態、光線的辨識能力。
有了這些資料訓練,模型更能在真實場域中,提供更精準的判斷,避免不工安意外的發生。
瞄準量子AI,加速複雜模型運算
SAS另一項AI新戰略是瞄準量子AI,採取合作與研究並行的策略,一方面與量子運算技術廠商合作,例如商用量子退火業者D-Wave,另一方面結合自家研發能力,與企業客戶共同推動試點專案,來驗證量子AI應用的可行性。
其中一項成果,是與跨國消費品大廠P&G(寶僑)聯手的PoC專案,來驗證量子與經典運算混合優化的效益。P&G的產品配方設計,涉及5座混料槽和100多項產品,可能的組合數高達10的114次方,遠超過宇宙中的原子數。要在這麼龐大的可能組合中,找出能避免交叉污染的配方,是一件耗時耗力的工作。
他們結合量子退火技術和SAS傳統最佳化求解器,採取混合運算方法,以量子退火運算處理初始解空間的收斂計算,再以傳統SAS解法進行微調,整體計算時間只需12分鐘,還能兼顧準確度,比傳統做法減少了97%的時間。
除了與企業展開試點專案,SAS也嘗試在旗下平臺發展量子退火技術的AI元件,例如在自助式運算平臺Viya Workbench,實驗性整合量子退火技術,來進行資料前處理、探索數據分析和AI模型開發,計畫未來成為正式功能之一。
新添一系列開箱即用模型
除了AI新戰略,SAS傳統AI產品線也有更新,推出一系列開箱即用的輕量級AI模型,涵蓋政府、醫療、製造、供應鏈與詐欺防範等產業,來降低企業導入AI的技術門檻。目前已上架的AI模型有各產業通用的實體識別(Entity Resolution)、文件分析模型,以及醫療業適用的用藥依從性風險預測模型,製造業專用的供應鏈最佳化模型,政府部門可用的糧食補助金詐領偵測模型、銷售稅合規性分析模型。
SAS還預告,今年將陸續推出更多產業專用模型,例如金融業的支付與信用卡詐欺判斷模型、醫療業的醫療支付審核模型、製造業的工安監測模型,以及公部門的個人所得稅合規性分析模型。
三款工具更新
另一方面,SAS也在今年大會中宣布三款平臺工具的更新,包括雲端整合式AI開發平臺Workbench、合成資料平臺DataMaker和AI建模助手SAS Viya Copilot。就Workbench來說,它支援Python、R和SAS等程式語言切換,使用者能在平臺上建置情感分析模型,並一鍵部署REST API。這款平臺也支援BERT等模型和GPU加速,目前已在AWS正式上架,在微軟Azure則是私人預覽版。
就DataMaker來說,它支援多表格、多關聯性和時間序列資料的生成,並內建差分隱私技術,在合成資料中添加雜訊,來確保資料來源不會被逆向推導辨識。這類合成資料適合用於臨床試驗、金融交易模擬等場景。目前,DataMaker已在微軟Azure平臺以私人預覽版提供。
至於SAS Viya Copilot則導入類ChatGPT的對話互動介面,來讓使用者用自然語言問答,來更簡單地使用Model Studio工具。比如,使用者可以用自然語言,要求模型優化、分析ROC報表、產生說明文件等,也能根據現有模型節點提出自動化調參建議,就算沒有資料科學知識也能執行資料科學任務。目前,SAS Viya Copilot在SAS託管雲服務提供私人預覽版,預計今年第三季正式推出。