今年五月,科技巨頭微軟和Google都在同一周舉辦了年度產品大會,不約而同地瞄準了代理AI浪潮,發表了多項生成式AI產品和技術,我們也一連用兩期封面故事,各自來介紹這兩大公雲、同時也是AI技術領導廠商的最新產品布局。
上周,我們先介紹了Google IO大會,尤其聚焦生成式AI如何全面加速開發的角度。軟體開發是生成式AI已知最成熟的應用領域,也是企業需求明確的第一個場景,成了傳統開發工具廠商的新競爭焦點。Google當然也不例外,Google揭露了一系列用GenAI模型加速企業開發的工具,這些工具來自Google內部實作經驗,再進一步發展成對外的產品和服務,尤其瞄準了4大場景,像是快速生成互動式UI的工具、原有AI開發工具開始支援快速生成Web App,也推出了程式開發代理Jules公測版,要讓大規模開發工作更加自動化,最後則是要將AI代理融入開發環境,來強化AI代理App的開發工具鏈。
Google原有的開發技術也瞄準代理AI而有不少強化,像是Android機器學習開發套件ML Kits,增加了更多GenAI API,讓Android應用程式,更容易能在裝置本地端執行Gemini Nano模型。而行動開發工具Android Studio也增加新的開發AI代理能力,輔助寫測試和執行測試的Journeys代理,以及可協助更新套件相依性和SDK的版本升級AI代理,這都是原本開發日常中繁瑣但非做不可的例行工作,現在可以有AI 代理來幫忙。
當然不只Google開始改造、升級原有的軟體技術和工具來瞄準新一波的AI代理需求,微軟在今年開發者大會Build上,更提出了新的AI代理發展願景「Open Agentic Web」,作為旗下技術和產品的新發展方向,這正是本周的封面故事主題。
微軟想像的未來網際網路,將充滿了各式各樣不同能力的AI代理,來執行企業與個人交代的工作。這些AI代理可以處理複雜的任務、存取不同類型的資料來源,甚至與其他AI代理協同合作。
微軟想要善用開源的框架與開源工具來促成這個願景,除了擴大支援熱門的模型通訊協定MCP和跨代理協作框架A2A之外,微軟還發表了兩個新的開源專案TypeAgent和NLWeb。前者的目標是要強化AI代理記憶能力做法,後者則是為了簡化AI代理存取網站內容的門檻。
還在發展初期的TypeAgent專案,提出了一個新的結構式RAG(Structured RAG)做法,來強化AI代理的記憶能力和回想完整度,並且進一步降低生成式AI產生幻覺的機率。
NLWeb專案瞄準了全球2億個網站的內容,結合既有網頁標準如RSS,加上搜尋技術和LLM技術,提供了一套可以支援網站資料索引、自然語言查詢處理、LLM呼叫、向量資料庫呼叫,及站內搜尋處理等作業的技術框架,可以讓網站主很快的打造出站內的自然語言搜尋機制,也可以讓AI代理更容易讀取第三方的網站內容。這是一個瞄準真人查詢需求和AI代理檢索網站內容的通用框架。
微軟也將邁向Open Agentic Web的相關技術和策略,開始導入到自家產品、工具和平臺的發展上。
不只這兩大科技巨頭,開始將LLM技術和AI代理戰略,整合到既有軟體產品和工具,SAP(請見:SAP大揭各產品線AI發展藍圖)、SAS、紅帽今年的產品大會,也都有不少原有產品擁抱AI代理或用生成式AI技術來強化的新功能。
隨著眾人看好企業大規模生成式AI、AI代理的落地部署需求,科技大廠紛紛動起來,今年開始加速企業級產品的AI化,也掀起了新的商用軟體AI化競賽。