今年度Google Cloud Next大會聚焦AI代理新戰略,除了新添低門檻開發工具、互通協定來供企業打造多代理生態,還建置開箱即用的現成代理應用,瞄準客服、創意、資料科學、程式開發、資安等5大領域,另也針對辦公生產力,推出代理加持的工作流程自動化服務。
代理領域1:客服
Google雲端首先亮相的是新一代顧客參與套件(Customer Engagement Suite)。這個套件原本就提供開箱即用的功能,可根據企業數據快速建置代理,這些數據可以是網路資料、行動裝置資料、客服資料,也可以是實體店內資料、第三方電信資料以及內部CRM系統資料。
而這次的新一代套件,將提供更擬人的高解析度語音、情緒理解能力,來讓AI代理更好地與人對話,另還有支援串流影片的功能,來讓代理透過顧客端設備即時解釋或回應所看到的內容。再來,這個套件還提供AI助手,來協助使用者在無程式碼介面打造客製化的AI代理。
同時,Google還針對特定產業打造垂直式代理,來改善客服以外的顧客對話體驗,如食品訂購、汽車和零售等。其中,美國的溫蒂漢堡就用這個套件打造AI得來速訂餐系統,每天處理了6萬份訂單,又或是賓士在其最新的CLA車型中,新添對話式搜尋和導航功能。
代理領域2:創意
另一方面,Google雲端也介紹自家既有的創意代理(Creative Agents),專門用來提高創意團隊的表現,像是媒體行銷、廣告、設計等,甚至用於大規模的創意內容製作。
同時,這些創意代理還正優化對觀眾講故事的能力。Google透露,他們自己在行銷團隊的帶領下,就用創意代理來打造秋季Pixel手機廣告活動。而食品製造商Mondelez,也用這項工具來替旗下品牌Oreo進行內容和創意設計。
Google雲端也聯手Adobe,將自家圖像生成模型Imagen 3、影片生成模型Veo 2等導入Adobe Express等應用程式,來供創作使用。
代理領域3:資料處理
另一大代理亮點是資料代理(Data Agents),Google雲端特別點出,這次在自家資料處理平臺BigQuery中新推的資料代理,能滿足資料團隊每位成員的工作需求。
比如,對資料工程團隊來說,資料代理可協助建立資料管線、進行資料前處理(如轉換格式和增強資料),還能透過異常檢測來維護資料品質,並能自動產生詮釋資料(Metadata)。
對資料科學團隊來說,Google雲端的資料代理還能自動化特徵工程、提供智慧模型選擇、擴展模型訓練規模,以及加速模型迭代。
對於資料分析和業務角色而言,Google雲端也有套對話分析代理程式,可完全使用自然語言,來執行強大可靠的分析。使用者也能將代理程式嵌入到自己的Web或行動應用程式中。
不少企業已經先使用這些代理功能,比如拜耳打造一個代理,結合Google搜尋趨勢和內部數據來預測流感趨勢、改善公共衛生態勢。又或是美國內華達州等公共部門,正在利用代理來加速福利申請。
代理領域4:程式開發
Google雲端代理應用還瞄準程式開發,在原本的程式碼助手Gemini Code Assist中新添了代理,目前為私人預覽版,來輔助程式碼現代化到整個軟體開發生命周期的所有工作。開發者除了能在看版中使用Code Assist代理,還能在Google第三方合作平臺中使用,比如Atlassian、Sentry、Snyk等。
Google自己還透露,他們內部超過25%的新上架程式碼,已經由AI產出並經工程師審查。
代理領域5:安全
Google雲端的代理應用,還更深入到資安領域,在今年大會中宣布多項新應用,比如警報分類代理,能代表使用者執行動態調查、分析每個警報的上下文,收集相關資訊並對警報做出判斷,同時提供代理判斷的依據和決策歷史。
又或是惡意軟體分析代理,能調查程式碼是否安全或有害。這款代理以Code Insight為基礎,來分析潛在的惡意程式碼,還具備建立和執行反混淆腳本的能力。
在這個領域,Google雲端還揭露Google統一安全解決方案,整合了Google自家的視覺工具、威脅偵測、AI驅動的安全作業、持續虛擬紅隊功能,以及企業瀏覽器和Mandiant專業知識,形成一個全域規模的整合式解決方案。
除了5大領域的代理應用,Google雲端還推出一項實用的自動化流程工具Google Workspace Flows,使用者用自然語言描述想完成的流程,內建的AI代理就會自動設計整個邏輯流程,不必寫程式就能完成跨應用的工作自動化。
Google雲端AI代理戰略的底層火力
Google雲端在今年度Next大會中,揭露一張架構圖,來說明他們的AI代理堆疊。這個架構圖包含4層,由下而上依序是底層的AI基礎設施AI Hypercomputer、中層的模型層和工具層Vertex AI,以及最上層的代理應用層。
雖然年會亮點大都聚焦在工具層和代理應用層,但底層和模型層也很重要,是AI代理不可或缺的發動力。就AI超級電腦架構AI Hypercomputer來說,專門提供強大算力資源和調度功能,來讓代理「跑得動」,今年的一系列更新以第七代張量處理器(TPU)Ironwood打頭陣,這款TPU專為「會思考」的模型設計,比如大型語言模型(LLM)、混合專家(MoE)模型、推理模型,這類模型通常需要大量的平行處理和高效能的記憶體存取。
而Ironwood的每個晶片峰值運算能力為4,614 TFLOPs,可因應繁重的AI工作負載,且Ironwood有兩種晶片配置(256個晶片和9,216個晶片),當擴展到9,216個晶片時,其運算能力可達42.5 exaFLOP,是全球最大超級電腦El Capitan的24倍之多,適合用來執行複雜的AI模型。
也因此,Google用Ironwood來優化AI超級電腦架構,提供更強大、高效能的運算資源給用戶。除此之外,AI超級電腦架構也有其他軟硬體更新,像是更好的叢集管理服務Cluster Director、更好的GKE推論能力等,如GKE Inference Gateway、Pathways on GC、vLLM on TPU等,來供使用者訓練和執行模型。
AI基礎設施的更新還有一項網路基礎設施新服務Cloud WAN,來提供高效能的網路連接,供企業因應AI應用帶來的高度分散網路需求。
模型層則有Google雲端用來驅動AI代理的多款模型,它們能處理多種資料類型(即多模態),成為AI代理背後的能力來源。除了自家Gemini系列模型,Google還對既有模型進行優化,像是替文字轉影片模型Veo 2增添新功能,如鏡頭控制、影片編輯工具,使用者能更細緻地調整影片內容、快速重製和優化。
又或是替文字轉語音模型Chirp 3新添客製化功能,使用者只需提供10秒音訊,就能生成專屬聲音模型。此外,Chirp 3 還支援AI配音疊加至既有錄音,還有辨識說話者的語音轉錄功能。
同時,Google也優化了圖片生成模型Imagen 3的品質,讓圖像中缺失或不自然的處理更細膩自然,尤其在物件移除和修圖場景中,能更自然呈現。
除了既有模型,Google在今年大會,還揭露新納入的音樂生成模型Lyria,只要輸入文字提示,就能轉換為30秒的音樂片段。以上就是Google雲端提供AI代理的重要基底。