AI & Big Data 2024年12月05日
【re:Invent 2024現場直擊】從模型訓練算力配置自動化、提示快取管理到RAG結構化資料支援,AWS揭一系列AI重大更新
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

AWS在今年的re:Invent技术年会上宣布了多项AI服务更新,重点关注生成式AI带来的算力和数据检索需求。SageMaker推出Hyperpod灵活训练计划和任务治理功能,优化模型训练效率和资源利用率,并支持第三方AI应用。Bedrock推出模型市集和提示管理功能,降低成本和开发难度。此外,AWS还推出了Kendra GAI Index和Bedrock结构化数据检索功能,以及数据自动化和GraphRAG支持,旨在解决RAG应用中的数据来源和处理难题,提升生成式AI应用的效率和体验。

🤔 **SageMaker Hyperpod新增灵活训练计划和任务治理功能:** AWS针对生成式AI的算力需求,推出Hyperpod灵活训练计划,自动设置模型训练基础设施,并优化训练时间和成本。同时,Hyperpod任务治理功能帮助用户最大化利用加速器资源,降低模型训练、微调和推理成本,并实时监控模型任务执行情况。

🚀 **Bedrock推出模型市集和提示管理功能:** AWS推出Bedrock Marketplace,提供100多个模型供用户测试和使用。同时,Bedrock提示快取功能可以缓存重复提示,减少Token成本和延迟;Bedrock智能提示分配功能则根据提示内容自动选择最合适的模型,降低开发成本。

🔍 **推出Kendra GAI Index和Bedrock结构化数据检索功能:** AWS推出Kendra GAI Index,帮助企业连接40多个数据源并建立索引,构建更有效的数字助理和智能搜索体验。同时,Bedrock Knowledge Bases新增结构化数据检索功能,以及数据自动化和GraphRAG支持,解决RAG应用中数据来源和处理难题。

🔄 **SageMaker支持第三方AI应用:** AWS更新SageMaker,使其能够运行AWS合作伙伴的AI应用,方便用户管理和使用第三方模型。

在今年度re:Invent技術年會中,AWS資料與人工智慧資深副總裁Swami Sivasubramanian揭露AI服務重大更新,不論是機器學習平臺SageMaker還是生成式AI平臺Bedrock,都聚焦生成式AI(即GAI)帶來的更大算力和資料檢索需求,推出相應新功能。SageMaker瞄準生程式AI更大的算力需求,新添算力支援和任務管理比如,他們在專為GAI推出的快速擴展服務Amazon SageMaker Hyperpod中,正式新添了能自動化彈性支援模型訓練的計畫功能(Amazon SageMaker Hyperpod Flexible Training Plans),能自動設置模型訓練所需的基礎設施和運算叢集,而且還符合使用者預期的訓練時間和成本。Sivasubramanian說,這個新功能可提高訓練效率,省下好幾周的模型訓練時間。再來,「有效管理訓練資源,也是很複雜的任務,」Sivasubramanian表示,對Amazon自己來說也是如此。於是他們開發一套功能,提高超過90%的加速運算運用率。「當我們與不同產業的資訊長、執行長們分享這個成功經驗,他們都表示這是他們需要的。」於是,AWS今日正式推出Amazon SageMaker Hyperpod Task Governance任務治理功能,使用者能定義自己的優先任務,來最大化運用加速器運算資源,降低模型訓練、微調和推論的成本。甚至,使用者還能即時監控模型任務的執行洞察,來減少等待時間。另一方面,為顧及使用者希望操作第三方AI應用程式、管理模型的需求,Sivasubramanian也揭露另一款更新,只要是AWS合作夥伴的AI Apps,都能在SageMaker中使用了。Bedrcok也有模型市集了,還有提示管理新功能不只如此,AWS還針對Amazon Bedrcok平臺,也就是優化GAI應用程式建置和擴展的服務,正式推出Amazon Bedrock Marketplacae市集,提供100多個模型,來讓使用者測試、使用。再來,為了更有效管理提示所衍生的成本,AWS分別推出2項預覽版功能,首先是Bedrcok提示快取(Prompt caching)支援功能,可以針對跨API呼叫的重複性提示進行快取,來避免不斷重複的提示產生的Token成本。「這是降低延遲和節省成本的關鍵,你可以降低85%延遲、節省90%成本。」另一項功能是智慧提示分配(Bedrock Intelligent Prompt Routing),也就是能根據提示內容,自動分配給最適合的模型來處理、回答問題。Sivasubramanian說,有了這個功能,開發者不必再花大把時間測試哪個模型最適合回答哪些問題,可節省3成開發成本。針對RAG痛點,推出更好的資料來源配對功能和Bedrock結構化資料檢索功能RAG是透過搜尋外接資料庫知識,來避免大型語言模型(LLM)幻覺的重要手段。AWS先前就推出Bedrock Knowledge Bases知識庫來簡化RAG工作流程的管理,同時,為了讓使用者更容易在企業或組織中找到正確資料,AWS之前也推出Amazon Kendra服務,能透過機器學習支援來快速找到最相關的資料。這次,AWS推出了Kendra GAI Index預覽版,使用者能連結40多個資料來源、對其索引,來讓企業更有效率打造數位助理和智慧搜尋體驗。這個功能,還能與Bedrock Knowlege Bases和其他工具整合,來開發RAG支援的AI助理,或是與Amazon Q Business整合使用,打造全託管的數位助理。接著,AWS也針對RAG所需的資料類型,正式推出了Bedrock Knowledge Bases結構化資料檢索功能,Sivasubramanian還揭露其他資料處理新功能,像是Amazon Bedrock Data Automation預覽版,能自動從非結構化的多模態資料中抽取內容,來轉換、生成結構化資料;以及Bedrock Knowledge Bases支援GraphRAG的預覽版功能,使用者可以打造使用知識圖譜的GAI應用程式了。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AWS 生成式AI SageMaker Bedrock RAG
相关文章