2025-03-19 12:42 广东
NVIDIA GTC 2025——NVIDIA 今天宣布推出具有推理功能的开放 Llama Nemotron 模型系列,旨在为开发人员和企业提供可用于业务的基础,以创建可独立工作或作为连接团队解决复杂任务的高级 AI Agents。
NVIDIA Llama Nemotron 推理系列基于 Llama 模型构建,经过后期训练(使用 REINFORCE (RLOO) 和 RPO 算法进行聊天和指令遵循的多个强化学习 RL阶段),可用于推理、人类聊天偏好以及 RAG 和工具调用等任务。该模型支持 128K 个标记的上下文长度。
体验demo:
https://build.nvidia.com/nvidia/llama-3_3-nemotron-super-49b-v1
NVIDIA AI Enterprise 通过其最新推出的 Agentic AI 构建模块,包括 NVIDIA AI-Q 蓝图、AI 数据平台、NIM 微服务和 NeMo 微服务,为开发人员提供了一套强大的工具和软件,用于简化高级推理模型的部署和优化,从而加速协作 AI 系统的开发和应用。
NVIDIA AI-Q 蓝图使企业能够将知识连接到能够自主感知、推理和行动的 AI Agents。该蓝图采用 NVIDIA NIM 微服务构建,集成了 NVIDIA NeMo Retriever™ 以实现多模式信息检索,并使用NVIDIA AgentIQ 工具包实现Agents和数据连接、优化和透明度。其中NVIDIA AgentIQ已开源。
https://github.com/NVIDIA/AgentIQ
https://nvidianews.nvidia.com/news/nvidia-launches-family-of-open-reasoning-ai-models-for-developers-and-enterprises-to-build-agentic-ai-platforms
推荐阅读
• 动手设计AI Agents:Coze版(编排、记忆、插件、workflow、协作)
• RAG全景图:从RAG启蒙到高级RAG之36技,再到终章Agentic RAG!
• Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1.2万字,20+文献,27张图)
欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。