帮你找工作的 2025-07-28 13:32 北京
🔹 **岗位职责核心**:该职位聚焦于研发和优化新一代大模型强化学习算法,以提升模型在多模态、工具调用、复杂环境交互和多智能体交互等方向的基础能力。同时,还需要改进大规模分布式强化学习框架,优化万卡集群下的训练效率,并最终将研究成果应用于夸克产品生态,打造更智能的服务。
🔸 **任职要求详尽**:申请者需具备硕士及以上学历,专业背景为数学、强化学习、自然语言处理等。核心要求是对强化学习有扎实的专业知识,熟悉深度强化学习算法在大语言模型中的应用及前沿知识。此外,熟悉大模型相关的深度学习框架(如Transformers、PyTorch、Megatron-LM)并具备扎实的编程基础和代码实现能力也是必备条件。良好的沟通、协作和解决问题的能力同样重要。
🌟 **加分项突出**:对于有大语言模型RLHF、RL reasoning、Agentic RL等方向实际项目经验的候选人,以及在强化学习、大模型训练、多智能体等研究方向上曾在顶级学术会议发表过论文的申请者,将获得优先考虑。此外,具备大规模分布式强化学习训练经验或RL框架优化经验者也会被视为优势。
📧 **投递方式明确**:有意向的求职者需将简历发送至 weixuyuan.wxy@alibaba-inc.com,并在邮件标题中注明“姓名-岗位名称-AI求职”,以便快速准确地处理。
🚀 **社群价值凸显**:文章还介绍了「AI 求职」社群,旨在为求职者提供招聘需求曝光、最新面试经验、校招准备攻略、硕博招生信息以及独家内推渠道等服务,鼓励大家加入社群以获得更多求职支持。
帮你找工作的 2025-07-28 13:32 北京
阿里巴巴夸克大模型团队致力于全栈自研千亿级参数大模型,聚焦搜索、医疗、教育等场景的智能化创新。团队依托海量业务沉淀数据库与搜索技术优势,打造低幻觉率、高知识正确性的AI能力。作为阿里战略级创新业务核心力量,持续推动AI技术突破与场景落地。
岗位职责
1. 研发新一代大模型强化学习算法,提升大模型在多模态、工具调用、复杂环境交互、多智能体交互等方向的基础能力;2. 改进大规模分布式强化学习框架,优化万卡集群下的高效分布式训练效率,支持大模型与复杂环境/工具的高效交互; 3. 将强化学习研究成果融入夸克产品生态,打造更懂用户的智能服务产品, 让前沿技术惠及亿万用户。岗位要求
1. 硕士及以上学历,数学、强化学习、自然语言处理等相关专业;2. 在强化学习方面具有丰富的专业知识,熟练掌握深度强化学习算法在大语言模型中的应用及前沿知识;3. 熟悉大模型相关深度学习框架,如Transformers、PyTorch、Megatron-LM等,有扎实的编程基础和代码实现能力;4. 具备良好的沟通、协作和解决问题的能力,能够与团队成员密切合作,共同解决问题。加分项
扫描下方小助手的微信,pick 你心仪的岗位~
AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。
鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑