PaperWeekly 07月30日 11:06
杭州/北京内推 | 阿里夸克基础大模型团队招收强化学习方向算法工程师/实习生
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

阿里巴巴夸克大模型团队正面向杭州和北京招聘强化学习算法工程师/实习生。该团队专注于全栈自研千亿级参数大模型,聚焦搜索、医疗、教育等场景的智能化创新,旨在打造低幻觉率、高知识正确性的AI能力。此次招聘的岗位职责包括研发新一代大模型强化学习算法,提升模型在多模态、工具调用、复杂环境交互等方面的基础能力;优化大规模分布式强化学习框架,提升万卡集群下的训练效率;并将强化学习研究成果融入夸克产品生态,打造更懂用户的智能服务。要求硕士及以上学历,具备强化学习、大模型深度学习框架(如Transformers、PyTorch、Megatron-LM)的丰富知识和实践经验,以及扎实的编程能力和良好的沟通协作能力。拥有RLHF、RL reasoning、Agentic RL等方向项目经验或在顶级学术会议发表过论文者将优先考虑。

🔹 **岗位职责核心**:该职位聚焦于研发和优化新一代大模型强化学习算法,以提升模型在多模态、工具调用、复杂环境交互和多智能体交互等方向的基础能力。同时,还需要改进大规模分布式强化学习框架,优化万卡集群下的训练效率,并最终将研究成果应用于夸克产品生态,打造更智能的服务。

🔸 **任职要求详尽**:申请者需具备硕士及以上学历,专业背景为数学、强化学习、自然语言处理等。核心要求是对强化学习有扎实的专业知识,熟悉深度强化学习算法在大语言模型中的应用及前沿知识。此外,熟悉大模型相关的深度学习框架(如Transformers、PyTorch、Megatron-LM)并具备扎实的编程基础和代码实现能力也是必备条件。良好的沟通、协作和解决问题的能力同样重要。

🌟 **加分项突出**:对于有大语言模型RLHF、RL reasoning、Agentic RL等方向实际项目经验的候选人,以及在强化学习、大模型训练、多智能体等研究方向上曾在顶级学术会议发表过论文的申请者,将获得优先考虑。此外,具备大规模分布式强化学习训练经验或RL框架优化经验者也会被视为优势。

📧 **投递方式明确**:有意向的求职者需将简历发送至 weixuyuan.wxy@alibaba-inc.com,并在邮件标题中注明“姓名-岗位名称-AI求职”,以便快速准确地处理。

🚀 **社群价值凸显**:文章还介绍了「AI 求职」社群,旨在为求职者提供招聘需求曝光、最新面试经验、校招准备攻略、硕博招生信息以及独家内推渠道等服务,鼓励大家加入社群以获得更多求职支持。

帮你找工作的 2025-07-28 13:32 北京

合适的工作难找?最新的招聘信息也不知道?

AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!

阿里巴巴

阿里巴巴夸克大模型团队致力于全栈自研千亿级参数大模型,聚焦搜索、医疗、教育等场景的智能化创新。团队依托海量业务沉淀数据库与搜索技术优势,打造低幻觉率、高知识正确性的AI能力。作为阿里战略级创新业务核心力量,持续推动AI技术突破与场景落地。



强化学习算法工程师/实习生

坐标:杭州/北京

岗位职责

1. 研发新一代大模型强化学习算法,提升大模型在多模态、工具调用、复杂环境交互、多智能体交互等方向的基础能力;

2. 改进大规模分布式强化学习框架,优化万卡集群下的高效分布式训练效率,支持大模型与复杂环境/工具的高效交互; 

3. 将强化学习研究成果融入夸克产品生态,打造更懂用户的智能服务产品, 让前沿技术惠及亿万用户。

岗位要求

1. 硕士及以上学历,数学、强化学习、自然语言处理等相关专业;

2. 在强化学习方面具有丰富的专业知识,熟练掌握深度强化学习算法在大语言模型中的应用及前沿知识;

3. 熟悉大模型相关深度学习框架,如Transformers、PyTorch、Megatron-LM等,有扎实的编程基础和代码实现能力;

4. 具备良好的沟通、协作和解决问题的能力,能够与团队成员密切合作,共同解决问题。


加分项

1. 有大语言模型RLHF、RL reasoning、Agentic RL等方向有实际项目参与经验; 

2. 在强化学习、大模型训练、多智能体等研究方向在顶级学术会议上发表过论文; 

3. 有大规模分布式强化学习训练经验或RL框架优化经验。


 投递方式 

📪 weixuyuan.wxy@alibaba-inc.com

邮件标题注明:姓名-岗位名称-AI求职



加入社群  🌟

为了更好地了解和满足大家的需求,我们建立了「求职者社群」

加入 AI 求职社群,你可以享有招聘需求曝光获取最新面试经验校招准备攻略硕博招生独家内推渠道等服务。

扫描下方小助手的微信,pick 你心仪的岗位~



如何发布招聘

AI 求职是「PaperWeekly」旗下聚焦人工智能领域的招聘平台,涵盖高校硕博招生、博士后招募、企业校招、社招、实习和内推等。

目前已有百度、阿里、腾讯、字节跳动等企业发布内推岗位,欢迎大家订阅关注、发布岗如果你也想对公司和在招职位进行更多曝光,请联系我们的栏目负责人(微信:pwbot02)。

·

·

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI求职 强化学习 大模型 阿里巴巴 算法工程师
相关文章