没实战经验也没关系,让我们看到你的热情和好奇心,比如玩过 unsloth 等等。我们自己的算力中心的 B200 嗷嗷待哺等着训练任务,欢迎来聊
公司背景:公司是一家能源企业,包含风力光伏发电、抽水蓄能和生物质发电等发电形式。在此基础之上,以投资和研发人工智能基础设施为主,也有自己的算力中心。AI 团队主要来自大模型公司以及阿里字节腾讯等互联网企业,所以对于大部分互联网行业的小伙伴,不用担心企业风格不适。工作地点:北京-东城薪资:请面聊前先沟通清楚,以免浪费候选人时间。工作时长:公司除了 AI 部门之外是早九晚五制,但 AI 部门目前为止没有晚于过 19:30 ,对于加班情况请面聊前先沟通清楚,以免浪费候选人时间。简历投递: huangrenxun2000@outlook.com
岗位职责:1 、负责能源和算力领域大模型的微调、优化,提升模型在具体任务上的性能和泛化能力。2 、参与训练的数据构建及质量评估方案设计,确保训练数据的有效性。3 、参与模型评估指标和方案设计,分析模型表现和设计改进方法。4 、研究并应用主流的模型微调技术及强化学习方法(如 PPO 、DPO 等)进行模型创新性改进;5 、熟悉模型 infra 基础知识,与相关团队紧密协作,共同推动模型训练能力提升和推理加速。
任职要求:1 、本科及以上学历,人工智能、计算机科学等相关专业;2 、扎实掌握深度学习理论基础,熟悉大模型的底层原理;3 、熟练掌握至少一种深度学习框架,具备一些模型训练与调优经验;4 、良好的编程能力和工程实现能力,熟练使用 Python ,有良好的代码规范;5 、熟悉常见的大模型微调技术以及强化学习相关算法;6 、熟悉数据预处理流程,包括数据清洗、标注、格式转换、语料构建等;7 、熟悉模型基础架构设计和具备相关优化经验者优先;8 、有开源项目贡献经历或大型模型训练调优实战经验者优先;