魔搭ModelScope社区 19小时前
魔搭社区模型速递(4.13-4.19)
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

ModelScope魔搭社区发布四月月报,展示了其在模型、数据集和应用方面的最新进展。本月新增1862个模型,75个数据集以及88个创新应用,涵盖了GLM-4系列模型、通义万相视频生成模型、Skywork-OR1系列模型等。同时,社区也开源了多个数据集,如HumanRig、万卷丝路2.0等。此外,还上线了多个创新应用,包括GLM-Z1-9B-0414等。本月报还重点介绍了社区精选文章,分享了技术细节和实践经验。

🚀 模型更新:社区新增1862个模型,包括GLM-4-0414系列、通义万相Wan2.1首尾帧视频生成模型和Skywork-OR1系列等,涵盖多种应用场景。

💾 数据集发布:发布75个数据集,如HumanRig、万卷丝路2.0-数据集、光网络告警数据集等,为模型训练和研究提供支持。

💡 创新应用:上线88个创新应用,如GLM-Z1-9B-0414、各视频平台直链解析工具、EMelodyGen情感可控旋律生成器等,展示技术落地成果。

📚 社区精选文章:推荐HumanRig、通义万相2.1首尾帧模型开源等文章,分享技术细节和实践经验,促进社区交流。

2025-04-20 18:25 浙江

模型上架1862、数据集上架75、应用空间88个、文章发布7篇


🙋魔搭ModelScope本期社区进展:

📟1862个模型:GLM-4-0414系通义万相Wan2.1首尾帧视频生成模型、Skywork-OR1系列等;

📁75个数据集:HumanRig、万卷丝路2.0-数据集、光网络告警数据集、Ring-lite-distill-preview-dpo-data等;

🎨88个创新应用GLM-Z1-9B-0414、各视频平台直链解析工具、EMelodyGen 情感可控旋律生成器等;

📄 7篇内容:

      HumanRig:高德地图提出在大规模数据集中学习人形角色的自动绑定技术,数据集开源!

      通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!

      ModelScope魔搭25年4月发布月报

      小语种多模态数据集万卷·丝路2.0开源!附ms-swift韩语继续预训练与指令微调教程

      魔搭上线最大MCP中文社区,支付宝、MiniMax等MCP独家首发

      全新GLM模型登场:9B/32B系列模型全面开源,性能媲美顶尖选手,MIT协议商用无忧!

      MCP的蝴蝶效应:生产力还没实质提升的当下,与生产关系改变带来的大模型应用无限未来


    01


    模型推荐



    GLM-4-0414系列

    智谱开源 32B/9B 系列 GLM 模型,涵盖基座、推理、沉思模型,均遵循 MIT 许可协议。其中,基座模型 GLM-4-32B-0414通过15T高质量数据预训练及强化推理类合成数据积累,结合拒绝采样与强化学习技术,在指令遵循、工程代码生成、函数调用等原子能力上实现专项强化,在工程代码、Artifacts生成、搜索问答等任务中表现优异;推理模型 GLM-Z1-32B-0414 性能媲美 DeepSeek-R1 等顶尖模型,实测推理速度可达 200 Tokens/秒。本次开源的所有模型均采用宽松的 MIT 许可协议。

    模型合集地址

    https://modelscope.cn/collections/GLM-4-0414-e4ecc89c179d4c


    包括:


    示例代码

    源码安装
      pip install git+https://github.com/huggingface/transformers.git

      模型推理

        from modelscope import AutoModelForCausalLM, AutoTokenizerMODEL_PATH = "ZhipuAI/GLM-4-Z1-Rumination-32B-0414"tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)model = AutoModelForCausalLM.from_pretrained(MODEL_PATH, device_map="auto")message = [{"role""user""content""Let a, b be positive real numbers such that ab = a + b + 3. Determine the range of possible values for a + b."}]inputs = tokenizer.apply_chat_template(    message,    return_tensors="pt",    add_generation_prompt=True,    return_dict=True,).to(model.device)generate_kwargs = {    "input_ids": inputs["input_ids"],    "attention_mask": inputs["attention_mask"],    "max_new_tokens": 128,    "do_sample": False,}out = model.generate(**generate_kwargs)print(tokenizer.decode(out[0][inputs["input_ids"].shape[1]:], skip_special_tokens=True))

        更多微调实战教程详见

        全新GLM模型登场:9B/32B系列模型全面开源,性能媲美顶尖选手,MIT协议商用无忧!


        通义万相首尾帧视频生成模型
        通义万相的Wan2.1最新开源了首尾帧视频生成模型(Wan2.1-FLF2V-14B),核心亮点在于通过用户指定的首尾两帧图像,自动生成5秒720p高清过渡视频,支持延时摄影、变身特效等高度定制化需求。该模型基于DiT架构,结合视频压缩VAE和交叉注意力机制,确保时空一致性,实现动作流畅且细节逼真,如衣物褶皱、光影变化等物理规律的精准复现。通过新增条件控制分支和CLIP语义特征提取,模型可灵活响应文本提示词指令,支持写实、卡通、漫画等多风格生成,并优化镜头运镜与情感表达。


        模型地址

        https://modelscope.cn/models/Wan-AI/Wan2.1-FLF2V-14B-720P


        示例代码
        推理实战教程详见
        通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!



        Skywork-OR1系列
        昆仑万维天工团队近期开源了 Skywork-OR1 系列模型,是基于大规模规则强化学习训练的数学与代码推理模型集合。该系列采用专门设计的数据集及训练方法,具备强大的逻辑推演能力。此次开源包括模型权重、训练数据、训练代码,模型包括两个通用推理模型 Skywork-OR1-7B-Preview、Skywork-OR1-32B-Preview,以及一个专门针对数学的模型 Skywork-OR1-Math-7B。


        模型地址

        Skywork-OR1-7B-Preview
        https://www.modelscope.cn/models/Skywork/Skywork-OR1-7B-Preview

        Skywork-OR1-32B-Preview
        https://modelscope.cn/models/Skywork/Skywork-OR1-32B-Preview

        Skywork-OR1-Math-7B
        https://www.modelscope.cn/models/Skywork/Skywork-OR1-Math-7B


        评估效果


        02


        数据集推荐



        HumanRig数据集
        由高德地图开源的业界首个专门针对3D人形角色绑定设计的大规模数据集,发表于CVPR2025论文《HumanRig:基于大规模数据集学习人形角色的自动绑定技术》,这是一个包含大规模AI生成的T姿势人形模型数据集,所有模型均采用统一骨骼拓扑结构进行绑定包含11,434个遵循统一骨骼拓扑结构的T姿态网格。在规模、多样性、复杂度以及实际运动应用价值等多个维度上,均显著超越了以往的数据集。
        数据集链接:
        https://www.modelscope.cn/datasets/jellyczd/HumanRig


        万卷丝路2.0-数据集

        万卷丝路2.0是一个韩语指令微调数据集,专门用于提升模型对韩语指令的理解和执行能力。

        数据集链接:

        https://modelscope.cn/datasets/OpenDataLab/WanJuanSiLu2_sft_ko


        光网络告警数据集

        包含了各种类型的告警记录,用于帮助研究人员和工程师分析网络故障、优化网络性能以及提高网络的可靠性和维护效率。

        数据集链接:

        https://modelscope.cn/datasets/plussea/Optical_Network_Alarm_Dataset


        Ring-lite-distill-preview-dpo-data

        这是用于训练Ring-lite-distill-preview模型的DPO 数据子集,包含约 4K 个高质量英语和中文样本,专注于复杂的推理任务和指令遵循。

        数据集链接:

        https://modelscope.cn/datasets/inclusionAI/Ring-lite-distill-preview-dpo-data


        03


        精选应用



        GLM-Z1-9B-0414

        体验直达:

        https://modelscope.cn/studios/ZhipuAI/GLM-Z1-9B-0414

          小程序:



        各视频平台直链解析工具

        体验直达:

        https://modelscope.cn/studios/Genius-Society/video_parsers

          小程序:



        EMelodyGen 情感可控旋律生成器

        体验直达:

        https://modelscope.cn/studios/monetjoe/EMelodyGen

          小程序:



        04


        社区精选文章





            👇点击关注ModelScope公众号获取
            更多技术信息~





            阅读原文

            跳转微信打开

            Fish AI Reader

            Fish AI Reader

            AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

            FishAI

            FishAI

            鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

            联系邮箱 441953276@qq.com

            相关标签

            ModelScope 模型 数据集 人工智能 开源
            相关文章