魔搭ModelScope社区 15小时前
魔搭社区模型速递(6.8-6.14)
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

魔搭ModelScope社区近期发布了一系列重要更新,包括1173个模型、143个数据集和76个创新应用。其中,模型涵盖Magistral-Small-2506、dots.llm1、MonkeyOCR等,数据集包括saisdata、OpenThoughts3-1.2M、MMVU等,应用则有BMMR-Leaderboard-detailed、RedNoob、openaudio-s1-mini等。此外,社区还发布了10篇技术文章,涵盖文生图模型评测、物理推理评估基准、MCP广场、异常识别等多个领域。

🚀 魔搭ModelScope社区本期上新了1173个模型,例如Magistral-Small-2506,一个高效的小型推理模型,参数量240亿,可在单张RTX 4090显卡或32GB内存的MacBook上本地部署,支持多种语言。

📁 社区新增了143个数据集,如saisdata,一个面向特定领域应用的高质量文本数据集,适用于自然语言处理和文本分类任务;OpenThoughts3-1.2M,一个大型中文多任务指令数据集,包含超过120万条高质量的指令与响应对。

🎨 76个创新应用也同步上新,包括BMMR-Leaderboard-detailed,用于呈现多模态检索任务中各类模型的性能排名与详细评测结果;RedNoob,输入笔记标题和内容,模型将预测其受欢迎程度分数。

📄 社区还发布了10篇内容,涵盖了文生图模型智能评测、物理推理评估基准、MCP广场、异常识别等多个领域,为AI技术的探索和应用提供了丰富的参考。

2025-06-15 14:32 浙江

模型上新1173、数据集上新143、应用上新76、文章发布10篇

🙋魔搭ModelScope本期社区进展:

📟1173个模型:Magistral-Small-2506、dots.llm1、MonkeyOCR等;

📁143个数据集:saisdata、OpenThoughts3-1.2MMMVU等;

🎨76个创新应用BMMR-Leaderboard-detailed、RedNoob、openaudio-s1-mini等;

📄 10 篇内容:

    告别‘人海战术’!基于EvalScope 的文生图模型智能评测新方案

    UGPhysics:本科物理推理评估基准发布,助力AI+Physics交叉研究

    支持自主创建MCP啦!一文带你玩转魔搭MCP广场,从idea到部署自己的MCP到魔搭

    One-to-Normal Anomaly Personalization:少样本异常识别新突破,扩散模型助力精准检测

    从种草生活到种草AI,小红书发布首个开源大模型dots.llm1

    趣丸千音MCP首发上线魔搭社区,多重技术引擎,解锁AI语音无限可能

    想一年不如实实在在干两天 | 52小时创业森林开启报名

    AgentScope 与 MCP:实践、思考与展望

    “一丹一世界”三等奖 | 蓝色幻想 经验分享-AIGC商业海报落地

十万奖金等你来战!第二届“隐语杯”数据挑战赛报名正式启动!

01

模型推荐

Magistral-Small-2506

Magistral-Small-2506是基于Mistral Small 3.1(2503版本)的升级模型,通过融合Magistral Medium轨迹的监督微调(SFT)与强化学习(RL)训练,显著增强推理能力。这款高效的小型推理模型参数量达240亿,量化后可在单张RTX 4090显卡或32GB内存的MacBook本地部署。

Magistral-Small-2506具备长推理链能力,支持英语、法语、中文等数十种语言,采用Apache 2.0开源许可(允许商业及非商业使用)。其128k上下文窗口实际建议设为40k,超过此范围性能可能下降。

模型链接:

https://modelscope.cn/models/mistralai/Magistral-Small-2506

示例代码:

推荐使用vLLM,按如下方式启动模型:

    VLLM_USE_MODELSCOPE=true vllm serve mistralai/Magistral-Small-2506 --tokenizer_mode mistral --config_format mistral --load_format mistral --tool-call-parser mistral --enable-auto-tool-choice --tensor-parallel-size 2

    dots.llm1

    dots.llm1 模型是小红书Hi lab团队(Humane Intelligence Lab)推出的一个大规模的 MoE 模型,从总共 142B 参数中激活了 14B 参数,性能与当前最先进的开源模型相当。 通过rednote-hilab研究团队精心设计和高效的数据处理流水线,dots.llm1 在没有合成数据的情况下,在高质量语料库上预训练后,达到了与 Qwen2.5-72B 相当的性能。为了进一步促进研究,研究团队开源了整个训练过程中的中间训练Checkpoint,并提供了对大型语言模型学习动态的宝贵见解。

    模型链接:

    https://modelscope.cn/organization/rednote-hilab

    示例代码:

    推荐使用Docker 进行模型推理,Docker 镜像可在 Docker Hub(https://hub.docker.com/repository/docker/rednotehilab/dots1/tags 上找到。

    可以通过 vllm 启动一个服务器

      docker run --gpus all \

          -~/.cache/huggingface:/root/.cache/huggingface \

          -8000:8000 \

          --ipc=host \

          rednotehilab/dots1:vllm-openai-v0.9.0.1 \

          --model rednote-hilab/dots.llm1.inst \

          --tensor-parallel-size 8 \

          --trust-remote-code \

          --served-model-name dots1

      然后可以通过以下方式验证模型是否成功运行

        curl http://localhost:8000/v1/chat/completions \

            -H "Content-Type: application/json" \

            -d '{

                "model""dots1",

                "messages": [

                    {"role""system""content""You are a helpful assistant."},

                    {"role""user""content""Who won the world series in 2020?"}

                ],

                "max_tokens"32,

                "temperature"0

            }'

        更多推理实战教程详见:

        从种草生活到种草AI,小红书发布首个开源大模型dots.llm1

        MonkeyOCR

        MonkeyOCR是由华中科技大学联合金山办公推出的一款文档解析模型,具备高精度和强泛化能力。该模型支持多语言、多场景的文字检测与识别,适用于文档数字化、内容审核、信息提取等多种应用场合。与传统方法相比,MonkeyOCR在处理复杂文档时,平均性能提升5.1%,在公式和表格解析上分别提升15%、8.6%。

        模型链接:

        https://modelscope.cn/models/AI-ModelScope/MonkeyOCR

        示例代码:

        安装 MonkeyOCR

        conda create -n MonkeyOCR python=3.10

        conda activate MonkeyOCR

        git clone https://github.com/Yuliang-Liu/MonkeyOCR.git

        cd MonkeyOCR

        # Install pytorch, see https://pytorch.org/get-started/previous-versions/ for your cuda version

        pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu124 

        pip install -e .

        下载模型权重

        pip install modelscope

        python tools/download_model.py -t modelscope

        推理

        # Make sure in MonkeyOCR directory

        python parse.py path/to/your.pdf

        # or with image as input

        pyhton parse.py path/to/your/image

        # Specify output path and model configs path

        python parse.py path/to/your.pdf -o ./output -c config.yaml

        02

        数据集推荐

        Saisdata

        saisdata是一款面向特定领域应用的高质量文本数据集,适用于自然语言处理、文本分类等相关任务的研究与开发。该数据集包含丰富的文本内容及相应标注信息,能够有效支持模型训练、评估与优化等环节。作为开放共享的数据资源,saisdata致力于为算法研发和实际应用提供坚实的数据支撑。

        数据集链接:

        https://modelscope.cn/datasets/wpixiu/saisdata

        OpenThoughts3-1.2M

        OpenThoughts3-1.2M是大型中文多任务指令数据集,包含超过120万条高质量的指令与响应对,覆盖多种自然语言处理任务。该数据集旨在推动大模型在中文场景下的多任务学习与泛化能力研究,适用于模型训练、评估及微调等应用场景。

        数据集链接:

        https://modelscope.cn/datasets/open-thoughts/OpenThoughts3-1.2M

        MMVU

        MMVU是多模态视频理解评估数据集,专注于测试和提升模型在视频内容理解、跨模态推理等方面的能力。该数据集包含丰富的真实场景视频样本及多维度标注信息,覆盖多种复杂语义理解和推理任务。

        数据集链接:

        https://modelscope.cn/datasets/AI-ModelScope/MMVU

        03

        创空间

        BMMR-Leaderboard-detailed

        用于呈现多模态检索(如图文检索、视频检索等)任务中各类模型的性能排名与详细评测结果。基于BMMR(Benchmark for Multimodal Retrieval)评测体系,提供了全面、客观的模型对比数据。

        体验链接:

        https://modelscope.cn/studios/guanyuli615/BMMR-Leaderboard-detailed

        RedNoob

        输入笔记的标题和内容,模型将预测其受欢迎程度分数 (WLAES)。

        体验链接:

        https://modelscope.cn/studios/Hamiglet/RedNoob

        openaudio-s1-mini

        OpenAudio-S1-Mini是一款轻量级音频理解模型,支持多种音频任务如语音识别、语种检测和关键词提取,适用于资源受限场景下的高效部署。

        体验链接:

        https://modelscope.cn/studios/studio-test/openaudio-s1-mini

        04

        社区精选文章


        👇点击关注ModelScope公众号获取

        更多技术信息~

        阅读原文

        跳转微信打开

        Fish AI Reader

        Fish AI Reader

        AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

        FishAI

        FishAI

        鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

        联系邮箱 441953276@qq.com

        相关标签

        魔搭ModelScope 模型更新 数据集 AI应用
        相关文章