RWKV元始智能 01月31日
RWKV-7 1.5B 基底模型发布,我们必将能在手机高效跑1T参数模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

RWKV-7-1.5B模型基于RWKV World v3数据集训练,在英文和多语言评测中领先。它性能提升通过常规训练实现,可在多个平台下载,有生成案例,预计二月初发布RWKV-7-World-2.9B。

📌RWKV-7-1.5B模型基于3.1T数据的RWKV World v3数据集训练

💯在英文和多语言评测中评分领先,MMLU测试得分44.84%

📦模型已上传到Hugging Face等平台,可在线体验生成案例

🚀RWKV-7架构改进,拥有强大上下文学习能力

📅预计二月初发布RWKV-7-World-2.9B

原创 Rocky Luo 2025-01-28 20:13 广东

新年快乐!

除夕快乐!在除旧迎新之际,我们也正式发布 RWKV-7-World-1.5B-v3 基底模型!(下文简称为 RWKV-7-1.5B 模型)

RWKV-7-1.5B 模型基于 RWKV World v3 数据集(共 3.1T 数据)训练而来。在英文和多语言评测中,RWKV-7-1.5B 模型的评分对比其他同参数模型处于绝对领先地位。

英文和多语言测评

RWKV-7-1.5B 模型的英文和多语言能力显著超越所有同尺寸模型,包括历史版本 RWKV-6,以及 Qwen2.5、SmolLM 等其他开源模型。

1.5B-model-benchmark

MMLU 测评

选择题形式的 MMLU 测试上,RWKV-7-1.5B 模型得分为 44.84%。作为对比,上一版本的 RWKV-6-1.5B-V2.1 模型 MMLU 评分是 26.34%。

?Tips

RWKV-7-1.5B 基底模型的性能提升完全通过常规训练实现,未针对任何评测进行“优化”,也没有采取退火或 post-training 等优化策略。

模型下载

RWKV-7-World-1.5B 现已上传到 Hugging Face,可以从以下仓库下载:

在线 Demo

可在 Hugging Face Demo 在线体验 RWKV-7-1.5B 模型:

RWKV-7-1.5B 生成案例

以下是 RWKV-7-World-1.5B 的生成案例(使用 Hugging Face Demo 运行):

RWKV-7-World-1.5B-v3-demo1

RWKV-7-World-1.5B-v3-demo2

RWKV-7-World-1.5B-v3-demo3

RWKV-7-World-1.5B-v3-demo4
RWKV-7-World-1.5B-v3-demo5

RWKV-7-1.5B 模型的强大能力,得益于 RWKV-7 架构的精妙改进。在应用了“动态 State 演化机制”后,RWKV-7 拥有强大的 in-context-learning(上下文学习)能力,在推理过程中更好地学习上下文的关系,生成的内容生更精简、更合理。

?Tips

RWKV-7 的架构思路和细节请查看此文章:RWKV-7:极先进的大模型架构,长文本能力极强

RWKV-7-World-2.9B 预计将于二月初发布。请关注我们的公众号“RWKV元始智能”,第一时间获取 RWKV 动态!

最后转载彭博评论:通过 RWKV(无需kv cache)+ Memory/MoE 层 + 存内计算,我们必将能在手机高效跑 1T 参数模型!

加入 RWKV 社区

RWKV 是一种创新的深度学习网络架构,它结合了 Transformer 与 RNN 的优点,同时实现高度并行化训练与高效推理。

欢迎大家加入 RWKV 社区!您可从 RWKV 官网了解 RWKV 模型,也可加入我们的官方论坛、QQ 频道和群聊,一起探讨 RWKV 模型。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

RWKV-7-1.5B RWKV World v3 模型评测 上下文学习 模型发布
相关文章