RWKV元始智能 01月11日
RWKV-7-0.4B 模型正式发布,社区发布多款基于 RWKV-7 的新项目!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

RWKV-7-World-0.4B模型于2025年1月8日发布,该模型在world-v3数据集上训练,显著提升了英文和多语言能力,支持100+种语言和代码。RWKV社区基于此模型开源了多个项目,包括WebGPU Demo和CoT黑白棋项目。在线Demo和模型下载链接已发布。RWKV Othello项目展示了RWKV模型在游戏策略和决策中的潜力,而WebGPU Demo则实现了在浏览器中本地运行RWKV-7模型,支持对话、解谜、作曲和状态可视化等功能。RWKV是一种结合Transformer和RNN优点的创新架构,欢迎加入社区。

🚀RWKV-7-World-0.4B模型发布:该模型在world-2.9数据集上训练,英文和多语言能力显著提升,支持全球100+种语言和代码。

🎮RWKV Othello项目:基于RWKV-7架构开发的黑白棋项目,利用CoT数据训练,展示了RWKV模型在游戏策略和决策任务中的应用潜力,且在与人类对战时实现了非常高的胜率。

🌐RWKV WebGPU Demo:无需下载应用,在浏览器中本地运行RWKV-7模型,实现对话、解15谜题、音乐作曲等功能,并可可视化查看模型状态变化。

🎶RWKV 模型多模态应用:除了对话和游戏,RWKV模型还被应用于音乐创作,提供了多个作曲模型供用户选择和使用。

原创 Rocky Luo 2025-01-10 16:02 广东

RWKV-7-World-0.4B正式发布,社区正积极开发RWKV项目。

RWKV-7-World-0.4B-v2.9 模型于 2025 年 1 月 8 日正式发布!

随着 RWKV-7 架构的发布,RWKV 社区也开源发布了多款基于 RWKV-7 的新项目,包括 RWKV-7-WebGPU Demo 和基于 RWKV-7 架构的 CoT 黑白棋项目 “RWKV Othello”。

RWKV-7-World-0.4B 模型发布

RWKV-7-World-0.4B-v2.9 模型于 2025 年 1 月 8 日正式发布!

RWKV-7-World-0.4B 在 world-2.9(从 world-v3 数据集中采样 2T tokens)数据集上训练。其英文和多语言能力显著超越其他 0.4B 模型,且支持全球 100+ 种语言和代码。

rwkv-7-0.4b 评测结果

在线 Demo

RWKV 官方和社区分别发布了在线 Demo,可在线体验 RWKV-7-World-0.4B 模型:

下载模型

RWKV-7-World-0.4B 现已上传到 Hugging Face 和 ModelScope,可从以下仓库下载:

RWKV-7-World-0.4B 生成案例

以下是 RWKV-7-World-0.4B 的生成案例(使用社区 WebGPU Demo 运行):

chat-en-improve-openai
chat-python-bubble-sort

RWKV Othello

RWKV 社区成员 @Jellyfish042[5] 基于 RWKV-7 架构开发了 RWKV Othello 项目。

项目 GitHub 仓库:https://github.com/Jellyfish042/RWKV_Othello[6]

RWKV Othello 项目利用 Othello(也称为反转棋或黑白棋)的 CoT 数据训练了仅 8.8M 参数的 RWKV-7-Othello 模型。

RWKV-7-Othello 模型可以和人类或其他模型自动对战 Othello 游戏,且在与人类对战时实现了非常高的胜率。

RWKV-Othello

test time scaling

RWKV-7-Othello 模型支持两种推理模式:关闭搜索和开启搜索

关闭搜索时,模型会直接预测最佳走法;开启搜索后, RWKV Othello 模型会根据搜索配置进行 cot,而且思考的 token 数越多,棋力越强(获胜概率增大)。

以下是不同的搜索配置与基线模型(深度=1,宽度=1)进行比较,测试不同搜索树深度和宽度的获胜率(模型:rwkv7_othello_26m_L10_D448_extended ,每个数据点包含 100 局游戏):

不同搜索树深度和宽度的获胜率

RWKV Othello 项目证明 RWKV 模型的恒定资源占用特效在做 CoT 项目时有独特的优势,同时也展示 RWKV 模型在游戏策略和决策任务中的应用潜力。

RWKV WebGPU Demo

无需下载任何应用,在浏览器中运行 RWKV-7-World 模型进行对话、解 15 谜题、音乐作曲,以及可视化查看 state 变化!

基于 web-rwkv[7]RWKV WebGPU Demo[8]  实现了在浏览器中本地运行 RWKV-7 模型!加载模型后,模型将在浏览器中离线运行,不需要任何服务器通信。

对话功能

在 chat 界面选择一个 RWKV-7-World 模型(0.1B 或 0.4B),点击 Load Model 按钮,即可下载并运行模型进行对话。

也可以从本地目录拖动一个 RWKV-7-World 模型到灰框内运行,省略下载的过程。

WebGPU Demo 聊天功能

解 15 谜题

?Tips

15 谜题(也叫数字推盘游戏或 15 数码)是一个经典的滑块益智游戏,玩家需要在一个 4x4 的方格中放置 1-15 数字并留一个空格,然后通过滑动数字将数字按顺序排列。

在 Demo 的 15 puzzle 界面点击 New Game 按钮,可以设置一局全新的 15 谜题。

点击 start 按钮,WebGPU Demo 会运行 RWKV-puzzle15 模型自动解开当前的 15 谜题,左侧则显示模型的 CoT 推理过程。

web-rwkv-15-pizzle-demo

RWKV 作曲功能

在 Demo 的 Music 界面,可以驱动 RWKV ABC 模型进行作曲。操作步骤:

    点击 Load Model 按钮下载作曲模型

    点击 prompt下拉框选择一个 ABC 格式的 prompt

    点击 Generate Music 按钮,开始作曲

web-rwkv-musci-demo

更多作曲模型,请查看:

State 可视化

在 Demo 的 State Replay 界面,可以查看 RWKV 作为 RNN 模型的隐藏状态演变

?Tips

State Replay 功能需要提前在 chat 界面启动一个 RWKV 模型。

下图是对 RWKV-7-World-0.1B 模型输入 “你好” 后,模型的隐藏状态演化。

RWKV-7-World-0.1B 的设计是 L12-D768,所以我们可以在 State Replay 中查看模型 12 层的状态演化,每层按照   维度(一个 head)划分为 12 个可视化小方格。

小方格的颜色解释:

web-rwkv-state-replay-demo

加入 RWKV 社区

RWKV 是一种创新的深度学习网络架构,它结合了 Transformer 与 RNN 的优点,同时实现高度并行化训练与高效推理。

欢迎大家加入 RWKV 社区!您可从 RWKV 官网了解 RWKV 模型,也可加入我们的 QQ 频道和群聊,一起探讨 RWKV 模型。


RWKV-7-World-1.5B 预计在一月底发布, RWKV-7-World-2.9B 预计将于二月初发布。请关注我们的公众号,第一时间获取 RWKV 动态!

相关链接

[1]

Hugging Face 在线 Demo: https://huggingface.co/spaces/BlinkDL/RWKV-Gradio-1

[2]

社区 WebGPU Demo: https://cryscan.github.io/web-rwkv-puzzles

[3]

RWKV-7-0.4B Hugging Face 下载: https://huggingface.co/BlinkDL/rwkv-7-world

[4]

RWKV-7-0.4B ModelScope 下载: https://modelscope.cn/models/Blink_DL/rwkv-7-world

[5]

RWKV 社区成员 @Jellyfish042: https://github.com/Jellyfish042

[6]

RWKV Othello GitHub 仓库: https://github.com/Jellyfish042/RWKV_Othello

[7]

web-rwkv: https://github.com/cryscan/web-rwkv

[8]

RWKV WebGPU Demo: https://cryscan.github.io/web-rwkv-puzzles/#/chat

[9]

RWKV-5 作曲模型: https://modelscope.cn/models/RWKV/rwkv-5-music

[10]

RWKV-4 作曲模型: https://modelscope.cn/models/RWKV/rwkv-4-music


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

RWKV-7 多语言模型 WebGPU CoT 模型应用
相关文章