原创 Rocky Luo 2024-08-30 18:05 广东
轻松掌握 RWKV 社区 8 月最新动态
欢迎大家收看《RWKV 社区最新动态》第四期,本期内容收录了 RWKV 社区 8 月的最新动态。
8 月动态省流版(TL;DR)
RWKV 官方动态
发布 RWKV-6-ChnNovel 系列中文小说模型,适合写小说和角色扮演
发布 RWKV-6-Jpn 日语微调模型
RWKV 中文文档新增了 RWKV pip 库使用指南与 RWKV 提示词指南
RWKV 社区项目
RWKV Runner 更新 v1.8.7 版本,新增 function call 等功能
RWKV 社区发布基于 RWKV-6 的 embedding 模型,含 Bi-Encoder 和 Cross-Encoder
基于 RWKV 的学术研究
基于多分支降噪器 “Symb-RWKV” 的 Music-Diff 音乐生成架构
RWKV 官方动态
发布 RWKV-6-ChnNovel 中文小说模型
2024 年 8 月 3 日起,RWKV 社区陆续发布了 1B6/3B/7B/14B 四种参数的 RWKV-6-ChnNovel 系列中文小说模型,及对应的小说扩写 state。
zyRWKV-6 小说模型下载链接:https://huggingface.co/BlinkDL/rwkv-6-misc/tree/main[1]
RWKV-6 小说模型的用法,请参考:RWKV 发布中文小说模型,也擅长角色扮演!
RWKV-6-ChnNovel 中文小说模型基于 RWKV-6-World 基底模型微调,微调数据包含中文小说数据和指令(instruction)数据。
相较于 RWKV-6 基底模型, RWKV-6 中文小说模型在小说续写、小说扩写以及进行深层次的角色扮演功能上有非常好的效果。
演示:写中文小说
演示:角色扮演
如上图所示,若角色设定足够详细,模型角色扮演功能不会轻易跳出其对应的角色设定。
发布 RWKV-6-Jpn 日语微调模型
RWKV 发布 7B / 14B 两种参数的 RWKV-6-Jpn 日语微调模型。
zyRWKV-6-Jpn 下载地址:https://huggingface.co/BlinkDL/rwkv-6-misc[2]
RWKV-6-Jpn 系列日语模型由社区成员 @OpenMOSE[3] 进行 RLHF 后,在日语任务上表现更好。
OpenMOSE 发布的基准测试[4]显示:RLHF 后 RWKV-6-Jpn 7B 日语模型可与其他 70B 的 Transformer 模型媲美。
RWKV 中文官网新增 pip 库使用指南与提示词指南
RWKV 官网的中文文档[5]新增了聊天、续写两种模式的提示词指南与 RWKV pip 库使用指南。
“RWKV 提示词指南”介绍了如何向 RWKV 提问,包括完成任务、角色扮演等方面内容。
“RWKV pip 库使用指南”将指引你使用 RWKV pip 库[6]开发基于 RWKV 模型的应用。
RWKV社区项目
RWKV Runner 项目更新
RWKV Runner 更新了 v1.8.7 版本,此版本调整了兼容性和 UI 界面 ,并新增了 function call 等功能:
新增了函数调用(function call)功能(由 RWKV 社区成员 @EliwiiKeeya[7] 贡献)
在窄屏页面上添加悬浮 Web 导航(由 RWKV 社区成员 @HaloWang[8] 贡献)
发布了 RWKV Runner Windows 安装器[9]。Windows 安装器有完整的、正式的安装流程:会自动创建目录放置依赖,自动创建快捷方式启动,且自带卸载程序
Completion 续写页面已支持调整 penalty_decay
参数
社区发布 rwkv6 embedding 模型
RWKV 社区发布了 rwkv6_emb_4k_base
嵌入模型(embedding model),这是一个使用中文查询/上下文数据进行微调的 Bi-Encoder ,主要用于将文本转换成嵌入向量。
zyrwkv6_emb_4k_base 下载链接:https://huggingface.co/yueyulin/rwkv6_emb_4k_base[10]
此外社区也发布了另一款 RWKV-6 嵌入模型 rwkv6_crossencoder
,这是基于 RWKV-6 架构的 Cross-Encoder (交叉编码器) 。Cross-Encoder 既可以用于生成嵌入向量的 embedding 任务,也可以用于重排序查询/上下文检索的 Rerank 任务。
zyrwkv6_crossencoder 下载地址:https://huggingface.co/yueyulin/rwkv6_crossencoder[11]
RWKV 学术研究相关
Music-Diff 音乐生成模型
来自大连理工大学的研究团队提出了 Music-Diff 架构,该架构引入了 Joint Semantic Pre-training 方法来执行多变量扰动,并引入了多分支降噪器 “Symb-RWKV” 模型来恢复联合分布的噪声(通过 Pareto 优化来适应多个噪声目标)。
实验表明,与语言模型相比,在音符和语义层面进行扰动的联合概率扩散模型可以提供更多样本多样性和组成规律性。
Music-Diff 论文地址:https://arxiv.org/abs/2408.01950[12]
关于《RWKV 社区动态》栏目
《RWKV 社区动态》栏目会不定期播报 RWKV 社区的最新消息,以帮助 RWKV 的关注者、爱好者、开发者更好地了解 RWKV 的发展情况。
《RWKV 社区最新动态》不定期更新,所以请保持关注我们的微信公众号(RWKV 元始智能)、QQ 频道(RWKV)等公开平台,以获取最新的消息。
加入 RWKV 社区
欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入我们的 QQ 频道和群聊,一起探讨 RWKV 模型。
RWKV 中文官网:https://rwkv.cn/
QQ 频道:https://pd.qq.com/s/9n21eravc
QQ 交流群:224287095
相关链接
[1]
RWKV-6 小说模型下载: https://huggingface.co/BlinkDL/rwkv-6-misc/tree/main
[2]RWKV-6-Jpn 下载地址: https://huggingface.co/BlinkDL/rwkv-6-misc
[3]社区成员 @OpenMOSE: https://github.com/OpenMOSE
[4]OpenMOSE 发布的基准测试: https://x.com/m0se/status/1825157461516673211
[5]RWKV中文文档: https://rwkv.cn/docs
[6]RWKV pip 库: https://pypi.org/project/rwkv/
[7]社区成员 @EliwiiKeeya: https://github.com/EliwiiKeeya
[8]社区成员 @HaloWang: https://github.com/HaloWang
[9]RWKV Runner Windows 安装器: https://github.com/josStorer/RWKV-Runner/releases/latest/download/RWKV-Runner-amd64-installer.exe
[10]rwkv6_emb_4k_base 下载链接: https://huggingface.co/yueyulin/rwkv6_emb_4k_base
[11]rwkv6_crossencoder 下载地址: https://huggingface.co/yueyulin/rwkv6_crossencoder
[12]Music-Diff 论文地址: https://arxiv.org/abs/2408.01950