RWKV元始智能 02月08日
RWKV 社区 1 月动态:大量新论文、RWKV-7 发布 0.4B/1.5B 模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文总结了RWKV社区在2025年1月的最新动态,涵盖学术研究、模型发布和社区活动。在学术研究方面,涌现了多篇基于RWKV架构的论文,涉及语音压缩、医学图像分割、触觉传感等多个领域。同时,社区发布了RKWV-7-1.5B和RKWV-7-0.4B两款新模型,在英文和多语言能力上表现出色。此外,RWKV创始人还组织了闭门会,并有社区成员基于RWKV-7架构开发了RWKV Othello项目,该项目利用RWKV-7-Othello模型实现了与人类对战Othello游戏的高胜率。

🔬RWKV学术研究: 多篇论文涌现,涵盖语音压缩、医学图像分割、触觉传感、知识图谱补全、视频异常检测、语音对话系统、视觉语言模型、无线传感器网络安全、语言理解对比研究以及多时间视角增强等多个领域,展示了RWKV在不同领域的应用潜力。

🤖RWKV模型发布:社区发布了RKWV-7-1.5B和RKWV-7-0.4B两款新模型,前者基于3.1T数据集训练,在英文和多语言评测中表现领先,后者支持100+种语言和代码,显示了RWKV在多语言处理方面的优势。

🤝RWKV社区活动:RWKV创始人彭博组织了“RWKV-7与未来趋势”闭门会,促进开发者和业内人士的交流。同时,社区成员开发了RWKV Othello项目,该项目利用RWKV-7-Othello模型实现了与人类对战Othello游戏的高胜率,展现了社区的活跃度和创新能力。

原创 Rocky Luo 2025-02-07 17:50 广东

三分钟,速看 RWKV 社区一月的新鲜事。

欢迎大家收看《RWKV 社区最新动态》,本期内容收录了 RWKV 社区 2025 年 1 月的最新动态。包括一些

只需 3 分钟,快速了解 RWKV 社区 1 月都有哪些新鲜事!

1 月动态省流版(TL;DR)

    RWKV 学术研究动态

RWKV 模型新闻动态

RWKV 社区活动

RWKV 社区项目动态

RWKV 学术研究动态

RWKV 学术研究包括基于 RWKV 架构的新论文RWKV 社区参加的学术研究

Rate-Aware Learned Speech Compression

这篇论文提出了一种基于通道感知熵模型的学习语音压缩方案,该方案通过替换传统的量化器来增强率失真性能。它利用多尺度卷积和RWKV混合块来提高编码器和解码器的表示能力。

实验结果表明,与现有编解码器相比,提出的方法在比特率节省和声学质量指标方面取得了显著改善。

RWKV-UNet

论文提出 RWKV-UNet,它将 RWKV 结构融入 U-Net 用于医学图像分割。通过 IR-RWKV 模块增强长距离依赖捕获能力,结合 CCM 模块改善跳跃连接。

实验表明,RWKV-UNet 在多个数据集上取得 SOTA 性能,平衡了性能和效率。

FSSC

这篇论文介绍了 FSSC,一种全新的 few-sample-driven style-to-content 无监督域适应方法。它采用基于 RWKV 架构的设计来应对跨传感器域适应中的难题,例如传感器差异导致的域差距等问题。借助 GLAB 层、FST 模块等重要组件,它达成了有效减少触觉传感跨传感器域差距的目标。

实验表明,FSSC 在跨传感器域适应任务的准确性以及对少量样本的利用效率上均超越了现有的先进方法。

img-1-20250105

RWKV Knowledge Graph Completion

论文提出一种用于知识图谱补全的新方法,它采用受 Rwkv 启发的 Triple Receptance Perception (TRP) 架构来解决先前知识图谱嵌入模型的缺点,如表达能力有限、计算成本高等问题。通过 TRP 中的时间混合和通道混合模块等关键要素,它实现了高效且高质量的知识图谱补全。

实验表明,该方法在链接预测和三元分类任务方面都优于最先进的方法。

TCVADS

论文介绍了一种名为 TCVADS 的视频异常检测系统。该系统采用两个阶段的运行模式。在第一阶段,系统使用增强的 RWKV 模块来进行高效的时间序列分析。通过结合知识蒸馏和跨模态学习技术,TCVADS 在性能上优于现有的方法。

RWKV Voice Dialog System

论文提出开发一个面向老年人的智能语音对话系统,采用经 LoRA 微调的 RWKV 模型。实验结果表明它提高了答案的流畅性和合理性,在老年护理方面有应用潜力,未来工作会对模型进行优化。

Visualrwkv-Hm

论文提出 VisualRWKV-HM,这是一种线性复杂度的视觉语言模型。它基于 RWKV 整合了时间和跨状态混合。在多个基准测试上达到了 SOTA,在 24K 上下文时比 LLaVA-1.5 等模型效率更高,还展现出强大的可扩展性。

AutoGMM-RWKV

论文提出了 AutoGMM-RWKV 用于检测无线传感器网络中的选择性转发攻击。它聚焦于节点单轮转发率时间序列,通过将自编码器、高斯混合模型和 K - 均值与 RWKV 相结合,提高了检测精度。模拟结果显示误检率和漏检率较低,提供了一个可靠的解决方案。

Revenge of the Fallen?

论文提出,在语言任务中,Transformer 一直占据主导地位,但近期 RWKV 等循环模型出现。本文表明像 RWKV 这样的当代循环模型在模拟人类语言理解方面能够与 Transformer 相媲美甚至超越它们,开启了新的研究方向。

Enhancing Transformer RNNs with Multiple Temporal Perspectives

论文提出多时间视角概念以增强循环神经网络(RNN)。将其应用于 RWKV 模型时,能以极少的参数增加丰富上下文理解。实证结果验证了其有效性,在基准测试中表现提升且保持线性推理复杂度。

RWKV 模型动态

新模型:RKWV-7-1.5B

RWKV-7-World-1.5B-v3 模型于 2025 年 1 月 28 日正式发布!

RWKV-7-1.5B 模型基于 RWKV World v3 数据集(共 3.1T 数据)训练而来。在英文和多语言评测中,RWKV-7-1.5B 模型的评分对比其他同参数模型处于绝对领先地位。

新模型:RKWV-7-0.4B

RWKV-7-World-0.4B-v2.9 模型于 2025 年 1 月 8 日正式发布!

RWKV-7-World-0.4B 在 world-2.9(从 world-v3 数据集中采样 2T tokens)数据集上训练。其英文和多语言能力显著超越其他 0.4B 模型,且支持全球 100+ 种语言和代码。

2025-01-10-rwkv-7-0.4b-eval

RWKV 社区活动

此版块包含 RWKV 官方动态,以及 RWKV 社区举办或参加的各类活动

RWKV 创始人闭门会开启报名

2 月 21 日晚 7 点,将在上海组织 “RWKV-7与未来趋势“ 的闭门会。

RWKV 创始人彭博会线下参加,欢迎 RWKV 开发者、感兴趣的业内人士扫码报名?

RWKV 社区项目动态

RWKV Othello

RWKV 社区成员 @Jellyfish042[1] 基于 RWKV-7 架构开发了 RWKV Othello 项目。

项目 GitHub 仓库:https://github.com/Jellyfish042/RWKV_Othello[2]

RWKV Othello 项目利用 Othello(也称为反转棋或黑白棋)的 CoT 数据训练了仅 8.8M 参数的 RWKV-7-Othello 模型。

RWKV-7-Othello 模型可以和人类或其他模型自动对战 Othello 游戏,且在与人类对战时实现了非常高的胜率。

2025-01-10-rwkv-othello-demo

相关链接

[1]

RWKV 社区成员 @Jellyfish042: https://github.com/Jellyfish042

[2]

RWKV Othello GitHub 仓库: https://github.com/Jellyfish042/RWKV_Othello

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

RWKV 社区动态 学术研究 模型发布
相关文章