热点
关于我们
xx
xx
"
DyT
" 相关文章
深度学习基础架构革新?通过梯度近似寻找Normalization的替代品
PaperWeekly
2025-04-27T16:37:29.000000Z
明日直播|Yann LeCun学生,挑战固有观念,Transformer无需归一化也能高效稳定训练
智源社区
2025-04-02T08:37:19.000000Z
活动报名|LeCun学生分享,Transformer无需归一化也能高效稳定训练
智源社区
2025-04-02T08:21:37.000000Z
【深度学习】CVPR2025|恺明+LeCun联手带来没有归一化层的Transformer!
机器学习初学者
2025-03-25T05:07:20.000000Z
何恺明LeCun联手改造Transformer!9行代码替代归一化层,性能不减还加速
智源社区
2025-03-15T12:10:50.000000Z