原创 集智编辑部 2025-02-20 17:18 上海
一种生物学上可行的降维算法
摘要
从高维感官输入中以无监督方式获得适当的低维表示对于后续处理至关重要。尽管已开发出如t-分布随机邻域嵌入(t-SNE)等非线性降维方法,但其在简单生物电路中的实现仍不明确。在本文中,我们开发了一种生物学上可行的降维算法,该算法与t-SNE兼容,并使用一个简单的三层前馈网络模拟果蝇的嗅觉电路。我们提出的学习规则被描述为三因子Hebbian可塑性,对于诸如纠缠环和MNIST等数据集非常有效,且与t-SNE相当。我们进一步通过分析之前研究中的多项实验数据,证明该算法可能在果蝇的嗅觉电路中工作。最后,我们建议该算法对输入和奖励之间的联结学习也有益,从而使这些联结能够推广到尚未与奖励相关联的其他输入。
研究领域:非线性降维,生物模型,果蝇嗅觉回路,三因子Hebbian可塑性,t-SNE,奖励关联学习,泛化性
论文题目:A biological model of nonlinear dimensionality reduction
发表时间:2025年2月5日
论文地址:https://www.science.org/doi/10.1126/sciadv.adp9048
期刊名称:Science Advances
当人类闻到咖啡香时,大脑如何从数千种气味分子中快速识别出“这是咖啡”?这种将高维感官输入压缩为低维表征的能力,是智能系统的核心挑战。传统算法如t-SNE虽能实现非线性降维,但其生物学可行性始终成谜。近期发表在Science Advances的一项研究,从果蝇的嗅觉神经回路中找到灵感,提出首个生物兼容的非线性降维模型——Hebbian t-SNE,为理解大脑高效学习的奥秘打开新窗口。
生物启发的算法构建:三层网络模拟嗅觉地图
研究团队模仿果蝇嗅觉系统的三层结构:投射神经元(PNs)→ 凯尼恩细胞(KCs)→ 蘑菇体输出神经元(MBONs),设计了一个前馈神经网络。其中,中间层KCs通过随机投影+稀疏激活(约5%神经元激活)将输入信号映射到高维空间,输出层MBONs则通过可塑性突触生成低维表征。
核心创新在于三因子学习规则:突触变化由前后神经元活性差异与全局调质信号D共同决定。D信号巧妙对比输入与输出的相似性,其中输入相似性通过高斯核衡量相邻刺激的距离,输出相似性则用t分布捕捉低维空间关系。这种设计无需反向传播,仅通过重复刺激的时序差异即可自主学习,完美匹配生物系统的“在线学习”特性。
图 1. Hebbian t-SNE的模型结构。(A) 三层前馈模型,包括输入层X、中间层Z和输出层Y。从X到Z的转换是固定的。从中间层到输出层的突触权重矩阵W是可塑的,由突触前后神经元和全局因子D调节。全局因子D由输入和输出相似度决定,输入相似度基于输入差异和来自中间层的轴突信号a。(B) 在果蝇嗅觉电路中实现Hebbian t-SNE的假设元素。
高维数据降维效果
在合成数据集纠缠双环上,传统PCA因线性限制无法解耦,而Hebbian t-SNE仅需千次迭代即可分离双环,KL散度与t-SNE相当。
图 2. 将Hebbian t-SNE应用于按照纠缠环分布的输入。(A) 输入数据。红色和蓝色点分别表示对应于每个环的输入。(B) 通过PCA和t-SNE获得的最终二维输出表示。虽然PCA未能分离两个环,但t-SNE成功地分离了这两个环。(C) Hebbian t-SNE表示变化的时间过程。随着突触权重的迭代更新,两个环逐渐被分离。(D) 输入和输出相似度矩阵之间的KL散度变化以及输出表示中两个环的线性可分性。线条和阴影分别表示五次试验中的均值和标准误差(SEM)。(E) 模型中σ1值的变化及其相关的估计困惑度。随着σ1的变化,估计的困惑度逐渐接近目标困惑度20。线条和阴影分别表示五次试验中的均值和标准误差(SEM)。
面对更复杂的MNIST手写数字,其生成的二维表征能清晰区分10类数字,线性可分性达71%,媲美经典t-SNE。有趣的是,若简化中间层的高维稀疏性(如减少KC数量),模型性能显著下降,印证了生物回路中“高维稀疏表达”的关键作用。
图 3. 将Hebbian t-SNE应用于MNIST数据。(A) 示例MNIST数据。(B) 通过PCA和t-SNE获得的二维表示。数据的每种颜色表示一个从零到九的数字。虽然PCA未能找到隐藏的表示,但t-SNE成功地分离了不同数字的输入。(C) Hebbian t-SNE表示变化的时间过程。Hebbian t-SNE逐渐产生了良好的表示,成功地分离了不同的数字。(D) 输入和输出相似度矩阵之间的KL散度变化以及输出表示中10个数字的线性可分性。学习从第500步开始。线条和阴影分别表示五次试验中的均值和标准误差(SEM)。(E) 模型中σ1值的变化及其相关的估计困惑度。随着σ1的变化,估计的困惑度逐渐接近目标困惑度40。线条和阴影分别表示五次试验中的均值和标准误差(SEM)。
果蝇嗅觉回路的生物学验证
研究者进一步用果蝇实验数据验证模型。将50种气味分子在嗅觉受体的响应输入模型后,Hebbian t-SNE生成的二维图谱能按化学结构(如酯类、醛类)聚类,线性可分性达59%,远超PCA(48%),与真实MBONs记录的气味效价(愉悦/厌恶)编码模式高度吻合。更惊人的是,当模型加入多巴胺能神经元(DANs)介导的奖励信号后,仅需少量标记数据即可实现气味-奖赏关联,并能泛化至相似气味,完美复现果蝇的“条件化学习”行为。
图 4. Hebbian t-SNE比PCA更好地解释了果蝇中的情感效价表征。(A) 将PCA(左)、t-SNE(中)和Hebbian t-SNE(右)应用于PN活动所得到的二维表示。颜色表示情感效价指数。(B) 分析过程。(C) 对于不同数量的K-means聚类,计算每个数据点的情感价值指数与其邻域聚类均值之间的均方误差(MSE)。显示了来自原始PN活动的MSE差异。表征通过将PCA应用于PN活动(红色)、将PCA应用于建模的KC活动(绿色)、将t-SNE应用于PN活动(橙色)以及将Hebbian t-SNE应用于PN活动(蓝色)得到。灰线表示Hebbian t-SNE的结果,在情感价值指数随机打乱后得到。线条和阴影分别表示10次试验中的均值和标准误差(SEM)。
总结:神经回路的“降维智慧”
这项研究首次证明,简单生物网络可通过局部学习规则实现复杂降维,其意义不仅在于为机器学习提供新算法,更揭示了大脑高效处理信息的本质——通过层级稀疏编码与全局调质信号的协同,将高维世界压缩为可操作的认知地图。或许未来AI的“泛化能力”提升,正藏在果蝇微小的蘑菇体中。
彭晨 | 编译
昆虫智能与AI读书会招募中
对简单模式动物的系统研究可以帮助我们看清树丛中的路线,定义和发现关键问题,是脑科学与类脑研究十分必要一环。昆虫智能的研究在国内尚属小众,为了促进来自神经科学、系统科学、物理学、数学以及计算机科学等不同领域,对昆虫智能、仿生机器人、类脑智能与计算、人工智能感兴趣的学术工作者的交流与合作,集智俱乐部联合复旦大学宋卓异、西湖大学孙一、中科院生物物理研究所司光伟和北京大学的梁希同老师,发起了神经、认知、智能系列读书会第四季——「昆虫智能与AI」读书会。
详情请见:昆虫智能如何启发人工智能与仿生机器人?昆虫智能与AI读书会启动!
推荐阅读
2. Cell 最新:科学家成功绘制出完整的果蝇大脑神经网络!
3. Science 速递:昆虫大脑连接组揭示多感官整合机制
4. 张江:第三代人工智能技术基础——从可微分编程到因果推理 | 集智学园全新课程
6. 加入集智,一起复杂!
点击“阅读原文”,报名读书会