AI & Big Data 01月20日
Google發表新Titans模型融合長短期記憶與注意力機制,突破200萬上下文Token限制
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

谷歌研究院推出了Titans模型架构,它整合了短期、长期记忆与注意力机制,突破了现有生成式AI的上下文处理限制,支持超过200万Token的上下文长度。Titans通过引入深度神经长期记忆模块,有效解决了传统模型在处理长文本时语义连贯性与信息准确性的问题。该架构设计灵感来源于人类记忆系统,结合了快速响应的短期记忆和持久的长期记忆,并通过注意力机制专注于当前上下文。Titans的三种架构变体MAC、MAG和MAL,针对不同任务需求整合短期与长期记忆,并在多领域展现出优越性能。Google计划开源Titans技术,加速长上下文生成技术的发展与应用创新。

🧠 Titans模型架构整合了短期记忆、长期记忆与注意力机制,突破了现有生成式AI的上下文处理瓶颈,支持超过200万Token的上下文长度,显著提升了长文本处理能力。

💡 Titans架构设计灵感来源于人类记忆系统,结合了短期记忆的快速响应与长期记忆的持久特性,并通过注意力机制专注于当前上下文,有效解决了传统模型在处理长文本时语义连贯性与信息准确性的问题。

⚙️ Titans具有三种架构设计变体,分别是Memory as a Context(MAC)、Memory as a Gate(MAG)和Memory as a Layer(MAL),针对不同的任务需求来整合短期与长期记忆,提升了模型的灵活性和适应性。

🚀 在语言建模、常识推论、时间序列分析及基因资料建模等多领域,Titans展现出远超现有基准模型的性能,特别是在超长序列处理方面的表现,甚至在部分场景中超越了如GPT-4等超大型模型。

Google研究院發表了一項稱為Titans模型架構的突破性研究,整合了短期記憶、長期記憶與注意力機制,突破現有生成式人工智慧上下文處理瓶頸,支援超過200萬Token的上下文長度,對語言建模與長序列生成任務帶來顯著改進。 Google計畫將Titans的相關技術開源,這將加速長上下文生成技術在學術與產業領域的發展,並推動相關應用的創新。目前生成式人工智慧模型,例如Transformer及其衍生模型,雖然在多數應用領域表現出色,但其上下文窗口(Window)長度的限制,通常僅為幾千到幾萬個Token,這使其在處理長文本、多輪對話或需要大規模上下文記憶的應用中,可能無法保持語意連貫性與資訊準確性。Google的Titans架構透過引入深度神經長期記憶模組(Neural Long-Term Memory Module),有效解決了這個挑戰,能在更長的上下文中保持高效且精確的推理能力。研究團隊表示Titans的設計靈感來自於人類記憶系統,結合短期記憶的快速回應與長期記憶的持久特性,並透過注意力機制專注於當前上下文。傳統Transformer模型因為需要計算所有Token之間的配對相關性,所以計算成本隨上下文長度平方增加,而Titans則藉由深層化與非線性化的記憶模組設計,以及遺忘機制等技術,大幅提升記憶管理效率。Titans具有三種架構設計變體,分別是Memory as a Context(MAC)、Memory as a Gate(MAG)和Memory as a Layer(MAL),針對不同的任務需求來整合短期與長期記憶。MAC將長期記憶作為上下文的一部分,讓注意力機制能夠動態結合歷史資訊與當前資料,適合需要處理詳細歷史上下文的任務。而MAG則會根據任務需求,調整即時資料與歷史資訊的重要性比例,專注於當前最相關的資訊。MAL則是將記憶模組設計為深度網路的一層,壓縮過去與當前上下文,然後交由注意力模組處理,具備較高效率,但整體表現可能略受限制。與傳統Transformers相比,Titans結合了多層次記憶模組與動態記憶更新能力,不僅突破了上下文長度的限制,還能在測試階段持續學習,顯著提升推理能力與適應性。在語言建模、常識推論、時間序列分析及基因資料建模等多個領域,Titans展示遠超過現有基準模型的性能,特別是在超長序列處理方面的表現。在實驗中,Titans架構在長序列處理任務中的表現,明顯優於現有模型。無論是語言建模還是時間序列預測,Titans在準確性與效率都展現了壓倒性優勢,甚至在部分場景中超越如GPT-4等具有數十倍參數的超大型生成式模型。除了Google在生成式人工智慧長上下文的研究突破之外,中國人工智慧公司MiniMax推出的MiniMax-01系列模型,也主打其超長上下文處理和多模態理解能力,其最新的MiniMax-Text-01模型支援長達400萬Token的上下文處理能力。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Titans模型 长上下文处理 生成式AI 深度学习 人工智能
相关文章