2024-12-03 09:03 福建
12 月 5-6 日,2024 中国生成式 AI 大会(上海站)「GenAICon 2024 上海站」将在上海中星铂尔曼大酒店盛大举办。 中国生成式 AI 大会已成功举办两届,迅速成长为国内生成式 AI 领域最具影响力的产业峰会之一。
此次也是中国生成式 AI 大会首次登陆上海举办,由智一科技旗下智能产业第一媒体 智东西、AI 与硬科技知识分享社区 智猩猩 共同发起。上海市人工智能行业协会为 本次大会的指导单位。
大会上海站将设置 “主会场峰会+分会场研讨会+展览区”。主会场将进行大模型峰会、AI Infra 峰会,分会场将组织端侧生成式 AI、AI 视频生成和具身智能三场技术研讨会。主会场与分会场外则设有展览区。
上海站以“智能跃进 创造无限”为主题,将邀请 50+ 位嘉宾带来致辞、演讲、报告和对话讨论,以前瞻性视角为大家解构和把脉生成式 AI 的技术产品创新、商业落地解法、未来趋势走向与前沿研究焦点。
Jina AI 受邀参与本次大会,联合创始人兼首席技术官王楠博士 将出席,并在大会主会场第二日进行的「AI Infra 峰会」上带来主题演讲,对 RAG 范式在大模型的实际应用中遇到的机遇和挑战进行深入探讨。欢迎大家到现场参会和交流。
演讲主题:《从长窗口到多向量:RAG 范式下 AI Infra 的机遇和挑战》
内容概要:
在本次演讲中,我们将深入探讨 RAG(Retrieval-Augmented Generation)范式在大模型的实际应用中遇到的机遇和挑战。RAG 不仅能够补足大模型记忆的不准确性,还有效降低了注入新知识的成本,尤其是在私有知识的访问方面表现出色。尽管长窗口大模型技术取得了长足进步,但其并不会取代 RAG 范式,反而推动了 RAG 依赖于支持长窗口输入的向量模型的需求。
我们将讨论 Jina AI 向量模型作为全球首款支持 8k 窗口的开源向量模型的成功,以及长窗口输入逐渐成为多模态向量模型的新标配。尽管如此,长窗口模型带来了信息丢失和推理成本上升的挑战,这也催生了多向量表示的需求,以弥补单一向量带来的信息缺失。例如,ColBERT 和 ColPali 分别针对文本和图文内容提供了多向量表示方案,然而支持多向量的 AI 基础设施仍然不足。此外,RAG 的 PoC 阶段面临着 GPU 推理成本高、资源利用率低的问题,市场缺乏类似 Modal lab 的 GPU 共享服务。
通过本次演讲,我们将总结 RAG 范式的长期发展前景,阐明向量模型在长窗口和多模态输入上的进化需求,并探讨 AI 基础设施如何更好地支持多向量表示和 GPU 共享,以降低 RAG 的应用成本。
目前,大会的观众报名通道已全面开启,扫描下方二维码或点击阅读原文,可以直达大会官网进行报名。
报名链接:
http://genaicon.zhidx.com/2024shanghai/?code=aHmOh1QBWfmCgu