掘金 人工智能 07月15日 12:08
NL2SQL 再创佳绩!阿里云论文中选 SIGMOD 2025
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

顶级国际会议SIGMOD 2025上,阿里云AI搜索团队发表论文《OpenSearch-SQL》,通过动态Few-shot学习和一致性对齐机制提升NL2SQL性能。同时,阿里云分享“随心搜索”主题演讲,探讨AI搜索算法趋势,涵盖行业特定模型、多模态搜索及自然语言搜索创新,旨在优化搜索效率和准确性。

🔍 OpenSearch-SQL通过动态Few-shot学习机制,将简单的query-SQL Pair升级为Query-CoT-SQL,丰富查询信息,解决数据库知识缺位和大模型幻觉问题。

🤝 不同Agent协作的对齐机制被引入,根据agent特性构建对齐策略,减少信息传递误差及agent自身输入输出不匹配(幻觉)。

💡 阿里云演讲聚焦AI搜索算法趋势,提出行业特定搜索模型、多模态搜索(文本与视觉)、自然语言搜索(NL2Search)及WebSearch创新,提升搜索效率。

📊 BIRD榜单作为Text-to-SQL benchmark,测试数据库真实、规模大、范围广,接近日常应用需求,阿里云技术在此榜单上取得突破。

🚀 阿里云AI搜索技术持续演进,通过算法创新和场景定制,推动搜索从关键词到对话式查询的转变,增强用户体验。

当地时间6月22-27日,顶级国际会议SIGMOD 2025 在德国柏林正式召开。SIGMOD Conference 每年由 ACM 主办,汇集了全球顶尖的学者、研究人员和工业专家,探讨数据库系统、大数据处理、数据存储与检索、数据分析等方面的最新技术与应用。

阿里云计算平台事业部 AI 搜索团队的论文《OpenSearch-SQL: Enhancing Text-to-SQL with Dynamic Few-shot and Consistency Alignment》被 SIGMOD 2025 收录,论文主要成果为通过自学习的动态Few-shot和对齐机制提升 NL2SQL 的表现。

同时,在本次会议中,阿里云带来主题演讲分享“随心搜索:阿里云AI搜索算法趋势”,与全球顶尖专家们共同交流阿里云AI搜索的演变、技术支撑和未来演变。


中选论文

论文《OpenSearch-SQL: Enhancing Text-to-SQL with Dynamic Few-shot and Consistency Alignment》被 SIGMOD 2025 收录。

Text-to-SQL任务一直以来广受数据库、AI相关行业的研究者和从业者的关注。BIRD榜单是近年来广受关注的Text-to-SQL 的benchmark,有测试数据库真实、规模大、涉及范围广的特点,十分接近日常应用中的需求。

自LLM时代以来,Text-to-SQL在大模型的加持下,能力达到了新的平台,但是仍然存在着架构不清晰、无法充分利用大模型的能力以及数据库的真实特点的情况。同时SFT等训练领域模型等情况也存在着随着场景变化存在着过拟合、遗忘等问题。

本文的核心目标聚焦于提升Text-to-SQL任务中单条query的查询效果。我们通过搭建完整的Text-to-SQL pipeline解决过去存在的问题,包括:数据库知识缺位、大模型幻觉、Few-shot信息利用不充分以及多Agent协作中信息传递导致的误差累计。

OpenSearch-SQL的关键组成部分有:

• 一个鲁棒的Pipeline:预处理、信息提取、生成、纠错

• Self-taught 的Few-shot:通过自学习机制将few-shot从简单的query-SQL Pair 变成 Query-CoT-SQL 来丰富查询信息

• 不同Agent协作的对齐机制:根据每个agent的特性构建对齐机制,减少agent信息传递以及Agent自身输入和输出的不匹配(幻觉)问题。

论文标题:OpenSearch-SQL: Enhancing Text-to-SQL with Dynamic Few-shot and Consistency Alignment (OpenSearch-SQL:通过动态少样本学习与一致性对齐增强文本到SQL转换)

论文作者:Xiangjin Xie, Guangwei Xu, Lingyan Zhao, Ruijie Guo

论文链接:arxiv.org/abs/2502.14…

演讲分享

演讲标题 「随心搜索:阿里云AI搜索算法趋势」

本次演讲概述了阿里云在人工智能驱动搜索技术方面的进展。演讲探讨了行业特定的搜索模型,以实现开箱即用的高效性,以及根据客户数据量身定制的算法。多模态搜索增强了文本和视觉搜索功能,包括图像和视频。自然语言搜索创新(例如 NL2Search)将关键词输入转化为对话式查询,而 WebSearch 则利用 API 和基于浏览器的方法进行全面的互联网搜索。这些改进旨在优化各种应用的搜索效率和准确性。

更多原理介绍和操作步骤,请参考产品文档:NL2SQL服务配置https://help.aliyun.com/zh/open-search/search-platform/user-guide/nl2sql-service-configuration

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

阿里云 AI搜索 OpenSearch-SQL NL2SQL SIGMOD 2025
相关文章