微软最新研究表明,现有的电子表格应用程序因其丰富的功能和布局选项,难以被传统AI大语言模型有效处理。为解决这一问题,微软研发了专为电子表格应用设计的AI模型SpreadsheetLLM,并开发了SheetCompressor(压缩电子表格)以提升模型的理解和处理能力。SpreadsheetLLM由三个模块组成,能够显著提高电子表格表检测任务的性能,并降低处理成本。尽管该模型仍存在一些限制,但为电子表格应用的AI发展带来了新的方向。
😄 **SpreadsheetLLM的诞生**: 针对传统AI模型难以胜任电子表格处理场景的现状,微软研发了专为电子表格应用而设计的AI模型SpreadsheetLLM。此举旨在突破现有AI模型在处理电子表格数据的局限性,为用户提供更精准、高效的电子表格处理体验。
😎 **SheetCompressor的助力**: 为了帮助SpreadsheetLLM更好地理解和处理电子表格数据,微软还研发了SheetCompressor,它可以有效地压缩电子表格数据,降低模型处理的负担。SheetCompressor的加入,使得SpreadsheetLLM能够更准确地识别和分析电子表格中的数据,提升处理效率。
🤩 **SpreadsheetLLM的优势**: SpreadsheetLLM模型主要由三个模块组成,分别是基于结构锚的压缩、反向索引转换和数据格式感知聚合。这三个模块协同工作,使SpreadsheetLLM在电子表格表检测任务中表现出色,性能提升显著。同时,SpreadsheetLLM还能够有效降低处理成本,提高数据处理的效率。
🤔 **SpreadsheetLLM的局限性**: 目前,SpreadsheetLLM还存在一些局限性,例如无法高效处理使用背景颜色和边框的电子表格,SheetCompressor也无法有效压缩包含自然语言的单元格。这些限制表明,SpreadsheetLLM仍处于发展阶段,需要进一步完善和改进。
🚀 **SpreadsheetLLM的未来**: 尽管存在局限性,但SpreadsheetLLM的研发为电子表格应用的AI发展带来了新的方向。未来,随着技术的不断进步,SpreadsheetLLM有望克服现有的局限性,为用户提供更加智能、便捷的电子表格处理体验。
IT之家 7 月 16 日消息,根据微软最新公布的研究论文,计划为 Excel、谷歌 Sheets 等电子表格应用程序,开发全新的 AI 大语言模型--SpreadsheetLLM。

研究人员表示现有电子表格应用程序具备丰富的功能,在布局和格式方面为用户提供大量的选项,因此传统 AI 大语言模型很难胜任电子表格处理场景。
而 SpreadsheetLLM 就是专门为电子表格应用而设计的 AI 模型,微软还研发了 SheetCompressor(压缩电子表格),让 SpreadsheetLLM 能够更好地理解、处理电子表格数据。
IT之家援引论文摘要部分,SpreadsheetLLM 模型主要由 3 个模块组成:基于结构锚的压缩、反向索引转换和数据格式感知聚合。

SpreadsheetLLM 大大提高了电子表格表检测任务的性能,在 GPT4 的情境学习设置中,比普通方法高出 25.6%;使用词元(token)的成本降低了 96%,并能提供更好的处理结果。
目前还没有关于微软计划何时或是否向公众提供 SpreadsheetLLM 的消息。该论文指出,该模型仍有一些限制,无法高效处理使用背景颜色和边框的电子表格;SheetCompressor 目前还不能压缩包含自然语言的单元格等等。