8 月 13 日,在 FORCE Link AI 创新巡展·青岛站,火山引擎数智平台解决方案总经理萧然在现场发布了火山引擎 Data Agent“一客一策”全新能力和 AI 数据湖服务的“AI 算子广场”功能。
以下为萧然的现场演讲全文。
大家上午好!我是萧然。很荣幸来到青岛,请大家和我一起进入今天的主题。
我们首先看一个问题,我们拥有的究竟是数据资产还是数据负债?
这个问题怎么理解,先来看一个数据冰山图:
在大模型时代之前,我们经历了 IT 信息化和数字化时代。那时,我们投入大量 IT 成本和预算,构建了数据基建,也留存了海量数据。
但真正能用的,更多是那些在数据库和报表里的结构化数据。还有大量非结构化数据,它们冷冰冰地躺在存储系统里,每年都在消耗 IT 成本,但我们却无法使用。
根据 IDC 报告统计,现有数据中,超过 90%是非结构化数据,这成为了我们的数据负债。
同时,在用结构化数据的过程中,会因为系统间的孤岛问题,导致数据连通不畅,数据的价值也没能得到充分发挥。
实际上,整个大数据这座冰山,我们真正能用到的,只是水面上很小很小的一部分。
而大模型来了之后,我们发现,它能够更深入地理解非结构化数据,释放出这些数据的价值。
大模型怎么解决这个问题?我们其实有三个鸿沟:
首先是数据和数据的鸿沟。 借助大模型,我们可以有效识别非结构化数据中的关键信息,让结构化与非结构化数据真正融合,去更好地赋能业务。
第二个是数据和工具的鸿沟。 系统和平台间的孤岛效应导致数据难以协同。但大模型可以把各平台能力拆解成原子能力,理解、调度它们,从而实现跨平台业务贯通。
第三是数据和人的鸿沟。 企业常有优秀的数据平台和数据,却缺少优秀的数据人才。而大模型能学习人的经验,固化下来成为它的知识与能力,帮助我们用好数据。
在 5 月份的上海 AI 巡展中,我们发布了 Data Agent 产品。Data Agent 是能较好解决上述三大鸿沟的产品。
首先,借助 Data Agent,我们能快速接入企业的结构化与非结构化数据, 直接赋能业务分析,驱动智能化营销。
通过 Data Agent,还能实现跨平台系统贯通。 比如说:针对业务用户做营销活动,按传统经验,我们得先去 BI 系统分析过往活动经验,再去画像平台圈选人群,圈完后再到自动化运营平台制定策略。整个过程,需要数据分析师和运营同学配合,耗时几天才能完成。
但借助 Data Agent,我们只需与大模型进行几句对话,它就能自动执行全面的 BI 数据分析,并结合非结构化数据,比如营销物料、知识库,得出关键结果;再根据结果找到精准人群,设计匹配的营销活动;
而我们确认了之后,只需一句话或一个点击,它就能自动实现营销触达。 这极大地提升了效率,并解决了数据孤岛问题。
Data Agent 也有效解决了数据和人的鸿沟。 通过它,我们可以将各行业优秀企业的宝贵经验、分析方法、营销策略、运营手段等内嵌成知识库,快速掌握行业领先的分析思路与营销方案。
自发布以来,火山引擎 Data Agent 已经与数十家优秀企业建立了合作。
接下来,看一个具体案例:一家消费品企业,他们在 618 之前与我们合作,正好遇到了这个很好的场景,他们想分析如何制定 618 的营销方案。
在没用 Data Agent 时:制定一个营销方案,需要先做数据分析,形成复盘报告;然后运营同学再基于报告设计营销策略。
有了 Data Agent 之后: 我们可以直接问它,“针对即将到来的 618,请帮我复盘过去营销活动的好经验”。 Data Agent 会主动调取结构化数据和非结构化知识,生成分析报告。
例如,当报告发现“粉丝互动赢好礼”活动过去效果突出,我们还能继续追问:“‘粉丝互动赢好礼’活动适合什么目标客群?你有什么营销建议?”
Data Agent 就会基于“粉丝互动赢好礼”深入分析活动数据,结合客群特征,制定差异化营销方案。 一旦确认方案,使用营销 Agent 一键触达即可。
这是我们落地的真实案例。
今天,我们非常荣幸在青岛发布 Data Agent-智能营销 Agent 的核心能力——一客一策。
过去常说“千人千面”营销。但传统“千人千面”基于标签体系,而标签是数学模型计算的标签值。数学模型运算会带来信息缺失。因此,过去的“千人千面”更多是把人群分层,再针对不同层客群进行营销。
“一客一策”能力,会整合结构化和非结构化数据,基于用户的立体画像,结合产品、文案、触达渠道和时间,匹配营销策略,真正实现“千人千面”。
以我们一位企业客户为例:这是一家 B to B 的 SaaS 企业,刚完成 B 轮融资,主要业务是帮助中小企业构建数字协同平台。该企业当前核心获客渠道是线上线索,再通过电销客服触达用户。
在使用 Data Agent 之前,这家企业面临几个核心痛点:
一是电销线索质量参差不齐,难以识别高价值客户。 线上线索涌入后,无法确定谁应优先联系,无法第一时间捕捉关键商机。
二是对客户缺乏认知,只能使用千篇一律的话术。 不同客户原本可能对 A 或 B 产品兴趣各异,销售却只能用通用方案介绍。结果很多客户没 Get 到重点就流失了,转化率自然大幅下降。
三是沉淀了大量数据却无法利用。 官网数据、转化数据、线上实验平台数据,这些宝贵资产都未被激活。
借助 Data Agent,该企业实现了结构化与非结构化数据融合。 当客户再次致电,电销人员可向 Data Agent 追问:“应采取何种营销策略?”、“客户更关注价格还是功能?” 进而实施精准营销。
在应用了这个能力后,该公司整体线索转化率提升 300%。
以上是关于 Data Agent 的相关介绍。
谈到释放数据冰山价值,目前可应用的仅是浮出水面的小部分数据,那么,如何释放深藏水下的海量数据价值?
关键在于:筑牢数据基建根基。
在 6 月的火山引擎 FORCE 大会上,我们发布了多模态数据湖。它能高效处理冰山下的非结构化数据,实现非结构化数据和结构化数据统一管理,从而驱动业务价值落地。
今天,我也非常荣幸地在青岛发布我们 AI 数据湖产品的重要能力——算子广场。
在 AI 数据湖产品的左侧菜单中可以找到算子广场。 这里汇聚了丰富的算子,涵盖文本、视频、语音、图片等多种处理能力。
这些算子内置了豆包大模型的数据处理经验,并融合了我们与众多客户共创沉淀的非结构化数据处理算子。同时,算子支持客户自定义开发。
借助算子平台,冰山下沉睡的非结构化数据得以有效处理, 其价值被真正提炼出来。
让我们看一个实例:这是一家专注于 AI 视频生成的企业,服务于众多品牌方,为其制作视频广告。
这家企业在使用算子广场和 AI 数据湖之前,有两个比较大的痛点:
第一,数据格式繁杂,文件、图片、视频,来源各异。 这让他们需要构建多条处理链路,效率比较低。
第二,开发管理效率低。 开发后的数据存储分散于不同链路和处理环节,无法统一有效管理。
借助火山引擎的 AI 数据湖和算子广场,他们实现了不同数据源与数据格式的有效处理。 AI 数据湖通过数据集的方式,统一管理各类非结构化数据,显著提升了这家企业的研发效率。
以上是今天的分享,希望给在座大家有一些收获。
火山引擎数据产品团队,也非常希望与大家一起构建知识资产,开启数据思考新未来!感谢各位。