从被动查询到主动智能：数据应用智能体的技术演进路线图

1.0 演进的背景：从描述性分析到诊断性分析

本章旨在为数据应用智能体的演进建立战略背景，将其置于商业智能（BI）发展的宏大叙事中。通过引入行业标准词汇与概念模型，可以更精确地阐释并指导从被动问答到主动诊断的转型。

1.1 范式转移：增强分析的兴起

数据应用智能体的一个关键演进方向，是从一个响应式的数据查询工具，演进为一个主动式的诊断分析平台。这一愿景的核心，正是行业先驱Gartner所定义的**增强分析（Augmented Analytics）**范式 1。增强分析的核心思想是利用人工智能（AI）和机器学习（ML）技术，自动化整个数据分析生命周期，涵盖数据准备、洞察发现、洞察生成和解释说明，从而彻底改变分析的构建、消费和共享方式 1。

要理解这一转变的深刻性，必须回顾商业智能的演进路径 2：

传统BI（Traditional BI）

自助式BI（Self-Service BI）

增强分析（Augmented Analytics）

这一演进的终极目标是实现真正意义上的数据民主化（Data Democratization）。数据民主化不仅意味着让普通用户能够访问数据——高级的自助式BI工具已经做到了这一点——更重要的是，它旨在自动化那些解读数据所必需的复杂分析技能，从而减少组织对少数数据科学家或高级分析师的依赖 1。这种产品转型，本质上是从赋予用户“钓鱼的能力”（自助式BI），升级为构建一个能自动“捕鱼并烹饪好”的智能系统（增强分析）。

这种转变不仅仅是功能的增加，而是一次根本性的产品哲学演进。它要求系统的工作流从被动的、由用户提问触发的模式，转变为主动的、由数据变化触发的模式。这意味着需要构建的不仅仅是一个查询引擎，而是一个具备持续监控、自动探索和智能叙事能力的完整智能体。

1.2 引入诊断式分析：回答“为什么”的核心引擎

当智能体需要主动探究“GMV下降”等现象的原因时，这一诉求精准地指向了商业分析的四大类型中的第二种：诊断式分析（Diagnostic Analytics）。这四种分析类型共同构成了数据驱动决策的完整光谱 6：

描述性分析（Descriptive Analytics）

诊断式分析（Diagnostic Analytics）

预测性分析（Predictive Analytics）

处方性分析（Prescriptive Analytics）

诊断式分析是连接“观察到现象”（例如GMV下降）与“采取有效行动”之间的关键桥梁。它超越了对问题表象的描述，致力于识别那些隐藏在数据之下的驱动因素（drivers）和根本原因（root causes）6。一个无法回答“为什么”的分析系统，其商业价值是有限的；而一个能够自动进行诊断式分析的系统，将成为企业运营的“智能预警与诊断中心”。

1.3 自动化根因分析（RCA）框架

根因分析（Root Cause Analysis, RCA）是一种用于识别问题根本原因的系统化方法论 11。构建一个能够

自动化执行RCA流程的智能体，可以借鉴并改造经典的RCA框架 12：

问题定义/检测（Define/Detect the Problem）

异常检测算法

数据收集（Collect Data）

程序化地

识别因果因素（Identify Causal Factors）

自动生成并检验假设

确定并排序根因（Determine & Rank Root Causes）

量化

沟通发现（Communicate the Findings）

这一自动化RCA的构想并非空中楼阁。在IT运维（IT Operations）和商业智能领域，已经涌现出如Splunk、Sisu、Anodot和ThoughtSpot等成熟的商业平台，它们的核心价值之一就是围绕IT系统日志或业务指标，实现自动化的根因分析 12。这充分验证了这一技术方向的可行性和巨大的商业潜力。最终，这样的产品将服务于一类全新的用户——“增强型消费者（Augmented Consumer）”。他们不再是需要主动提问的分析师，而是直接消费由AI主动推送的、经过深度分析的洞察的业务决策者 2。Gartner甚至预测，到2025年，企业将逐渐摒弃传统仪表盘，转向由系统自动、动态生成的洞察 5。这预示着产品交互形态的根本性变革，从查询与图表的界面，演变为类似信息流（Feed）的叙事性洞察推送，正如Tableau Pulse等前沿产品所展示的那样 17。

2.0 主动智能的架构基石

在深入探讨驱动诊断分析的复杂算法之前，必须首先奠定一个坚实、可靠的架构基础。本章将详细阐述实现主动智能所必需的架构前提。其中，最关键的技术决策是构建一个集中式的指标层（Metrics Layer）。它不仅是技术实现的基石，更是确保整个系统可扩展、可维护、可信赖的命脉所在。

2.1 关键枢纽：为什么指标层至关重要

在任何一个数据驱动的组织中，都存在一个普遍而棘手的难题：指标定义的不一致性。例如，“活跃用户”的定义，在市场部的报告中可能是“过去7天内登录的用户”，而在产品部的分析里则可能是“过去7天内完成核心操作的用户”。当这些定义分散在各个BI工具、代码脚本甚至分析师的大脑中时，就会导致“同名不同义”的混乱，严重侵蚀数据和分析结果的可信度 19。一个期望自动诊断“会员销售额下降”的智能体，如果连“会员销售额”的精确、统一的定义都无法获取，那么其后续的所有分析都将是建立在流沙之上。

指标层（也常被称为语义层 (Semantic Layer) 或 无头BI (Headless BI)）正是为了解决这一根本性问题而生。它是一个位于数据仓库和所有下游数据应用（如BI仪表盘、数据科学模型、以及智能体）之间的集中式服务层 19。

指标层的核心功能包括 19：

集中化定义（Centralized Definition）

维度与关系建模（Dimension & Relationship Modeling）

查询转译与执行（Query Translation & Execution）

对于自动化诊断智能体而言，指标层是其赖以生存的基础。智能体的诊断流程始于程序化地、结构化地探索数据。它需要能够像API调用一样，向一个可靠的服务发问：“GMV的权威定义是什么？”、“GMV有哪些可以用于分析的维度？”、“请返回过去7天按‘用户等级’细分的GMV数据”。指标层正是提供这一系列API，从而使自动化、结构化探索成为可能 22。没有指标层，智能体将不得不在混乱的、未经定义的原始数据表上进行猜测，这在工程上是脆弱且不可持续的。

2.2 框架选型：dbt Semantic Layer vs. Cube.js

构建指标层并非需要从零开始。社区已经涌现出两个领先的、成熟的开源框架：dbt Semantic Layer 和 Cube.js。它们都致力于将“指标即代码（Metrics as Code）”的理念付诸实践，但实现路径和侧重点有所不同。

2.2.1 dbt Semantic Layer

核心理念

架构组件

实现方式

2.2.2 Cube.js

核心理念

架构组件

实现方式

2.2.3 技术选型对比与建议

开发团队需要在这两个框架中做出关键的技术抉择。这个决策将深刻影响后续的开发流程和系统架构。以下表格提供了一个结构化的对比，以辅助决策。

表1：指标层框架选型对比

特性	dbt Semantic Layer	Cube.js	选型建议
核心范式	与数据转换深度集成，指标定义是转换流程的自然延伸。	独立的、API优先的通用指标层，与数据转换解耦。	若团队的数据转换逻辑已全面采用dbt，dbt Semantic Layer是无缝衔接的选择。
定义语言	YAML	JavaScript / YAML	YAML更简洁，但JavaScript提供了更强的编程灵活性和动态定义能力。
性能优化	主要依赖底层数据仓库的性能。	拥有先进的多层缓存和预聚合引擎（Cube Store），可实现极致查询性能。	若应用场景对查询延迟有极高要求（如面向客户的实时分析），Cube.js的性能优势更显著。
集成能力	与dbt生态无缝集成，通过API连接下游工具。	广泛兼容各类数据源和前端框架，提供丰富的API和SDK。	若需为多种异构应用（BI、AI、内部应用）提供统一指标服务，Cube.js的通用性更强。
生态与部署	dbt Cloud平台的一部分，由dbt Labs维护。	拥有活跃的开源社区和商业化的Cube Cloud托管服务。	dbt Cloud提供了一体化的开发体验。Cube.js则提供了更灵活的私有化部署选项。
最适用场景	已经深度使用dbt进行数据建模和转换的团队。	需要为多个应用构建一个高性能、通用的指标中心，或对查询延迟有严苛要求的团队。	选型应综合评估团队现有的技术栈、性能需求和未来的应用场景。

采纳指标层，意味着开发团队将从根本上转向“分析即代码（Analytics as Code）”的开发模式。指标定义将像软件代码一样，被存储在Git中，通过代码审查（Code Review）、自动化测试和CI/CD流水线进行管理和部署 19。这虽然对团队的工程能力提出了更高要求，但它带来的严谨性、可复用性和可靠性，是构建一个企业级智能分析代理的必要条件。

2.3 演进后的高阶系统架构

基于以上讨论，一个分层的、面向未来的系统架构，可以支撑从“被动查询”到“主动智能”的演进。

图1：演进后的高阶系统架构（文字描述）

数据平面（Data Plane）

定义与转换平面（Definition & Transformation Plane）

dbt

指标层（Metrics Layer）

dbt Semantic Layer

Cube.js

智能平面（Intelligence Plane）- “诊断引擎”

主动监控模块（Proactive Monitoring Module）

异常检测模块（Anomaly Detection Module）

根因分析模块（RCA Module）

应用与呈现平面（Application & Presentation Plane）

LLM叙事模块（LLM Storytelling Module）

主动洞察分发（Proactive Insight Delivery）

被动式NLQ接口（Reactive NLQ Interface）

指标层

这个架构的设计体现了“关注点分离”的原则。智能平面的复杂诊断逻辑，与指标层的业务定义逻辑，以及底层数据的物理存储结构，三者完全解耦。这种模块化的设计，使得整个系统更加健壮、灵活，并且易于维护和迭代。同时，它也揭示了新系统的一个核心特征：它是一个“永远在线（always-on）”的、类似AIOps（AI for IT Operations）的工作流 32。这与传统BI工具的请求-响应模式截然不同，对系统的基础设施、可靠性和自身的监控能力都提出了更高的要求。

3.0 诊断引擎：核心算法与方法论

本章将深入剖析“智能平面”的技术内涵，将其拆解为三个协同工作的核心模块。我们将详细介绍每个模块的目标、工作流程，并对关键算法和可用的Python库进行深度剖析，提供一份可执行的技术蓝图。这一系列算法的组合，构成了从“发现问题”到“定位原因”的完整自动化分析链条。

3.1 模块一：主动监控与异常检测（触发器）

3.1.1 目标与流程

此模块是整个诊断流程的起点和“哨兵”。其核心目标是持续、自动地监控在指标层中定义的关键KPI，并能在指标发生显著偏离其正常行为模式时，可靠地发出预警，从而触发后续更深层次的诊断分析。

工作流程：

数据获取

序列构建

异常检测

信号触发

3.1.2 算法深度剖析

选择合适的异常检测算法至关重要，因为误报（将正常波动识别为异常）会造成“警报疲劳”，而漏报（未能识别出真实问题）则会使系统失去价值。不存在一种万能的算法，实际应用中往往需要根据KPI的特性选择或组合多种算法。

统计模型（适用于基线和可解释性强的场景）：

ARIMA/SARIMA (自回归积分移动平均模型)

优点

缺点

Python库

Facebook Prophet (先知模型)

优点

缺点

Python库

机器学习模型（适用于复杂和高维场景）：

Isolation Forest (孤立森林)

优点

缺点

Python库

LSTM (长短期记忆网络)

优点

缺点

Python库

3.1.3 算法选型指南

为工程团队提供一个清晰的决策框架至关重要。

表2：异常检测算法选型指南

算法	核心原理	季节性/趋势处理	数据要求	可解释性	关键Python库
ARIMA	过去值和过去误差的线性组合	通过差分处理趋势，通过季节性差分(SARIMA)处理单一季节性	中等，要求序列平稳或可平稳化	高，参数有明确统计意义	statsmodels
Prophet	趋势、季节性、节假日的加法模型	内置自动处理多重季节性和非线性趋势	低，对缺失值和异常值鲁棒	高，各成分可分解可视化	prophet
Isolation Forest	通过随机分割孤立异常点	不直接处理时间依赖性，视每个点为独立样本	低，无分布假设，适合高维数据	中，可解释特征重要性，但孤立过程本身复杂	scikit-learn, PyOD
LSTM	学习序列中的长期非线性依赖关系	通过网络结构隐式学习，无需显式处理	高，需要大量数据进行训练	低（黑箱模型）	TensorFlow, PyTorch

实施建议：
推荐采用一种混合策略。对于绝大多数商业KPI（如销售额、用户数、转化率），将Prophet作为默认的首选算法。它的自动化程度、对商业数据模式的良好拟合以及直观的可解释性，使其成为构建可靠基线的理想选择 40。对于需要检测非时序数据中的异常（例如，在一批用户中寻找异常消费行为的群体），
Isolation Forest是一个高效的选择。而LSTM则可以作为“攻坚武器”，保留给那些价值极高、数据量巨大且模式极其复杂的少数核心指标，在这些场景下，极致的准确率比可解释性和计算成本更重要。

3.2 模块二：自动化根因探索（假设生成）

3.2.1 目标与流程

当模块一发出“GMV在昨天下降了15%”的警报后，模块二的职责是自动、系统地进行探索，回答“哪些因素与这次下降有关？”。它的目标不是给出最终的因果结论，而是通过快速、广泛的关联分析，生成一个有数据支持的、按重要性排序的候选假设列表。

工作流程：

接收信号

查询元数据

自动化分段贡献度分析（Automated Segmentation/Drill-Down）

例如

降幅最大

贡献度最高

关键驱动因素分析（Key Driver Analysis, KDA）

核心技术：Shapley值回归（Shapley Value Regression）

Python库

关联规则挖掘（Association Rule Mining）

例如

Python库

输出假设列表

假设1（贡献度最高）

假设2（驱动因素最强）

假设3（相关性最强）

假设4（隐藏关联）

3.3 模块三：高级因果推断（假设验证）

3.3.1 目标与挑战

模块二提供了强有力的“相关性”线索，但“相关不等于因果”（Correlation is not causation）是数据分析的第一准则。例如，冰淇淋销量下降与防晒霜销量下降高度相关，但根本原因并非二者相互影响，而是季节变化这个“混淆变量（Confounder）”在同时影响它们 52。模块三的目标，就是利用**因果推断（Causal Inference）**的严谨框架，尽可能地从观测数据中分离出真正的“因果关系”，对模块二提出的最重要假设进行验证。这是回答“为什么”的终极一步。

3.3.2 因果推断框架与工具

DoWhy

建模（Model）

因果图（Causal Graph）

识别（Identify）

估计（Estimate）

反驳（Refute）

CausalML

条件平均处理效应（Conditional Average Treatment Effect, CATE）

CATE回答的问题是：“某个干预（Treatment）对不同的人（具有不同特征X）所产生的因果效应是否不同？”。例如，一次降价促销活动，对价格敏感的新用户和对品牌忠诚的老用户所产生的购买提升效应（causal effect）可能是完全不同的。CausalML中的算法（如Meta-Learners, Causal Forest）非常适合解决这类个性化的因果效应评估问题 57。

3.3.3 在根因分析中的应用

让我们通过一个具体场景来理解模块三如何工作：

场景

因果问题

导致

应用DoWhy进行验证

建模

识别与估计

输出结论

导致

这一系列从检测到关联再到因果的自动化流程，构成了一个强大的诊断引擎。它并非单一算法的堆砌，而是一个模仿、甚至超越人类分析师思维过程的、多阶段、分层次的智能系统。这个系统深度依赖于预先编码的业务知识（指标定义、维度关系、因果结构），这凸显了其并非一个完全脱离人类的“黑箱”，而是一个将人类领域专家的智慧与机器的计算能力相结合的“人机协作”系统。其产出也非确定性的“真理”，而是带有置信区间的概率性结论，这一点对于设计最终的用户交互界面至关重要。

4.0 应用层：沟通洞察与驱动行动

诊断引擎的强大分析能力，最终需要通过一个清晰、可信、可操作的界面，传递给业务决策者，才能真正实现其商业价值。本章将聚焦于这“最后一公里”的挑战：如何将复杂的统计输出，转化为引人入胜的商业故事，并设计一个能够驱动用户采取行动的应用体验。

4.1 从数字到叙事：利用LLM实现自动化数据故事

4.1.1 挑战：分析结果的“不可读性”

诊断引擎的产出是一系列结构化的、精确的但对非技术用户而言却晦涩难懂的统计数据。例如，一份原始的分析报告可能是这样的：

2.10 ±

直接将这些信息呈现给销售总监或市场经理是无效的。他们需要的是一个连贯的、有逻辑的、聚焦于商业影响的故事。

4.1.2 解决方案：LLM作为“翻译与综合层”

这里的核心思想是，不让大语言模型（LLM）执行核心的、高风险的定量分析（因为LLM在复杂计算上并不可靠，容易产生“幻觉”），而是利用其强大的自然语言理解和生成能力，扮演一个高级“翻译官”和“故事讲述者”的角色 59。我们依赖于前述章节中严谨的、可验证的统计与因果推断引擎来保证分析的

准确性，然后利用LLM来保证最终洞察的可读性。

实施流程：

设计结构化提示（Structured Prompting）

向LLM输入上下文

初始异常

核心发现

因果证据

相关数据

赋予LLM任务

4.1.3 叙事化输出示例

基于上述流程，LLM可能生成如下的叙事性洞察：

主题：7月27日GMV下降15%的根因分析报告

核心结论：昨天公司GMV出现15%的显著下滑，我们的诊断引擎分析表明，其根本原因在于北美地区的‘钻石会员’群体的购买行为出现异常。

支撑分析：

主要影响群体

关键驱动因素

因果验证

建议关注：建议产品和技术团队立即排查北美地区‘钻石会员’用户在昨天的网站访问日志，重点关注是否存在登录、支付或页面加载等环节的错误或性能瓶颈。

这种混合架构，结合了传统统计方法的严谨性和LLM的表达能力，是目前构建可信赖的自动化洞察系统的最有效路径。

4.2 用户体验设计：主动式洞察信息流

随着系统从被动查询工具演变为主动洞察引擎，其核心用户界面（UI）也必须随之进化。传统的数据仪表盘（Dashboard）要求用户自己去“看”和“找”问题，而新的范式则要求系统主动将问题和答案“推送”给用户 5。

设计灵感源自Tableau Pulse：
可以借鉴Tableau Pulse等前沿产品的设计理念，构建一个以“洞察”为中心的用户体验 17。

个性化洞察摘要（Personalized Digests）

洞察探索页面（Insights Exploration Page）

可追溯的证据

展示触发分析的原始异常图表（例如，GMV的时间序列图，并高亮异常点）。展示关键的支撑图表（例如，按地区或客户等级下钻的对比条形图）。以清晰的方式展示分析的置信度、p值等统计学指标，甚至可以展示分析所依据的因果图模型。

人机回环（Human-in-the-Loop）反馈机制

优化LLM提示词，使其生成更符合用户偏好的叙事风格。作为强化学习的信号，调整诊断引擎中各算法的权重和参数，使其未来能发现更相关的洞察。帮助数据团队识别并修正因果图或指标定义中的错误 63。

这种设计的核心是建立信任。一个主动推送“结论”的AI系统，天然会受到用户的审视和怀疑。只有当每一个结论都伴随着清晰、可回溯的证据，并且系统能够从用户的反馈中学习和进步时，用户才会逐渐信任并依赖这个智能体 63。

4.3 AIOps的闭环：从洞察到行动

一个真正高级的智能体，不应止步于“报告问题”。其终极形态是能够连接洞察与行动，形成一个自动化的问题解决闭环。这一理念在IT运维领域的AIOps（AI for IT Operations）平台中体现得最为充分 32。

应用场景示例：
假设诊断引擎发现，某次网站转化率下降的根本原因是某个核心API的响应时间（response time）急剧增加。系统可以根据预设的规则，执行下一步动作：

智能告警（Intelligent Alerting）

自动化修复（Automated Remediation）

虽然全自动化的修复是一个长远目标，但在架构设计之初就应考虑到与外部工作流工具（如Jira, Slack, Jenkins等）的集成能力。通过API的连接，数据应用智能体将能够从一个“分析师”，进化为一个真正的“运营副驾”，深度嵌入到企业的业务流程中，实现从数据洞察到业务价值的最短路径。

5.0 实施路线图

将一个宏大的技术愿景转化为可执行的工程项目，需要一个清晰、分阶段的实施路线图。本章将综合前述所有分析，提供一个务实的、循序渐进的开发计划，并总结推荐的技术栈和需要关注的关键挑战。

5.1 分阶段实施策略

建议将整个演进过程分解为四个逻辑清晰、循序渐进的阶段。每个阶段都有明确的目标和产出，并且都能在前一阶段的基础上立即产生业务价值。

第一阶段：奠定基石 - 构建指标层

此阶段是整个项目的基石，其质量直接决定了上层智能应用的成败。

技术选型

表1

定义核心指标

重构现有工具

阶段价值

第二阶段：主动预警 - 部署异常检测

在拥有了可靠的指标层之后，开始构建主动发现问题的能力。

实现监控服务

部署基线算法

优先实现并部署Prophet算法

构建告警系统

阶段价值

第三阶段：自动探索 - 集成驱动因素分析

在能够自动发现“什么”出问题后，开始构建自动分析“为什么”的初步能力。

实现自动化分段

集成关键驱动因素分析

开发初步叙事能力

阶段价值

第四阶段：高级智能 - 引入因果推断与LLM叙事

这是通往真正“智能体”的最后一步，也是一个需要持续投入和优化的阶段。

构建因果图

实施因果验证

集成LLM叙事

最终价值

5.2 技术栈概览

指标层 (Metrics Layer)

dbt Semantic Layer

Cube.js

异常检测 (Anomaly Detection)

prophet

scikit-learn / PyOD

驱动因素分析 (Driver Analysis)

pandas

shap

mlxtend

因果推断 (Causal Inference)

dowhy

CausalML

叙事生成 (Narrative Generation)

OpenAI GPT系列, Anthropic Claude系列, Google Gemini系列

数据仓库 (Data Warehouse)

Snowflake, Google BigQuery, Amazon Redshift

任务编排 (Orchestration)

Airflow

Dagster

5.3 关键挑战与应对策略

在实施过程中，可能会遇到以下挑战：

挑战1：数据质量与治理

风险

应对策略

挑战2：模型可解释性与用户信任（“黑箱”问题）

风险

应对策略

算法选择

XAI技术

透明化设计

挑战3：计算成本

风险

应对策略

分层计算

性能优化

智能触发

挑战4：对领域知识的依赖

风险

应对策略

增强人类智能（Augmented Intelligence）

引用的著作

www.yellowfinbi.com/blog/what-i…

www.tableau.com/analytics/w…

en.wikipedia.org/wiki/Augmen…

www.sap.com/products/ar…

www.anodot.com/blog/what-i…

www.netsuite.com/portal/reso…

sawtoothsoftware.com/resources/b…

www.thoughtspot.com

www.thoughtspot.com/data-trends…

www.rudderstack.com/learn/data-…

amplitude.com/explore/ana…

kpidepot.com/kpi/root-ca…

www.splunk.com/en_us/blog/…

www.projectmanager.com/blog/root-c…

www.veracode.com/verified/di…

www.thoughtspot.com/data-trends…

www.anodot.com/

www.h2kinfosys.com/blog/introd…

www.tableau.com/products/ta…

atlan.com/metrics-lay…

www.metabase.com

www.metabase.com/community-p…

www.ssp.sh/brain/seman…

www.tableau.com/blog/what-i…

atlan.com/dbt-semanti…

docs.getdbt.com/docs/use-db…

docs.getdbt.com/guides/sl-s…

docs.getdbt.com/docs/use-db…

learn.getdbt.com/courses/sem…

iconflux.com/blog/cubejs…

cube.dev/learn

cube.dev/docs/produc…

www.splunk.com/en_us/blog/…

itrex-group.medium.com/aiops-for-y…

www.logicmonitor.com/blog/what-i…

neptune.ai/blog/arima-…

par.nsf.gov/servlets/pu…

medium.com/@futransolu…

neptune.ai/blog/arima-…

www.geeksforgeeks.org/deep-learni…

medium.com/@reza.rajab…

neptune.ai/blog/anomal…

www.researchgate.net/publication…

www.kscst.org.in/spp/47_seri…

medium.com/@adnan.mazr…

blog.gopenai.com/anomaly-det…

www.displayr.com/what-is-dri…

sprouts.ai/glossary/ke…

medium.com/@divyanaran…

www.appliedaicourse.com/blog/associ…

www.datacamp.com/tutorial/as…

emeritus.org/in/learn/as…

medium.com/@chrisjames…

github.com/py-why/dowh…

causalml.readthedocs.io/en/latest/a…

causalml.readthedocs.io/

medium.com/@pysquad/ca…

aws.amazon.com/blogs/opens…

www.quadratichq.com/blog/using-…

arxiv.org/html/2501.0…

aclanthology.org/2024.emnlp-…

help.tableau.com/current/onl…