原创 Z Potentials 2025-01-13 11:54 北京
Greylock、李飞飞等AI大咖豪掷重金抢位未来
图片来源:Resolve AI
Z Highlights
全球 AI 市场预计在未来几年内将以高速增长。2023 年,全球 AI 市场规模已达到 1966.3 亿美元,并预计到 2030 年市场规模将增长 13 倍以上,尤其是在企业服务和 IT 运维自动化领域。微软、谷歌等大厂已经推出了多种 AI 工具,帮助企业更好地管理员工支持、IT 服务和日常任务。例如,微软通过其 Azure AI 平台和集成到 Microsoft Teams 中的工具,提供了多种自动化服务解决方案,而谷歌则通过 Google Cloud AI 推动企业采用 AI 技术来提升运营效率。
Resolve AI 是一家致力于自动化软件运维的初创公司,由前 Splunk 高管 Spiros Xanthos 和 Mayank Agarwal 创立。公司的愿景是通过 AI 工具大幅减少工程师在生产环境中处理问题的时间,让他们专注于创新。Resolve AI 的主要产品是一款 AI 生产工程师工具,能够自动处理告警、解决生产问题,并优化云成本管理。其产品主要面向软件工程师和运维团队,帮助他们提高系统的可靠性和生产力。
Resolve AI 成立于 2024 年,目前已完成 1 轮融资,共筹集了 3500 万美元资金。公司于 2023 年底完成了最新的种子轮融资,由 Greylock 领投,Unusual Ventures 跟投,其他参与投资的天使投资人包括李飞飞和 Jeff Dean 等
01 睡个好觉:心力交瘁的工程师们
2023 年,全球 AI 市场规模已达到 1966.3 亿美元,并预计从 2024 年到 2030 年将以 36.6% 的复合年增长率持续增长,到 2030 年市场规模将增长 13 倍以上。
图片来源:fortune business insights
在 Resolve AI 的产品诞生前,微软和谷歌的 AI 产品在企业服务领域已经取得了显著进展。微软通过其 Azure AI 平台提供了一系列自动化服务解决方案,帮助企业快速部署智能应用。Azure AI 包含多个预构建的 API 和模型,支持自然语言处理、图像分析、语音识别等功能,能够帮助开发者快速集成 AI 能力到现有系统中。微软将这些 AI 工具集成到 Microsoft Teams 中,通过自动化工作流,如审批流程和信息流转,大幅提升团队协作效率。谷歌的 Google Cloud AI 也提供了类似的服务,尤其是其 Vertex AI 平台,允许开发者构建、训练并部署自定义机器学习模型。谷歌的 AI 工具涵盖了图像识别、自然语言处理和语音转文字等功能,帮助企业在大规模数据处理和复杂计算任务中提高效率。
然而,与这些大厂的 AI 产品相比,Resolve AI 的产品诞生源于软件工程师在生产环境中面临的关键技术挑战和用户痛点,而不仅仅是开发新功能。微软和谷歌的工具更多侧重于协助开发者构建和优化新应用,而 Resolve AI 则聚焦于自动化生产环境中的告警处理、故障排除和系统监控等任务。
随着云计算、微服务架构和分布式系统的普及,企业的 IT 基础设施变得越来越复杂,想象你是一个名叫 Sarah 的软件工程师,拿着不错的薪水,过着体面的生活。但是你的工作强度太大了,越来越在工作中感到身心俱疲。作为资深工程师,你明白实际情况是,除了开发新的软件之外,你每天还要在维护现有系统上花费大量时间。工程师们花费高达 90% 的时间来理解生产代码、维护系统和确保可靠性。这些任务不仅繁琐且耗时,还要求工程师具备深厚的技术背景和对系统的全面了解,尤其是在面对突发问题时,快速响应和解决问题变得至关重要。
传统的运维工具大多依赖于手动操作,无法应对现代复杂系统中的实时问题。这种低效的流程导致了“平均修复时间”(MTTR)过长,影响了系统的稳定性和业务连续性。与此同时,工程师们被迫从创新性开发工作中分心,投入大量时间处理重复性、低价值的任务。正是这些痛点催生了 Resolve AI 的研发方向。
图片来源:Resolve AI on X
02 重获自由:Resolve AI 让你重拾工作热情
Resolve AI 的产品是一款 AI 工程师工具,能够自主排查和解决生产环境中的问题,自动处理告警和运维任务,从而显著减少 MTTR,并让工程师专注于开发工作。
工程师需要依靠多种复杂的工具来诊断问题和修复事件——源代码、CI/CD、基础设施、可观察性、运行手册、聊天等等。执行生产工程任务需要了解所有生产实体之间以及与所有这些工具连接。对于要采取自动化操作的人工智能,它必须能够与所有这些工具集成,为任何一个任务挑选最佳工具,并能够像人类一样使用它们(例如编写查询和阅读图表),同时能够:
适应组织惯例:每个组织(甚至不同的团队)使用不同的工具集,并具有独特的数据惯例(例如,指标名称、日志标签),AI 必须理解和导航惯例。
连接来自多个系统的依赖关系和知识:通过多个工具(例如仪表板、事件报告、CI/CD、基础设施、源代码)准确地将有关服务、部署等的信息和依赖关系组合在一起。
处理规模、限制和实时数据:这些工具拥有大量不断变化的数据。粗暴地用 RAG(Retrieval-Augmented Generation 检索增强生成) 在成本、延迟和质量方面都是行不通的。
服务和底层基础设施不断改变运营行为,而操作手册很少能保持最新。人类能够依靠对系统组成和预期行为的了解,利用他们根据第一原则做出数据驱动决策的能力来克服这一挑战。为了使人工智能能够有效地进行这种多步骤和开放式的交互,它必须:
处理新事件:许多事件都是新的,因此既有模式匹配不起作用。即使是重复的事件通常也有足够的变化,无法概括的人工智能不会有效,更糟糕的是会误导用户。
准确确定因果关系:消除大环境中(甚至同一实体内)始终发生的不相关但暂时局部行为中的噪音。
在遇到新情况时学习:每个系统都有其复杂性,甚至人类也需要时间来学习操作行为。人工智能应该能够在与人类合作时在工作中学习,并有效地进行泛化,这样就不需要在不同环境下对子任务进行相同的指导。
使用工具执行复杂的操作:人工智能应该能够执行复杂的任务,例如加载仪表板、呼叫者页面、按照组织特定的约定应用扩展或配置更改。
基于以上原则, Resolve AI 这样解决你遇到的问题:
图片来源:Resolve AI
1.快速响应告警:在告警触发后的 60 秒内,Resolve AI 会立即做出响应,无论是系统性能下降、服务中断还是安全威胁,都能第一时间介入处理。系统会自动收集相关的监控数据、日志信息和系统指标,并开始初步分析。这种快速响应机制确保了问题能在扩大之前得到及时处理,大大降低了潜在的业务影响。
图片来源:Resolve AI
2.快速评估影响并隔离问题:系统会全面评估事件的影响范围和严重程度,包括受影响的服务组件、用户数量、业务损失等关键指标。通过分析系统依赖关系图和实时监控数据,精确定位问题区域,并评估潜在的连锁反应。同时,系统会建立优先级机制,确保最关键的问题得到最快处理。
图片来源:Resolve AI
3.利用相关数据和工具找到根本原因:利用先进的 AI 技术,系统会自动收集和分析相关的日志、指标和系统状态数据。通过对历史事件数据的对比分析,结合机器学习模型,快速定位问题根源。分析过程会考虑最近的代码变更、配置修改和系统更新等因素,提供全面的问题诊断视图。
图片来源:Resolve AI
4.建议补救措施:基于根因分析结果,系统会提供详细的修复建议和具体的操作步骤。这些建议包括配置调整、代码修复、资源扩展等多个层面的解决方案。对于常见问题,系统能够在获得授权后自动执行修复操作,显著缩短故障修复时间。同时会评估每个修复方案的潜在风险和影响。
图片来源:Resolve AI
5.与工程师合作创建事件后分析并获取关键经验教训:系统会自动生成详细的事件报告,包括完整的时间线、采取的行动、解决方案效果评估等内容。这些文档会被智能分类和标记,便于未来查询和分析。同时,系统会总结关键经验教训,更新知识库,并提供改进建议,帮助团队不断优化事件响应流程,预防类似问题再次发生。
作为能够自主管理运营负担的工具,它能自动分析和处理 80%的告警,使工程师能够在更高级别上操作系统,从而显著提高软件开发和运营的速度和效率。昨晚系统出现了性能下降的告警,但在你醒来查看时,Resolve AI 已经分析出是最近的代码变更导致的问题,并完成了回滚操作。这让你终于可以安心睡个好觉了。
Resolve AI 构建了一个代理平台,可以与 AWS、Kubernetes、可观测性堆栈、GitHub 和 Slack 等工具无缝协作。在处理复杂问题时,Resolve AI 就像一个经验丰富的搭档。它能快速构建起完整的生产环境知识图谱,自动查询日志、分析异常并提供修复建议;同时它还可以回答自然语言查询、将其转换为可观察性操作、集成来自多个平台的数据、测试假设和修复问题。上周遇到的一个棘手问题,它帮你在几分钟内就找到了根因,这在以前可能要花费你几个小时。摆脱了大量运维工作的束缚,你现在可以把更多精力投入到创新性的开发工作中。Resolve AI 接管了日常的运维任务,包括监控系统性能、部署代码和处理告警。这让你能够专注于设计新功能和改进系统架构。
通过与 Resolve AI 的协作,你的技能也在不断提升。它不仅处理问题,还会解释问题的原因和解决方案的原理。你发现自己正在从一个普通的代码编写者,逐渐成长为更全面的系统架构师。现在你能够更好地理解系统的整体架构,并做出更明智的技术决策。这才是你最热爱的工作该有的样子。
图片来源:Resolve AI
03 强大后盾:值得信赖的技术团队
Resolve AI 由 Spiros Xanthos 和 Mayank Agarwal 创立,他们是非常杰出和有成就的连续创业者,他们之前创建过多家公司,其中两次成功退出 VMWare 和 Splunk。最近,他们创立了 Omnition,后被 Splunk 收购,并分别担任总经理和首席架构师,领导可观测性业务。他们还共同创建了 OpenTelemetry,这是采用最广泛的开源可观测项目。他们将可观测性和人工智能方面的专业知识罕见地结合在一起,使他们能够完美地解决这一重要问题,并且他们已经建立了一支令人印象深刻的高级工程团队。来看看 Founder 兼 CEO Spiros Xanthos 如何向我们介绍他的团队:
两位创始人的主要经历如下:
图片来源:LinkedIn
图片来源:LinkedIn
Spiros Xanthos :Resolve AI 创始人兼 CEO
教育背景:
伊利诺伊大学厄巴纳-香槟分校 (University of Illinois Urbana-Champaign),计算机科学硕士,博士未完成 (2004-2007)
马其顿大学 (University of Macedonia),计算机科学学士 (2000-2004)
职业经历:
Splunk: 曾担任高级副总裁兼可观察性业务总经理,领导超过 300 人的团队,负责 IT 运维、基础设施和应用监控等产品线 (2022-2023)。他还曾担任产品管理副总裁,推动 Splunk 的可观察性战略,并主导了多个公司收购和新产品开发。
Omnition: 创始人兼 CEO,专注于分布式追踪平台,后被 Splunk 收购 (2018-2019)
ezhome: 创始人兼 CEO,成功吸引了多轮融资并带领公司快速成长 (2015-2017)
VMware: 研发总监,负责 Log Insight 日志分析平台的策略与执行 (2012-2015)
Pattern Insight: 联合创始人兼 CEO,专注于大数据基础设施产品,后被 VMware 收购 (2007-2012)
Spiros Xanthos 是一位经验丰富的连续创业者,凭借其在软件工程和可观察性领域的深厚积累,展现了卓越的领导力和创新能力。他曾创立多家公司,并成功带领这些公司实现技术突破和商业成功,尤其是在可观察性平台 Omnition 的创建和被 Splunk 收购的过程中,他展示了极强的战略眼光和执行力。
图片来源:LinkedIn
图片来源:LinkedIn
Mayank Agarwal :Resolve AI 创始人兼 CTO
教育背景:
伊利诺伊大学厄巴纳-香槟分校 (University of Illinois Urbana-Champaign),计算机科学博士 (2004-2009)
印度理工学院德里分校 (Indian Institute of Technology, Delhi),计算机科学与工程学士 (2000-2004)
职业经历:
Splunk: 曾担任首席架构师,负责可观察性产品线的技术架构和战略,包括基础设施监控、应用性能监控等多个产品线的开发与整合 (2019-2023)
Omnition: 创始人兼 CTO,与 Spiros Xanthos 一起创建了分布式追踪平台,并共同推动 OpenTelemetry 项目的发展,后被 Splunk 收购 (2018-2019)
VMware: 高级工程师,参与 Log Insight 团队的架构设计和开发工作 (2013-2018)
微软:高级软件开发工程师,在 Bing 和 Azure 基础设施团队工作,帮助构建分布式追踪系统和下一代监控系统 (2009-2013)
Mayank Agarwal 是一位技术实力雄厚的工程师和架构师,在分布式系统和可观察性领域有着深厚的技术背景。他不仅是 Omnition 的联合创始人,还在 Splunk 担任首席架构师,主导了多个关键产品线的技术开发与整合。Agarwal 的职业生涯展现出他在复杂技术问题上的解决能力,以及他在推动大型技术项目中的领导力。
图片来源:Resolve AI
对于成立公司的契机,创始人表示:
Spiros Xanthos:当我领导 Splunk 的可观察性业务时,SRE 团队 90% 的人都因为值班职责而精疲力竭,在六个月内辞职。大多数客户升级都是由于可靠性问题,有时,生产会被冻结数月,以避免停电,从而阻碍创新。人工智能编码助手正在加速编码和功能开发,但这也会使操作复杂性变得更糟。在解决这些运营瓶颈之前,我们无法走得更快。
对于团队成员关系,创始人表示:
Spiros Xanthos:Mayank Agarwal 和我 20 年前在 UIUC 研究生院相识,自 2012 年起就一直在一起工作。从那时起,我们在初创公司和大公司中构建了多代开发和可观察性工具,并创建了 OpenTelemetry 等有影响力的开源项目。此外,这是我们的五位创始团队成员第三次合作,但我们还增加了许多新的队友,他们带来了不同的经验和新技能。我们的共同使命是为工程师提供人工智能工具,帮助他们塑造未来,我们都致力于建立一家将对世界产生持久和积极影响的公司。
04 资本助力:顶级投资机构的青睐与支持
Resolve AI 于 2024 年 10 月完成了一轮 3500 万美元的种子轮融资,此次融资由硅谷知名风投公司 Greylock 领投,Unusual Ventures 参投,还有包括斯坦福教授李飞飞和 Google DeepMind 首席科学家 Jeff Dean 在内的多位天使投资人参与。这是 Greylock 今年最大的一笔投资,之前该公司曾投资过 Airbnb 和 Meta 等科技巨头。
图片来源:crunchbase
Greylock 合伙人 Saam Motamedi 强调,“重新定义软件工程与 AI 的结合可能是生成式 AI 领域最大的机会之一”。Resolve AI 不同于传统的代码生成工具,而是专注于自动化软件运维,解决工程师在生产环境中面临的操作性问题,如告警处理、故障排除和基础设施管理。这些任务不仅耗时,还需要深厚的技术背景。Resolve AI 通过其自动化工具,帮助工程师减少“平均修复时间”(MTTR),从而提高生产力。Greylock 看到这一市场需求,认为 Resolve AI 能够在该领域带来显著的效率提升。
Greylock 的投资策略之一是寻找能够提供“清晰且可量化回报”的公司。Resolve AI 的技术能够显著缩短系统修复时间,并减少工程师的日常操作负担,这种直接且可量化的效率提升使得该公司迅速从概念验证阶段进入到实际生产环境中。这种明确的 ROI 不仅吸引了客户,也让投资者看到了长期的可持续增长潜力。
Resolve AI 的技术不仅限于当前的软件运维自动化,它还计划扩展到事件预防和云成本优化等领域,这些功能将进一步增强其市场竞争力。Greylock 希望通过此次投资,不仅帮助该公司扩展团队规模(计划在年底前将团队人数翻倍),还支持其开发更广泛的 AI 功能,以巩固其在企业服务市场中的领先地位。
References:
https://greylock.com/portfolio-news/introducing-resolve/
https://www.youtube.com/watch?v=bwd2Vy14KNI
https://ResolveAI/blog/product-deep-dive
https://ResolveAI/blog/introducing-resolve-ai
https://ResolveAI/blog/product-deep-dive
https://www.thesaasnews.com/news/resolve-ai-secures-35-million-in-seed-round
https://www.crunchbase.com/organization/resolve-ai
https://www.fortunebusinessinsights.com/zh/industry-reports/artificial-intelligence-market-100114
-----------END-----------
? 我们正在招募新一期的实习生
? 我们正在寻找有创造力的00后创业
关于Z Potentials