Cnbeta 07月12日 08:15
研究表明AI编程工具可能无法加速每个开发人员的速度
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

近期,METR的一项研究引发关注,探讨了AI编程工具对经验丰富的开发人员效率的影响。研究发现,允许使用AI工具反而使任务完成时间增加了19%。这与开发者原先预期的24%的效率提升大相径庭。研究指出,开发者在使用AI工具时,花费了更多时间进行提示和等待响应,且AI在处理大型复杂代码库时表现不佳。尽管如此,研究人员并未完全否定AI工具的潜力,并强调AI技术仍在快速发展。这项研究为我们审视AI编程工具的实际效用提供了新的视角。

💡 研究背景:METR进行了一项随机对照试验,旨在评估AI编程工具对经验丰富的开源开发者的效率影响。研究招募了16位开发者,让他们在大型代码库中完成真实任务。

⏳ 实验结果:令人惊讶的是,允许使用AI工具反而使任务完成时间增加了19%,与开发者预期的效率提升背道而驰。这表明,AI工具在某些情况下可能并未提高开发效率。

🔍 潜在原因:研究人员指出,开发者在使用AI工具时,花费更多时间进行提示和等待响应,而非实际编程。此外,AI在处理大型复杂代码库时也面临挑战。

⚠️ 研究局限:研究人员强调,他们的结论并非否定AI工具的潜力,并指出AI技术仍在快速发展。他们谨慎地避免从这些发现中得出任何强有力的结论。

近年来,Cursor和 GitHub Copilot 等 AI 编程工具的涌现改变了软件工程师的工作流程,它们可以通过自动编写代码、修复错误和测试更改来提高生产力。这些工具由 OpenAI、Google DeepMind、Anthropic 和 xAI 的 AI 模型提供支持,近年来在一系列软件工程测试中的表现迅速提升。

然而,非营利性人工智能研究组织 METR 周四发布的一项新研究对当今的人工智能编程工具在多大程度上提高了经验丰富的开发人员的工作效率提出了质疑。

METR 为这项研究进行了一项随机对照试验,招募了 16 位经验丰富的开源开发者,并让他们在自己定期贡献的大型代码库中完成 246 项真实任务。研究人员将其中大约一半的任务随机分配为“允许 AI 执行”,允许开发者使用 Cursor Pro 等最先进的 AI 编程工具,而另一半任务则禁止使用 AI 工具。

在完成分配的任务之前,开发人员预测使用AI编程工具可以将完成时间缩短24%。但事实并非如此。

研究人员表示:“令人惊讶的是,我们发现允许使用人工智能实际上会使完成时间增加 19%——开发人员在使用人工智能工具时速度会更慢。”

值得注意的是,研究中只有 56% 的开发人员有使用 Cursor(研究中提供的主要 AI 工具)的经验。尽管几乎所有开发人员(94%)都曾在其编程工作流程中使用过一些基于 Web 的 LLM,但本次研究是一些开发人员首次专门使用 Cursor。研究人员指出,开发人员在准备研究时接受了 Cursor 使用方面的培训。

然而,METR 的研究结果对 2025 年人工智能编程工具所承诺的普遍生产力提升提出了质疑。根据这项研究,开发人员不应认为人工智能编程工具(特别是后来被称为“氛围编程器”)会立即加快他们的工作流程。

METR 研究人员指出了 AI 减慢开发者速度而非加速他们速度的几个潜在原因:使用AI编程工具时,开发者花费更多时间提示 AI 并等待其响应,而不是实际进行编程。此外,AI 也往往难以应对大型复杂代码库,而本次测试正是针对此类代码库进行的。

该研究的作者谨慎地避免从这些发现中得出任何强有力的结论,并明确指出,他们并不认为人工智能系统目前无法加快许多或大多数软件开发人员的开发速度。其他大规模研究表明,人工智能编程工具确实可以加快软件工程师的工作流程。

作者还指出,近年来人工智能取得了长足进步,他们预计即使三个月后也不会出现同样的结果。METR 还发现,近年来人工智能编程工具完成复杂、长期任务的能力显著提升。

然而,这项研究又提供了另一个理由,让人们对人工智能编程工具所承诺的益处持怀疑态度。其他研究表明,当今的人工智能编程工具可能会引入错误,在某些情况下还会带来安全漏洞

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI编程 效率 软件开发 METR研究
相关文章