AI & Big Data 07月14日 15:33
AI程式工具降低了資深開發者的生產力
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

一项由独立非营利AI研究机构METR进行的研究表明,资深开发者在使用AI辅助解决编程任务时,反而比未使用AI时多花费19%的时间。这项研究涉及16名经验丰富的开发者,他们完成了246个真实编程任务,并被随机分配到AI辅助组和禁用AI组。研究结果显示,尽管开发者在使用AI后实际效率下降,但他们却主观认为AI提升了效率。METR的研究强调了在实际情境中评估AI工具的必要性,而非仅仅依赖于基准测试和主观印象。

🧐 METR是一家独立的非营利AI研究机构,专注于评估尖端AI模型的能力与风险,其研究结果具有较高的独立性和可信度。此次研究未接受任何AI公司的资金支持,这保证了研究的客观性。

🧑‍💻 研究招募了16名资深开发者,他们平均拥有2.2万颗GitHub星星,且参与开发的开源项目代码量平均超过100万行。研究任务包括修复bug、新功能开发和代码重构等,总计246个任务,每个任务的酬劳为每小时150美元。

⏱️ 研究将开发者随机分配到AI辅助组和禁用AI组。AI辅助组使用Cursor Pro搭配Claude Sonnet,禁用AI组则使用传统IDE。结果显示,使用AI的开发者平均多花费19%的时间,尽管他们原本预估能提升24%的效率。

🤔 尽管任务完成后,开发者实际效率下降,但他们主观上仍认为AI提高了20%的效率。METR认为,开发者对AI工具的效能存在明显的认知偏差,这凸显了在真实环境中进行实测的重要性。

獨立的非營利AI研究機構METR(Model Evaluation & Threat Research)上周公布一研究報告,顯示資深開發者利用AI來協助解決任務時,所花的時間反而多了19%。

METR是個致力於研究與評估尖端AI模型自主能力與潛在風險的非營利研究機構,它強調評估的獨立性及可信度,從未接受來自AI公司的資金,是現今少數可對先進模型部署前執行安全評估的機構之一。

在此次的研究中,METR邀請16名開發人員提供數十個真實且有價值的任務,諸如修復臭蟲、新功能開發或是重構程式碼等,總計有246個任務,並由METR提供每小時150美元的酬勞。此外,這些開發人員平均擁有2.2萬顆GitHub星星,所開發或貢獻的開源專案平均超過100萬行程式碼。

之後由METR隨機將這些任務分配至AI組及禁用AI組,收到前者的開發人員多半利用Cursor Pro搭配Claude Sonnet,後者則使用傳統IDE,禁用AI輔助工作流程,且每位開發人員都必須錄製螢幕畫面,同時自行回報所花費的時間。

值得注意的事是,開發者在任務開始前原本預期使用AI能讓速度提升24%,但實際上,使用AI後平均反而多花了19%時間。更有趣的是,即使任務已經完成、實作明顯變慢,他們仍主觀認為AI讓自己快了20%。這些任務的平均實作時間約為2小時。

METR認為,傳統的基準測試常常為了效率或可評估性而弱化了真實性,因此難以對應AI工具及實務中的實際效益,另一方面,開發人員對AI工具的效能存在明顯的認知偏差,若要真實掌握AI於部署環境中的影響,未來應仰賴更多具現場情境的實測研究,而非僅依賴基準測試及主觀印象。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI 编程 效率 METR 开发者
相关文章