AI程式工具降低了資深開發者的生產力

AI & Big Data 07月14日 15:33

AI程式工具降低了資深開發者的生產力

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

一项由独立非营利AI研究机构METR进行的研究表明，资深开发者在使用AI辅助解决编程任务时，反而比未使用AI时多花费19%的时间。这项研究涉及16名经验丰富的开发者，他们完成了246个真实编程任务，并被随机分配到AI辅助组和禁用AI组。研究结果显示，尽管开发者在使用AI后实际效率下降，但他们却主观认为AI提升了效率。METR的研究强调了在实际情境中评估AI工具的必要性，而非仅仅依赖于基准测试和主观印象。

🧐 METR是一家独立的非营利AI研究机构，专注于评估尖端AI模型的能力与风险，其研究结果具有较高的独立性和可信度。此次研究未接受任何AI公司的资金支持，这保证了研究的客观性。

🧑‍💻 研究招募了16名资深开发者，他们平均拥有2.2万颗GitHub星星，且参与开发的开源项目代码量平均超过100万行。研究任务包括修复bug、新功能开发和代码重构等，总计246个任务，每个任务的酬劳为每小时150美元。

⏱️ 研究将开发者随机分配到AI辅助组和禁用AI组。AI辅助组使用Cursor Pro搭配Claude Sonnet，禁用AI组则使用传统IDE。结果显示，使用AI的开发者平均多花费19%的时间，尽管他们原本预估能提升24%的效率。

🤔 尽管任务完成后，开发者实际效率下降，但他们主观上仍认为AI提高了20%的效率。METR认为，开发者对AI工具的效能存在明显的认知偏差，这凸显了在真实环境中进行实测的重要性。

獨立的非營利AI研究機構METR（Model Evaluation & Threat Research）上周公布一研究報告，顯示資深開發者利用AI來協助解決任務時，所花的時間反而多了19%。

METR是個致力於研究與評估尖端AI模型自主能力與潛在風險的非營利研究機構，它強調評估的獨立性及可信度，從未接受來自AI公司的資金，是現今少數可對先進模型部署前執行安全評估的機構之一。

在此次的研究中，METR邀請16名開發人員提供數十個真實且有價值的任務，諸如修復臭蟲、新功能開發或是重構程式碼等，總計有246個任務，並由METR提供每小時150美元的酬勞。此外，這些開發人員平均擁有2.2萬顆GitHub星星，所開發或貢獻的開源專案平均超過100萬行程式碼。

之後由METR隨機將這些任務分配至AI組及禁用AI組，收到前者的開發人員多半利用Cursor Pro搭配Claude Sonnet，後者則使用傳統IDE，禁用AI輔助工作流程，且每位開發人員都必須錄製螢幕畫面，同時自行回報所花費的時間。

值得注意的事是，開發者在任務開始前原本預期使用AI能讓速度提升24%，但實際上，使用AI後平均反而多花了19%時間。更有趣的是，即使任務已經完成、實作明顯變慢，他們仍主觀認為AI讓自己快了20%。這些任務的平均實作時間約為2小時。

METR認為，傳統的基準測試常常為了效率或可評估性而弱化了真實性，因此難以對應AI工具及實務中的實際效益，另一方面，開發人員對AI工具的效能存在明顯的認知偏差，若要真實掌握AI於部署環境中的影響，未來應仰賴更多具現場情境的實測研究，而非僅依賴基準測試及主觀印象。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签