SWE-Bench_Fishai

热点

"SWE-Bench" 相关文章

[程序员] AI 评测指北： Vibe Coding 哪家强？ Benchmark 搞一把

V2EX 2025-07-28T07:38:48.000000Z

[程序员] AI 评测指北： Vibe Coding 哪家强？ Benchmark 搞一把

V2EX 2025-07-28T06:47:43.000000Z

[程序员] AI 评测指北： Vibe Coding 哪家强？ Benchmark 搞一把

V2EX 2025-07-28T05:07:44.000000Z

Benchmarks for AI in Software Engineering

Communications of the ACM - Artificial Intelligence 2025-07-24T16:13:44.000000Z

Kimi新模型拿下代码开源SOTA，仅仅72B，发布即开源

智源社区 2025-06-18T01:27:54.000000Z

Darwin Gödel Machine: A Self-Improving AI Agent That Evolves Code Using Foundation Models and Real-World Benchmarks

MarkTechPost@AI 2025-06-06T17:40:45.000000Z

【Code Agent Benchmark】论文分享No.13：SWE-bench

掘金人工智能 2025-05-27T02:38:01.000000Z

SWE-Bench Performance Reaches 50.8% Without Tool Use: A Case for Monolithic State-in-Context Agents

MarkTechPost@AI 2025-05-18T03:10:40.000000Z

Augment Code 深度评测：是下一个 Cursor，还是昙花一现的 SWE-BENCH 冠军？

掘金人工智能 2025-04-18T10:57:52.000000Z

Augment Code Released Augment SWE-bench Verified Agent: An Open-Source Agent Combining Claude Sonnet 3.7 and OpenAI O1 to Excel in Complex Software Engineering Tasks

MarkTechPost@AI 2025-04-04T20:35:28.000000Z

2024 in Agents [LS Live! @ NeurIPS 2024]

Latent 2025-01-15T06:34:57.000000Z

The new Claude 3.5 Sonnet, Computer Use, and Building SOTA Agents — with Erik Schluntz, Anthropic

Latent 2025-01-15T06:34:57.000000Z

Z Potentials｜王星尧，99年博士创业AI编程，获Anthropic投资，全球权威榜单第一，解决过半编程问题

Z Potentials 2025-01-06T07:30:37.000000Z

Cognition Reveals Devin the World’s First Fully Autonomous AI Software Engineer

GreatAIPrompts 2024-11-26T06:32:22.000000Z

解决真实GitHub Issue能力登顶，字节豆包MarsCode团队分享背后工程实践，踩过的坑也分享了

智源社区 2024-11-05T07:07:15.000000Z

All Hands AI Open Sources OpenHands CodeAct 2.1: A New Software Development Agent to Solve Over 50% of Real Github Issues in SWE-Bench

MarkTechPost@AI 2024-11-01T16:05:52.000000Z

Is finetuning GPT4o worth it? — with Alistair Pullen, Cosine (Genie)

Latent 2024-10-22T02:56:29.000000Z

再见，Devin，基于GPT-4o，最强”AI工程师“Genie诞生

36kr 2024-08-13T09:18:18.000000Z

Copyright © 2019 FISHAI.All Rights Reserved