先前名為Codeium的AI新創Windsurf周四(5/15)釋出首個模型家族SWE-1,同時標榜這是針對整個軟體工程程序進行最佳化的模型,並不只著重於寫程式。
該公司創立於2021年,早期名為Exafunction,是個GPU虛擬化公司;在意識到生成式AI的潛力之後,藉由既有的基礎設施建立了一個全棧式的AI程式碼撰寫平臺Codeium,並在2022年更名為Codeium;今年再更名為Windsurf,並推出首個模型家族SWE-1。
SWE-1是一個打算完成所有軟體工程程序的概念性驗證模型,Windsurf解釋,閱讀或撰寫程式碼只是軟體工程的一小部分,真正的挑戰在於實現能夠長期擴展的解決方案,該公司的目標是將軟體開發速度提高99%。因此,SWE-1基於Windsurf Editor的用戶互動資料,建立了共享時間軸,以捕捉工程中的不完整狀態與跨表面任務;另也具備流程感知能力,能與人類無縫協作,即時觀察及修正彼此行動。
SWE-1現有3種規格,分別是SWE-1、SWE-1-lite與SWE-1-mini。其中,標準版的SWE-1具備類似Claude Sonnet 3.5等級的工具調用推理能力,但更為便宜;SWE-1-lite則是用來取代該公司既有的軟體開發基礎模型Cascade Base;SWE-1-mini則是最小也最快的模型,用以支援Windsurf Tab的被動式體驗。
離線測試時,在由AI接續半完成任務的Conversational SWE Task基準測試中,SWE-1的表現接近Anthropic的Claude Sonnet 3.5/3.7模型,並優於開源的Deepseek與Qwen;而在端對端的End-To-End SWE Task基準測試中,SWE-1的表現則接近Claude Sonnet 3.7,並勝過Claude Sonnet 3.5與Deepseek V3。
圖片來源/Windsurf
在生產環境中,盲測顯示SWE-1的程式碼貢獻接受度僅次於Claude Sonnet 3.7,但超越Claude Sonnet 3.5;在編輯參與度上則凌駕了Claude Sonnet 3.5/3.7。
Windsurf在去年8月完成1.5億美元的C輪增資,當時公司估值為12.5億美元。