总部位于旧金山的初创企业Cognition AI,正试图通过其全新的人工智能助手Devin彻底改变软件工程领域。
这款人工智能助手可以规划和执行复杂的工程任务,并从中学习经验并纠正错误。Devin配备了重要的开发者工具,如shell、代码编辑器和浏览器,Devin在一个沙盒式计算环境中运行,模拟人类开发者的设置。
Cognition AI在一篇博客文章中表示,Devin之所以与众不同,是因为它能够在软件开发过程中与用户积极合作。这包括提供实时进度更新、接受反馈并共同作出设计选择。总的来说,公司声称Devin在软件开发过程中表现出色,是一个无缝的合作伙伴。
Devin的功能多样。它可以学习陌生的技术,从端到端地构建和部署应用程序,自主地发现和修复基于代码的错误,训练和微调其人工智能模型,解决开源存储库中的错误和功能请求,并贡献到成熟的生产存储库。其互联网搜索能力使其能够快速获取教育资源,从而能够有效地解决复杂的任务。
值得注意的是,Devin的能力延伸到了现实世界的任务,它成功完成了在Upwork上的任务。该任务涉及利用计算机视觉技术进行推断,以评估损坏的道路。
就性能而言,Devin已经在SWE-bench基准测试中进行了评估,在解决现实世界的GitHub问题方面表现出色。Devin的端到端解决率达到了13.86%,显著超过了先前1.96%的基准。即使给出精确的文件来编辑,先前的模型也只能解决4.80%的问题,Cognition AI在博客文章中表示。
Cognition的创始人兼CEO Scott Wu在接受彭博采访时强调了教AI成为程序员的复杂性。他强调了Devin在处理软件工程项目的多个步骤时保持专注的能力,突显了其先进的推理和规划能力。
尽管Devin的能力令人兴奋,但行业内也有谨慎的声音。谷歌高级总监Yariv Adan在LinkedIn上指出,软件最近的发展“非常有趣”,将对提供者和用户都产生重大影响。这种观点反映了AI驱动软件开发进步的广泛影响。
另一方面,OpenSea的联合创始人兼前CTO Alex Atallah对Devin的能力表示了兴奋,他在X上的一篇文章中将其描述为第一个感觉像真正有用的人的AI代理。他赞扬了Devin提供状态更新并提供其行动可见性的能力,突出了其为用户提供的独特体验。
“Devin是独特的,是一种解决软件开发周期中遇到的问题和挑战的结构性尝试。它将加速市场推出时间,并帮助开发无错误的alpha版本,从而在短时间内实现稳定的应用程序,”Techarc的首席分析师兼创始人Faisal Kawoosa说道。
Devin的出现标志着向即时行动工程的转变,可能会影响传统软件工程师的角色。虽然这可能导致特定低级工程职位的消失,但也标志着AI行业的演变。
随着AI驱动的技术的不断发展,像Devin这样的AI工作者的角色将在软件开发中变得越来越重要。