在当今科技飞速发展的这个时代,AI涉足到了软件开发领域。这既是一个亮点,也是一个痛点。亮点在于它具备执行多种开发操作的能力,比如可以修改代码,也可以调用 API 等。而痛点则是它的技术还比较新,距离能够承担大型复杂的工程还有很长的距离。它给软件开发带来的这些改变,是值得我们去深入探讨的。
docker pull docker.all-hands.dev/all-hands-ai/runtime:0.13-nikolaik
docker run -it --pull=always
-e SANDBOX_RUNTIME_CONTAINER_IMAGE=docker.all-hands.dev/all-hands-ai/runtime:0.13-nikolaik
-v /var/run/docker.sock:/var/run/docker.sock
-p 3000:3000
-e LOG_ALL_EVENTS=true
--add-host host.docker.internal:host-gateway
--name openhands-app
docker.all-hands.dev/all-hands-ai/openhands:0.13
平台功能概述
这个平台由 AI 驱动,功能十分强大。它的 AI 代理能够承担很多开发人员的工作。比如,在某一实际项目里,当开发人员需要修改代码中的特定部分时,AI 代理能够快速完成。并且,它还可以运行命令,无论是本地环境下的命令,还是网络环境下的命令,都能有效地执行。它还能够浏览网页来获取相关信息,这对于获取开源代码或者了解新技术动态是很有帮助的。用户还可以按照不同的模式来运行平台,像无头模式等,这种方式满足了不同的开发需求。
使用这个平台时,有诸多便捷的操作方式。启动之后,只需设置好大模型便可使用。操作较为简单,借助 UI 中的“设置”按钮就能对相关内容进行调整。若需要特殊的 LLM 模型,通过利用高级选项手动输入即可,并且还能够指定基本 URL,这对于不同网络环境或者特殊模型需求而言是很有帮助的。
代码作业能力
Please write a bash script hello.sh that prints "hello world!"
平台在代码操作方面很有能力。要是需要修改代码,比如把 hello.sh 改成能接受名称作为第一个参数,且默认是“world”,平台能够轻松完成。对于不同的语言,尽管可能需要一些时间来设置环境,但也能顺利地完成任务。在构建应用程序方面,像构建 React 里那种基本的 TODO 列表应用程序,即便之后要添加像给任务添加截止日期这样的功能,也是可以实现的。
Please modify hello.sh so that it accepts a name as the first argument, but defaults to "world"
平台在与现有代码库交互时表现优秀。它能够向现有代码库添加新代码,例如加入新的操作以检查代码。同时,还能很好地利用现有的组件。并且在向.lint.yml 添加新文件等操作上也能准确执行,这对提升代码库的规范性和整体质量有帮助。
Please convert hello.sh to a Ruby script, and run it
绿地任务表现
平台在绿地任务方面的表现很出色。绿地任务指的是那些不需要依赖现有代码库的上下文就能够开展的任务。该平台能够从头开始创建这些任务。对于开发人员而言,当他们有全新的想法或者在项目启动阶段时,这个平台就很有实用价值。例如,开发一个全新的小工具或者简易应用,不需要进行太多的前期准备,就可以让 AI 代理开始工作。
Please build a basic TODO list app in React. It should be frontend-only, and all state should be kept in localStorage.
在开展绿地任务时,明确需求是很关键的。要明确自己想要的是什么,比如技术栈是什么样的等。这样能让平台的 AI 代理工作更有效率,减少不必要的时间消耗,从而更快地实现目标。
Please allow adding an optional due date to every task
代码错误修复
在修复代码错误这方面,平台有着自身的作用,同时也面临着一些挑战。当代码中出现诸如.app.py 中的函数执行需区分大小写搜索这样的问题时,平台是能够提供协助的。它可以协助对错误进行追踪,然而通常情况下,需要开发人员提供更多的上下文信息,这样才能更有效地定位和解决问题。
Please commit the changes and push them to a new branch called "feature/due-dates"
在使用这个平台进行错误修复时,测试驱动开发是一种较好的方式。具体而言,先让平台编写一个能重现错误的测试,接着依据此测试来修复代码,通过持续迭代,直至代码可以通过测试。然而,即便有再高效的工具,也不能完全取代开发人员在修复复杂错误时所应发挥的作用。
代码重构能力
Please add a GitHub action that lints the code in this repository
平台的代码重构能力值得关注。它对于现有的代码,尤其是小块代码,重构效果良好。像拆分长文件和函数,以及重命名变量等操作,平台都能高效地执行。这些操作有助于优化代码结构,提升代码的可读性和可维护性。
但是,要重构整个代码库是不太可能实现的。当下而言,平台适宜进行一些局部方面的调整与优化,比如对某个小模块的代码进行优化,提升这个小模块的运行效率,或者降低其潜在的错误发生率等。
Please modify ./backend/api/routes.js to add a new route that returns a list of all tasks
技术的局限性
Please add a new React component that displays a list of Widgets to the ./frontend/components directory. It should use the existing Widget component.
这个平台有诸多优势,然而目前技术存在一定局限性。它虽能在许多任务中发挥作用,但在没有任何指导的情况下承担大型复杂工程任务方面,与目标还有很大距离。就如同一个刚学会走路的孩子,尚不能像成年人那样承担起重大责任。
你觉得在未来科技持续发展的情形下,这个平台要多久才能切实承担起大型复杂的工程任务?期望大家可以点赞,也可以分享,还可以在评论区对这个问题进行讨论。
Please rename all the single-letter variables in ./app.go