欢迎光临
我们一直在努力

人工智能编码代理正在成长,但大多数工作流程却并非如此。

AI编码代理正从自动补全功能逐步融入到开发者的长期工作流程中。这能带来真正的优势,但前提是团队必须建立安全边界、日志记录、审查机制和运维规范。


AI编码助手越来越不像自动补全工具,而更像是永不睡觉的初级队友。这听起来很令人兴奋,直到你问出一些枯燥的问题:助手从哪里获取上下文?在你不在的时候它做了哪些更改?凌晨2点14分它安装的依赖项是谁审核的?

过去一周,开发者工具的发展方向已经相当清晰地展现出来。谷歌撰文介绍了可以暂停、恢复并保留上下文的长时间运行代理。xAI 将 Grok Build 集成到了终端中。安全厂商现在将编码代理和 AI 工作站视为自身的攻击面。VentureBeat 报道了用于在本地调试和评估代理的新工具。

这种趋势已经非常明显了。行业正在从“人工智能帮我编写函数”转向“人工智能可以帮我完成一部分工作流程,让我可以去做其他事情”。这完全是另一种类型的工具了。

从建议到执行的转变

自动补全功能很容易理解。你输入内容,模型给出建议,你可以接受或忽略。由于交互是逐行进行的,开发者始终能够掌握整个过程。

代理会改变这种节奏。它们读取文件、创建分支、运行测试、搜索文档、调用 API,有时还会跨多个步骤做出决策。优秀的代理能够根据“添加导出支持”这样模糊的指令,返回一个可用的实现。而糟糕的代理则可能表面上完成了同样的请求,却悄悄地破坏了没人要求它检查的边界情况。

这就是为什么长期上下文至关重要。如果智能体在执行任务过程中忘记了任务背后的原因,它就会开始优化最后一条指令,而不是实际目标。暂停和恢复看似是小功能,但它们指向一个更深层次的需求:如果我们希望智能体能够胜任实际项目,它们就需要具备记忆、状态和交接机制。

开发人员现在需要代理操作

我们在DevOps中已经吸取了这一教训。难点从来不在于运行代码,而在于日志记录、回滚、权限管理、监控、可复现性以及了解谁修改了哪些代码。

人工智能代理也需要同样的运维思维。或许我们可以称之为代理运维,或许这个术语会被一个更简洁的词所取代。无论如何,团队都需要回答一些基本问题:

  • 代理人可以使用哪些工具?
  • 它可以写入生产系统吗?
  • 它是在沙箱环境中运行还是在开发者机器上运行?
  • 提示信息和工具输出结果是否存储在某个地方?
  • 其他开发者能否重现这个问题?
  • 经纪人知道何时应该停止吗?

这些并非杞人忧天的问题,而是普通的工程问题。之所以感觉新颖,是因为经纪人模糊了助理、编剧和承包商之间的界限。

安全问题并非理论上的。

编码代理拥有奇特的权限组合。它可以读取私有代码、执行文件中的指令、安装软件包、调用远程服务,并生成看似人类操作的提交记录。这种组合固然有用,但也极易导致注入攻击、供应链攻击和意外数据泄露。

想象一下,一个代理程序浏览 GitHub issue,而其中的评论里隐藏着恶意指令。或者阅读依赖项的 README 文件,被告知要导出环境变量以进行“调试”。又或者因为误解了失败的测试而修改了 CI 配置。这些都不需要科幻小说的情节,只需要一个被过度信任而缺乏监管的工具。

解决办法不是禁止代理。这就像因为有人曾经编写过一个危险的 shell 脚本就禁止所有 shell 脚本一样。解决办法是限制代理的使用。

为代理赋予限定范围的凭据。在一次性环境中运行它们。使文件更改可审查。保留命令日志。将读取权限与写入权限分离。将浏览器和终端操作视为特权操作,而不是随意的便利措施。

小团队可能最先感受到这一点。

大型公司会围绕这一点制定政策。他们会设立委员会、采购清单、红队演练,以及大量昂贵的仪表盘。

小型团队会更快地感受到优势。一名独立​​开发者可以使用代理来创建功能原型、编写测试、重构混乱的模块或总结不熟悉的代码库。这确实能带来巨大的优势。但小型团队的保障措施也相对较少。同一个代理虽然可以节省一个周末的时间,但也可能导致误删文件夹、泄露令牌,或者推送一个看似可靠但却存在问题的迁移。

这就是纪律胜过炒作的地方。如果你要在工作流程中使用人工智能代理,那就从一些枯燥的规则开始:

  • 使用git分支进行代理工作。
  • 运行应用程序前请先查看差异。
  • 尽可能将机密信息放在可访问文件之外。
  • 合并前请自行运行测试。
  • 请代理人解释风险,而不仅仅是总结成功经验。

最后一点很重要。经纪人很擅长表现得万事大吉,但除非你强迫他们养成这种习惯,否则他们不太擅长主动表达不确定性。

最优秀的开发者未必是最自动化的开发者。

我不认为成功的开发者工作流程是“让代理包办一切”。这在演示中听起来很棒,但在实际代码库中却令人担忧。

更高效的工作流程更具选择性。让智能体处理繁琐的探索、搭建框架、撰写初稿和重复性修改。让人类专注于架构、产品判断、安全边界和最终审核。利用智能体推动项目进展,而不是推卸责任。

这一切背后隐藏着一个不易察觉的诱惑:如果智能体可以在我们睡觉时工作,或许我们就可以放松警惕。但这恰恰是本末倒置。智能体的能力越强,其运行模式就越发重要。

人工智能编码代理正在成长。问题是,我们的开发习惯是否也能随之成长。

源信号

本文基于近期公开的信号,包括 Google Developer Blog 对 ADK 中长期运行代理的报道、xAI Grok Build 进入终端的报道、Endor Labs 关于 AI 编码代理和工作站安全性的文章,以及 VentureBeat 对本地代理调试和评估工具的报道。

赞(0)
未经允许不得转载:X记录空间 » 人工智能编码代理正在成长,但大多数工作流程却并非如此。