Agent驱动的AI编程，终于找到了PMF！

发布于 2024-12-17 13:15

浏览

0收藏

AI编程，下半年火遍全网，最近的Devin，以500美刀/M的价格杀疯了，早上openai 2000刀订阅的新闻也传遍了各个微信群。cursor、windsurf、bold.new 都逐渐的进入了实用的阶段，未来对AI说“帮我写个微信”这种需求，似乎也不太遥远。今天给家人们分享的是AI编程赛道的独角兽，Replit。

背景

早期流行的，如github copilot，国产的通义灵码这些AI编程产品，在代码补全和增量开发方面表现出色，所以获得了比较大的市场。但是短期来看，AI编程赛道的一个发展趋势是，“人人都是产品经理/人人都是超级个体”。

Replit Agent 可以提前思考并采取正确的行动顺序，可以轻松构建 Web 应用、各种工具软件，或任何你想象中的新奇想法。它像智能助手一样，帮助人快速从想法转化为可用的代码。

保持高可靠性并让用户参与其中

Replit 团队专注于可靠性，将其 AI Agent的环境限制在 Replit Web 应用和 Replit 开发者已可用的工具范围内。他们的Agent是一个可以迭代循环的 ReAct 风格的智能体。

随着时间的推移，Replit Agent 采用了Multi-Agent架构。当只有一个Agent管理工具时，出错的几率会增加，因此 Replit 团队将每个Agent执行的任务限制为尽可能小的任务。他们为不同的Agent分配了角色，包括：

一个管理Agent来监督工作流程。
编辑Agent来处理特定的编码任务。
一个验证Agent来检查代码并经常与用户互动。

Replit 总裁 Michele Catasta 指出了他们构建理念的一个关键区别：

“我们不追求完全的自主性。我们希望用户保持参与和投入。”

例如，他们的验证Agent的独特之处在于，它不仅仅检查代码并试图做出决定。它经常会与用户对话，以在开发过程中强制执行持续的用户反馈。

提示工程

Replit 采用了一系列先进技术来提高其编码Agent的性能，尤其是对于像文件编辑这样的复杂任务。

Replit 经常使用少量样本示例以及冗长的、针对特定任务的指令来有效地指导模型。对于开发过程中更困难的部分，例如文件编辑，Replit 最初尝试了微调。但是，这并没有取得任何突破。相反，性能的显著提高来自于利用 Claude 3.5 Sonnet。

Replit 还开发了动态提示构建技术来处理token限制，类似于 OpenAI 流行的提示编排库使用的系统。他们压缩和截断长期的记忆轨迹，以管理不断增长的上下文。这包括使用LLM压缩记忆，以确保只保留最相关的信息。

为了提高模型的理解和提示组织，Replit 采用了结构化格式。特别是，XML 标签有助于描绘提示的不同部分，从而指导模型理解任务。对于冗长的指令，Replit 依赖 Markdown，因为它通常在模型的训练分布范围内。

值得注意的是，Replit 没有以传统方式进行工具调用。他们没有使用 OpenAI API 提供的函数调用，而是选择生成代码来自己调用工具，因为这种方法更可靠。由于 Replit 拥有包含 30 多个工具的宽泛库，每个工具都需要多个参数才能正确运行，这使得工具调用过程变得复杂。Replit 编写了一种受限的基于 Python 的 DSL 来处理这些调用，从而提高了工具执行的准确性。