代理实验室正在蚕食软件世界|通过 Bandi Revanth | 2025 年 10 月
TL;DR >> 代理实验室首先交付产品,然后构建基础设施。他们将法学硕士转变为目标导向的系统,提供成果,而不仅仅是产出。这种产品优先的方法正在捕捉人工智能堆栈中的真正价值。 几个月来我一直在观察这种模式的出现,现在它终于出现了。真正获胜的人工智能初创公司并不是那些构建更大模型的公司,而是那些推出能够解决实际问题的产品的公司。 让我解释一下我所看到的。 真正的人工智能鸿沟 上周,我正在测试另一个人工智能编码工具,有件事让我震惊:这些工具不仅仅是最新法学硕士的包装。他们是完全不同的公司,有着不同的理念、时间表和创造价值的方法。 目前人工智能世界正在发生分裂,无论你是在建设、投资,还是只是想弄清楚整个事情的发展方向,理解这一点至关重要。 示范实验室 正在建造基础模型。他们从事研发业务,在考虑产品之前,花费数年时间和数十亿美元来培训下一个 GPT。 代理实验室 今天正在运送产品。他们采用现有的前沿模型,并将其转变为目标导向的系统,从而真正完成工作。 作为 斯维克斯 指出:代理实验室首先交付产品,然后在获得数据、收入和信念以及对其问题领域的深入了解后逐步开展工作。 差异不仅仅是技术上的——还有文化、财务和战略上的差异。代理实验室对于功能也更加现实。 作为 卡帕蒂 指出,“我对这个行业的批评更多的是超出了现有能力的工具。” 代理实验室的构成要素 以下是我从观察 Cognition (Devin)、Cursor 和 Factory AI 等公司中学到的东西: 他们先发货,然后优化。 模型实验室处于多年的研发周期,而代理实验室则在数周内交付产品,并根据真实用户反馈进行迭代。 他们拥有完整的工作流程。 模型实验室会看到提示和响应。代理实验室可以查看整个跟踪 – 文件更改、工具调用、测试结果和用户批准。这些运营数据就是他们的护城河。 它们是特定于领域的。 他们没有尝试构建通用智能,而是专注于仍然“还有大量工作要做”的特定领域——集成工作、领域专业知识、卡帕西强调的真正挑战的繁重工作。 他们提供成果,而不是产出。 这是关键的见解。您不是为 AI 代币付费,而是为已部署的应用程序、已关闭的票证、已发布的功能或已解决的错误付费。 为什么产品优先胜过模型优先 以下是我在野外看到的情况:以产品起家的公司比以模型起家的公司拥有巨大的优势。 数据优势 当 Cursor 帮助您编写代码时,它会捕获所有内容:您的存储库结构、您的编码模式、您的验收标准、您修改的文件、您运行的测试。他们正在构建一个 OpenAI 和 Anthropic 永远无法访问的数据集。 当 Devin 构建一个功能时,他们会捕获整个开发工作流程:规划、实施、测试和部署。这是专有的训练数据比任何公开可用的数据集更有价值。 反馈循环 代理实验室设计的界面可以发出值得优化的指标。测试通过,功能发布,错误得到修复。这些成为无法在模型层复制的强化信号。 […]
