人工智能疲劳是真实存在的,但没有人谈论它

上个季度我交付的代码比我职业生涯中任何一个季度都多。我也感到比我职业生涯中任何一个季度都更疲惫。这两个事实并非无关。 我以构建人工智能代理基础设施为生。我是核心维护者之一 开放FGA (CNCF孵化),我建造 代理授权 对于代理授权,我构建了用于上下文重复数据删除的 Distill,我还提供了 MCP 服务器。我不是一个副业涉足人工智能的人。我深陷其中。我构建了其他工程师用来让人工智能代理在生产中工作的工具。 然而,我碰壁了。这种疲惫感是任何工具或工作流程优化都无法解决的。 如果您是一名每天使用人工智能进行设计审查、代码生成、调试、文档、架构决策的工程师,并且您发现自己比人工智能存在之前更累,那么这篇文章适合您。你没有想象到。你并不弱。你正在经历一些真实的事情,而业界却极力假装不存在。如果全职构建代理基础设施的人可能对人工智能感到倦怠,那么任何人都可能发生这种情况。 我想诚实地谈谈这件事。不是“人工智能太棒了,这是我的工作流程”版本。真实版本。晚上 11 点,你盯着屏幕,周围都是人工智能生成的代码,你仍然需要检查,想知道为什么这个本应节省你时间的工具却占用了你一整天的时间。 没有人警告我们这个悖论 这件事让我伤透了一阵子:人工智能确实让个人任务变得更快。这不是谎言。以前需要 3 个小时的事情现在只需 45 分钟。起草设计文档、搭建新服务、编写测试用例、研究不熟悉的 API。一切都更快。 但我的日子却变得更加艰难。并不容易。更难。 原因一看就很简单,但我花了几个月的时间才弄清楚。当每项任务花费的时间更少时,你做的任务并不会减少。你做更多的任务。你的能力似乎在扩大,因此工作也会扩大以填补它。然后是一些。您的经理看到您的发货速度更快,因此会调整期望。您发现自己的发货速度更快,因此您自己的期望也随之调整。基线移动。 在人工智能出现之前,我可能会花一整天的时间来解决一个设计问题。我会在纸上画草图,在淋浴时思考,出去散步,然后清晰地回来。节奏很慢,但认知负荷是可以控制的。有一个问题。一天。深度聚焦。 现在?我一天可能会遇到六个不同的问题。每个“人工智能只需要一个小时”。但对于人脑来说,六个问题之间的上下文切换代价极其高昂。人工智能在解决问题之间不会感到疲倦。我愿意。 这就是悖论: 人工智能降低了生产成本,但增加了协调、审查和决策的成本。而这些成本完全由人类承担。 您已成为审稿人但未注册 在人工智能出现之前,我的工作是:思考问题、编写代码、测试它、发布它。我是创造者。制造者。这就是吸引我们大多数人从事工程的首要原因——建造行为。 人工智能之后,我的工作逐渐变成:提示、等待、读取输出、评估输出、决定输出是否正确、决定输出是否安全、决定输出是否与架构匹配、修复不匹配的部分、重新提示、重复。我成为了审稿人。一位法官。永不停歇的装配线上的质检员。 这是一种根本不同的工作。创造是充满活力的。复习很累。有一个关于这一点的研究——生成性任务和评估性任务之间的心理差异。生成性工作给你带来心流状态。评估性工作会让你产生决策疲劳。 我第一次注意到这一点是在我在一个新的微服务中大量使用人工智能的一周内。到了周三,我再也无法做出简单的决定了。这个函数应该命名什么?我不在乎。这个配置应该放在哪里?我不在乎。我的大脑充满了。不是来自编写代码,而是来自判断代码。成百上千的小判断,整天,每天。 残酷的讽刺是,人工智能生成的代码比人类编写的代码需要更仔细的审查。当同事编写代码时,我知道他们的模式、他们的优势和他们的盲点。我可以浏览我信任的部分,并专注于我不信任的部分。有了人工智能,每一行都值得怀疑。代码看起来很有信心。它编译。它甚至可能通过测试。但它可能存在微妙的错误,只有在凌晨 3 点、在负载情况下的生产中才会显现出来。 所以你读了每一行。阅读不是由您编写的代码,这些代码是由不了解您的代码库历史或团队惯例的系统生成的,是一项令人筋疲力尽的工作。 这也是我认为代理安全和授权如此重要的原因。如果我们无法审查人工智能产生的所有内容(而且我们不能,而且不能大规模审查),那么我们首先需要系统来限制智能体可以做什么。最低权限访问、范围令牌、审计跟踪。你越不用担心“人工智能是否做了危险的事情”,你对真正重要的工作的认知预算就越多。这不仅仅是一个安全问题。这是一个人类可持续发展问题。 非决定论问题 工程师接受过决定论方面的培训。相同的输入,相同的输出。这就是合同。这就是调试成为可能的原因。这就是使系统推理成为可能的原因。 人工智能打破了那个契约。 我在周一收到了一个完美运行的提示。为 API 端点生成干净、结构良好的代码。我在周二对类似的端点使用了相同的提示。输出在结构上不同,使用了不同的错误处理模式,并引入了我没有要求的依赖项。 为什么?没有理由。或者更确切地说,我没有理由可以访问。没有“模型今天决定走不同方向”的堆栈跟踪。没有日志显示“温度采样选择了路径 B 而不是路径 A”。只是……情况有所不同。 对于一个整个职业生涯都建立在“如果它坏了,我能找出原因”的人来说,这是非常令人不安的。不是以戏剧性的方式。以一种缓慢、磨砺、背景焦虑的方式。你永远不能完全相信输出。你永远无法完全放松。每一次互动都需要保持警惕。 我试图对抗这个。我对提示进行了版本控制。我构建了详细的系统消息。我创建了模板。其中一些有帮助。这些都没有解决根本问题: 你正在与一个概率系统合作,而你的大脑则倾向于确定性系统。 这种不匹配是一种持续的、低级的压力源。 这种挫败感实际上促使我为法学硕士构建了 Distill – 确定性上下文重复数据删除。没有法学硕士调用,没有嵌入,没有概率启发法。纯算法可在约 […]