多轮不是重复运行

如果每一轮只是换个脚本名再跑一次,Agent 仍然不智能。真正的多轮自动执行,需要把上一轮的错误、缺失产物、质量门失败原因和用户目标一起交给下一轮规划。

质量闭环应该记录什么

  1. 本轮计划:模型为什么选择这个程序和工具。
  2. 运行观察:命令、返回码、关键 stdout/stderr 和结果文件。
  3. 质量门:是否满足用户目标,失败原因是什么。
  4. 修复输入:下一轮必须解决的具体问题。

这也是沙箱 Agent 与普通脚本工具的区别:它会观察、判断、修复,而不是只执行一次。