多轮不是重复运行
如果每一轮只是换个脚本名再跑一次,Agent 仍然不智能。真正的多轮自动执行,需要把上一轮的错误、缺失产物、质量门失败原因和用户目标一起交给下一轮规划。
质量闭环应该记录什么
- 本轮计划:模型为什么选择这个程序和工具。
- 运行观察:命令、返回码、关键 stdout/stderr 和结果文件。
- 质量门:是否满足用户目标,失败原因是什么。
- 修复输入:下一轮必须解决的具体问题。
这也是沙箱 Agent 与普通脚本工具的区别:它会观察、判断、修复,而不是只执行一次。

多轮执行要把 stdout、stderr、产物、质量门和用户原目标一起回灌,让下一轮真的修复问题。
如果每一轮只是换个脚本名再跑一次,Agent 仍然不智能。真正的多轮自动执行,需要把上一轮的错误、缺失产物、质量门失败原因和用户目标一起交给下一轮规划。
这也是沙箱 Agent 与普通脚本工具的区别:它会观察、判断、修复,而不是只执行一次。