真正的沙箱能力
当用户选择本机目录后,沙箱 Agent 应该能读取工作区、生成脚本、运行 Python 或系统命令、安装缺失依赖,并把错误观察回灌给下一轮模型。
建议的执行闭环
- 扫描工作区和用户目标,判断是否需要文件、联网或命令能力。
- 让模型生成最小可执行程序,并写入运行目录。
- 执行程序,收集 stdout、stderr、返回码和结果文件。
- 用质量门判断是否真的满足目标;失败时带着错误进入下一轮。
- 最终回复只展示关键结果,详细日志折叠进控制台面板。

本机沙箱的核心不是固定按钮,而是规划、编程、执行、观察、修复和交付的闭环。
当用户选择本机目录后,沙箱 Agent 应该能读取工作区、生成脚本、运行 Python 或系统命令、安装缺失依赖,并把错误观察回灌给下一轮模型。