LinkClaw 本机工作台：把 OpenClaw、Hermes 和文件管道放到一起

灵感库导读

真实任务不是一句话问答，而是目录、文件、模型、工具、审校和交付的连续链路。LinkClaw 负责把这些能力组织成可用工作台。

前面几篇我讲了 LinkGo 的保格式翻译、术语记忆和本机沙箱。今天想展开讲一个更底层的设计：为什么我会把 OpenClaw、Hermes 这两类原版智能体接进 LinkGo，并且让它们和 LinkGo 自己的文件翻译管道、本机沙箱、模型配置、术语记忆一起工作。

这不是为了“多接两个智能体显得更强”。我的真实动机很简单：真实文件任务往往不是一个模型回答能解决的，它需要一个能规划、能读写文件、能调用工具、能回到产品交付链路里的执行系统。

很多 AI 产品处理文件时，会停在两个极端。

一种是纯聊天：你上传文件，模型告诉你“建议这样做”。它能解释、能总结、能翻译片段，但真到 Word、PPT、Excel、PDF、字幕、批量目录和本机脚本，就很难把事情完整做完。

另一种是完全自动化：什么都让智能体自己摸索。听起来很爽，但真实落地时很容易遇到问题：它读了哪些文件？写到了哪里？中间失败怎么恢复？模型配置从哪里来？术语和翻译记忆有没有用上？最终结果是不是可下载的正式文件？

LinkGo 想做的是中间那条路：让智能体能执行，但把执行放进本机沙箱和文件交付链路里。

为什么需要 OpenClaw 和 Hermes？

LinkGo 自己已经有文件翻译、术语库、翻译记忆、OCR、字幕、Office 写回、排版检查这些能力。那为什么还要接 OpenClaw 和 Hermes？

因为它们擅长的是“开放任务执行”。

比如用户不是只说“翻译这个 Word”，而是说：

帮我看这个目录里哪些文件还没翻译，先把 Word 和 PPT 翻成日语，再把结果整理成一个清单，最后检查有没有漏译。

这类任务不是单一文件翻译。它包含目录扫描、文件筛选、任务拆分、调用翻译管道、结果核对、生成清单、继续追问。更像一个小型项目。

OpenClaw 和 Hermes 适合承担“智能体执行层”的角色：理解多步骤目标、调用工具、读取工作区、跟踪过程、在失败后尝试修复。

而 LinkGo 更适合承担“产品交付层”的角色：管理用户、附件、模型、术语、记忆、权限、运行记录、下载结果、前端体验。

所以我不想把它们改造成 LinkGo 的一个普通函数，也不想让它们绕过 LinkGo 自己的能力。

更合理的结构是：

OpenClaw / Hermes 保留原版智能体能力
LinkClaw 负责本机启动、停止、状态、日志、模型桥接和任务桥接
LinkGo 文件管道负责结构化解析、翻译写回、质量检查和最终交付
主项目聊天页负责用户入口、附件、权限、结果展示和继续追问

这样两个世界才不会互相打架。

LinkClaw 这一层到底做什么？

我把桥接层叫 LinkClaw。它不是一个新的大模型，也不是替代 OpenClaw / Hermes 的壳。

它主要做几件很实际的事：

在本机启动和管理 OpenClaw / Hermes
把 LinkGo 里的模型配置同步给两大智能体
把用户上传的附件和工作区同步到智能体能看到的位置
把任务、上下文、权限模式和沙箱范围整理后交给对应引擎
把 stdout、stderr、trace、session 等运行过程折叠回 LinkGo 的 Agent Run 面板
把最终回答和结果文件交还给 LinkGo，而不是让用户去日志目录里找

这件事看起来像“胶水代码”，但真正落地时，胶水往往决定体验。

比如 OpenClaw 和 Hermes 各自有自己的 Web、Gateway、CLI、运行状态、依赖、日志和配置方式。LinkGo 不能假装它们不存在，也不能把这些细节全部暴露给普通用户。

所以 LinkClaw 做的是一层本机适配：保留原版能力，但把它们放进 LinkGo 的产品边界里。

文件翻译为什么不能让智能体自己拆？

如果只是处理纯文本，智能体自己读文件、自己改文件，好像也能跑。

但真实 Office 文件不一样。

一个 DOCX 里有段落、表格、样式、脚注、批注、页眉页脚；PPTX 里有文本框、形状、母版、备注页；Excel 里有单元格、富文本、公式、样式；字幕有时间轴和分行；PDF 还涉及版式和重建。

如果让智能体临时写脚本去拆这些文件，很容易出现三个问题：

结构丢失：翻译完只剩纯文本
写回不稳：格式、样式、文本框、表格被破坏
结果不可控：不同模型、不同任务，每次临时脚本都不一样

所以 LinkGo 的思路是：智能体不应该重新发明文件管道。

LinkGo 文件管道会把文件解析成结构化 JSON，让每个可翻译单元有稳定编号。智能体只需要处理 translated 字段，保留结构字段、编号、格式信息和保护片段。

常见流程大概是：

inspect：识别文件类型、语言和可处理能力
index：拆出可翻译单元，形成结构化索引
template：生成翻译模板
智能体分片翻译，保持术语和上下文一致
validate：检查漏译、空译、语言残留、数字和保护片段
apply-retry：只重试失败片段，不重跑整个文件
write：调用 LinkGo 原有写回能力重建最终文件

这个设计有一个关键点：文件结构的真相在 LinkGo 管道里，不在模型临时生成的脚本里。

OpenClaw / Hermes 负责规划、调用和补救；LinkGo 负责文件专业能力和交付质量。

这也是我认为两者结合最有价值的地方。

沙箱可以做什么？

用户常常问：既然叫本机沙箱，那它是不是可以做任何事情？

我的回答会更谨慎一点：它可以做很多本机任务，但前提是用户授权、权限模式允许，并且所有动作都应该在清楚的边界里发生。

在这个前提下，本机沙箱能做的事情就很多了。

它可以做文件类任务：

批量读取目录
整理文件清单
批量翻译 Word、PPT、Excel、字幕
提取表格并导出 XLSX
对比原文和译文
生成审校报告
把结果归档到指定输出目录

它可以做开发和脚本类任务：

运行 Python / PowerShell / shell 命令
检查依赖是否缺失
生成小工具脚本
读取日志并定位错误
启动或停止本机服务
对项目文件做受控修改

它也可以做知识和联网类任务：

根据任务需要检索术语
查找公开标准或官方文档
把搜索结果作为只读证据注入翻译或审校
结合术语库、翻译记忆和长期偏好做输出

但这里最重要的不是“能做很多”，而是“能不能知道它做了什么”。

所以 LinkGo 里本机沙箱强调几个边界：

本机优先：只允许 127.0.0.1 / localhost 控制本机能力
工作区边界：只读、标准、完整权限对应不同能力
日志可追踪：stdout、stderr、trace、session 都能回看
结果可交付：用户看到的是最终文件和摘要，不是满屏内部调试
密钥脱敏：模型 Key、token、password 不应该暴露到日志和页面

智能体越能干，越要把边界说清楚。

本地部署为什么重要？

如果只是普通聊天，云端当然方便。

但文件翻译和本机自动化经常涉及企业资料、合同、财报、技术手册、客户文档、字幕素材、项目源码、本机目录结构。这些东西不是每个团队都愿意直接丢到外部服务里。

本地部署的意义不是完全拒绝云模型，而是把选择权拿回来。

LinkGo 的方向是：

文件目录默认留在本机
本机沙箱只在运行程序的电脑上可用
在线模型和本地模型都可以接
OpenClaw / Hermes 子进程只拿到本轮需要的上下文
模型配置、术语库、记忆库、附件和工作区由主项目统一管理

这样用户可以按任务选择模型。

隐私敏感任务可以走本地模型或内网模型；复杂推理任务可以走在线模型；文件处理和结果写回仍然在本机完成。

这种组合比“全云端”更麻烦，但对很多真实办公场景更踏实。

OpenClaw 和 Hermes 分别适合什么？

我不会把它们简单分成“谁更强”。

更准确地说，它们是两类不同风格的执行引擎。LinkGo 要做的是让用户可以在同一个沙箱入口里选择合适引擎，而不是为了选择引擎而换一整套工作流。

OpenClaw 适合偏工具化、Gateway、任务执行和本机控制台的场景。它的运行过程、技能列表和工具轨迹适合被折叠成 Agent Run，让用户知道它在做什么。

Hermes 适合偏多轮、会话、上下文注入和技能协同的场景。它的历史压缩、hook、技能同步和运行会话也能给复杂任务提供更好的连续性。

但无论选哪一个，LinkGo 都希望保持几件事不变：

用户还是在 LinkGo 聊天页上传文件和下指令
模型配置还是跟随主项目设置
术语、记忆、知识库开关还是从 LinkGo 传入
文件翻译仍优先使用 LinkGo 文件管道
最终结果仍回到 LinkGo 下载和继续追问

对用户来说，选择 OpenClaw 或 Hermes 不应该意味着换一个产品。

它应该只是选择本轮任务的执行引擎。

这个组合最终想解决什么？

我做这个组合，想解决的不是“让 AI 看起来更像人”。

我更关心的是：让 AI 在真实工作里少停在建议层，多往交付层走一步。

比如这些需求：

把一整个目录里的 Word 和 PPT 翻成日语，保留格式
翻译后检查有没有中文残留、数字丢失、术语不一致
把双语文件抽成对齐语料，导出 Excel
先读材料，总结重点，再生成一份演示稿
检查某个本机项目为什么启动失败，读日志并修复依赖
批量处理字幕，生成可交付的 SRT 或视频字幕结果
根据术语库和翻译记忆，继续处理同一客户的新文件

这些任务的共同点是：它们不是一句回答，而是一条链路。

聊天入口只是开始。

后面需要文件解析、模型调用、工具执行、失败重试、权限控制、结果下载、日志追踪和继续追问。

LinkGo、OpenClaw、Hermes 和本机沙箱结合起来，就是为了把这条链路尽量连上。

我现在越来越觉得，办公 AI 真正的壁垒不是“谁的回答更漂亮”，而是：

能不能读懂真实文件结构
能不能安全地操作本机工作区
能不能把模型、工具和记忆放在同一条任务线上
能不能失败后知道怎么补救
能不能最后交付一个用户能打开、能检查、能继续用的结果

这也是 LinkGo 后面会继续强化的方向。

如果你也在做 AI 文件处理或本机智能体，我建议先别急着追“全自动”。先把边界、日志、文件管道和交付结果做扎实。

真正有用的智能体，不是看起来什么都能做。

而是在该做的地方，真的把事情做完。

适合继续了解

如果你关注文件翻译、智能体自动执行、本地部署或团队多语言交付，可以在 LinkGo 灵感库继续查看相关专题。