Qiao Zhuoyue · Engineer × Creator

AI不只是写代码

OpenClaw 在创作工作流里的第一次公开实验

从买票、表单填写、旅行规划、浏览器操作、视频剪辑，到公众号创作，再到为什么我还要继续折腾 OpenClaw。

企业 AI 应用工程落地 后端架构基础设施 影像表达纪录片与内容

工程能力进入创作现场，创作表达反过来要求工具真正能落地。

02

关于我

企业级后端、架构、云原生、AI 工程化。

2019 - 2026

技术面

腾讯云架构师同盟

云原生 / 后端架构 / 企业交付

履历时间轴

2019 - 2026

基础架构 / 游戏业务 / 企业 AI 应用平台

2026

创办 Zmagine 研发企业 AI 应用的大脑平台 / 个人新媒体影响力建设

2024

字节跳动 · 后端技术负责人 AI 工程化实践 Top 1% 纪录保持者

2022

腾讯游戏 · 云原生架构师 主导腾讯游戏上云自动化交付体系与落地

2021

InfoQ 编辑推荐 发表《深入理解云原生下自适应限流技术原理与应用》

2021

极客时间签约讲师 Go 语言技术板块课程合作

2020

网易游戏 · 高级后端研发 梦幻西游

2019

YY 语音 · 后端研发 基础架构部

03

字节实践

字节实践证明

团队内容榜单第一 / 内容影响力 > 99%

字节跳动 AI 工程实践第一

内容影响力超过 99%

实践成就

AI Agent 工程化实践

内容榜单

团队内容榜单第一

影响力

内容影响力 > 99%

04

关于我

艺术面

影像表达、家族纪录与 AI 辅助创作，是我做内容时的另一条底层能力。

陕西省大学生联赛亚军

长期参与舞台与影像表达训练，让内容展示更重节奏和现场感。

《AI登月：致敬两代人》

用 AI 影像去完成跨代际叙事，关注技术之外的人和情感。

《致爷爷奶奶的礼物》

AI 辅助编导家族纪录片，在字节跳动内部发布后获得 2w 互动。

05

前半场

我已经怎么用了

买票、表单填写、旅行规划、浏览器操作、视频剪辑、小红书平台web自动化发布、素材整理、公众号创作，这些都已经是我真实在用的工作流。

买票比价

少切 App，先看清多平台价格差。

Manus

Comet

表单填写

长表单和申请页，先交给 AI 跑一遍。

Comet

OpenAI

旅行规划

酒店、航班、路线放在一个判断面板里。

Comet

浏览器操作

把网页里的脏活累活切出去。

Comet

视频剪辑

先自动切章、归纳，再决定怎么剪。

ChatCut

小红书平台web自动化发布

短流程最能看清自动化发布已经成立。

Comet

素材整理

把零散截图、录屏和灵感整理成可处理的素材包。

阶跃

公众号创作

从点子到草稿，这条链最接近高价值内容生产。

Youmind

06

工具地图

这几个工具我会怎么选，结论先放在前面。

费用、能力范围、我实际拿它做的事，都放在一起了。

工具

费用区间

能力范围

本次我拿它做什么

什么时候先试

阶跃 AI 桌面伙伴 阶跃星辰

费用免费

能力范围桌面 Agent、中文原生、可中途接管

本次我拿它做的事买票比价、素材整理、飞书文档操作

一句话国内普通人第一次试 Agent，先从它开始。

Comet Perplexity

费用免费基础 / 订阅更完整

能力范围信息聚合、浏览器自动化、海外产品链路更顺

本次我拿它做的事买票调研、公众号写作引子、旅行搜索辅助

一句话更适合做搜索、浏览器和信息汇总。

Manus Manus

费用申请制 / 订阅制

能力范围云端 Agent、长任务、手机可监看

本次我拿它做的事买票全流程、移动端监看和收口

一句话更像一个云端实习生，适合长任务盯跑。

ChatCut ChatCut

费用$50/month

能力范围视频理解、自动切章、粗剪辅助

本次我拿它做的事祖辈记忆项目的自动化剪辑和章节拆分

一句话长录屏先交给它做结构化，再决定怎么精剪。

费用口径按前台可见信息写。没公开完整价格的，我就直接写“前台未公开”，不假装精确。

07

场景一 / 场景二

买票和表单填写，是最容易理解的两个入口。

它们不一定最酷，但最像普通人每天都会遇到的真实重复动作。

全流程快放 · 7m36s -> 20s

Manus

Comet

飞猪

买票比价

问题：同一路线，价格散在不同平台里。

结果：先把价格扫一遍，再决定在哪下单。

全流程快放 · 13m21s -> 20s

Comet

表单填写

问题：申请页长、字段多、重复核对很耗神。

结果：先让它跑第一遍，人只做最后确认。

08

场景三 / 场景四

旅行规划和浏览器操作，更像真实工作里的收集与跑腿。

这两类动作看起来不酷，但最能实打实地省掉注意力。

全流程快放 · 5m00s -> 20s

Comet

旅行规划

问题：酒店、航班、路线在不同地方来回看。

结果：把信息归到一个判断面板里再做选择。

全流程快放 · 33m11s -> 20s

Comet

浏览器抓取

问题：网页、对话、录音散在多个入口。

结果：先把资料捞回来，后面才谈整理和复用。

09

场景五 / 场景六

视频剪辑和小红书平台web自动化发布，不是未来，是现在就能切出去的重复工作。

重点不在原理，而在它已经能替人省掉哪一段重复动作。

全流程快放 · 22m00s -> 20s

ChatCut

OpenAI

ChatCut 自动化剪辑

问题：长录屏很难从头看到尾。

结果：先切章、先归纳，再决定怎么剪。

全流程快放 · 24s -> 20s

Comet

小红书平台web自动化发布

问题：有些流程不需要人手一步步做。

结果：20 秒快放就能看清它已经可以独立跑完。

10

场景七 / 场景八

素材整理和公众号创作，是最接近真实创作现场的两条线。

前者解决杂乱输入，后者证明高价值内容链已经可以跑通。

全流程快放 · 1h33m -> 20s

阶跃

飞书

素材整理

问题：灵感、截图、录屏乱着放，根本没法继续创作。

结果：先把零散内容整理成一包，再进入后面的写作和发布。

全流程快放 · 8m17s -> 20s

Youmind

Comet

飞书

公众号写作，是我最先想打通的一条链

问题：它高频、高价值，还天然连接标题、配图、预览和发布。

结果：定制版 Youmind 的起点，就在这条链上。

11

真实留痕

这些不是测过就算了，而是已经留下结果。

下单记录、接受回执、可执行方案，都已经进入真实流程。

买票比价留痕

已经进入实际下单与出票流程。

表单填写留痕

OpenAI 已接受并发放 6 个月 ChatGPT Pro。

旅行规划留痕

同一份输出里，能直接看到行程信息、推荐方案和候选对比。

12

创作与资料链，也都有留痕。

浏览器导出、成片发布、公众号留存，都不是只演示一次。

这些工具已经进入后续流程，留下了可回看的结果。

浏览器抓取留痕

对话资料已经被导出并进入后续整理。

ChatCut 创作留痕

成片已经进入视频号发布链。

Youmind 创作留痕

文章已经进入公众号公开内容。

13

后半场

单点工具能解决一段路，但长期工作流还缺中枢。

跨工具、跨设备、跨 Agent、带记忆、能接管、能复盘，缺一块都很难形成长期系统。

上下文散了

每个工具各管一段，真正重要的偏好和记忆不在一起。

设备散了

手机、电脑、网页、飞书来回切，流程一长就容易断。

复盘断了

做完就做完了，下次想复用，得重新拼回整个过程。

统一入口、长期记忆、可接管、可复盘。

14

简化架构图

OpenClaw 在我心里的位置，更像本地工作台和中枢。

接住输入，编排执行，留下记忆，再把结果送出去。

输入

点子 / 截图网页动作飞书消息零散素材

OpenClaw

长期记忆路由编排定时任务多入口接管

输出

公众号长文小红书视频任务单社区归档页

15

内容工厂

先成立的不是全平台，而是一条稳定主链。

灵感进入、编排执行、分发回执，这是内容工厂最小可行骨架。

灵感 / 群聊 / md / 截图

选题判断 / 写作 / 剪辑 / 发布编排

公众号 / 小红书 / 视频 / 社区

先跑通

先把一条主链跑通。

再全网

稳定之前，不急着铺所有平台。

再自动化

先把验收点讲清楚，再多交给 AI。

先跑通，再全网。

16

wechat-writer

公众号这条链已经有了清晰主链。

从点子起点到后台验证，一共 6 个核心环节。

环节 1 · 0s · 6s

点子起点

输入就是一张绿色气泡图：源自一次 Plan F 会员群里我自己说过的话。

环节 2 · 48s · 8s

粗稿初版

先让机器人把文章思路、标题方向和开头判断说出来，再决定要不要接着写。

环节 3 · 1h05m · 7s

飞书校验

回到飞书文档里看正文内容和可读性，而不是只看一个空白壳子。

环节 4 · 1m18s · 7s

样式切换

同一份内容切几种样式，直到它适合公众号阅读。

环节 5 · 2h26m · 8s

发到草稿箱

发布时要看到明确回执和草稿 ID。

环节 6 · 2h27m · 6s

后台验证

最后看见后台草稿，整条链才算闭环。

主链只讲这 6 步：点子起点 → 粗稿初版 → 飞书校验 → 样式切换 → 发到草稿箱 → 后台验证。

17

补充证明

样式切换、草稿回执和最终成文。

可读性 / 回执 / 发布结果

样式切换

同一份内容切几种样式，直接看版式差异。

草稿箱回执

看到草稿 ID 和回执，这条发布链就闭环了。

最终成文

手机阅读界面，对应最终发布结果。

逻辑优化

文章不只是能生成，还要经得起回读和调整。

发布动作

关键不是点下按钮，而是收到可验证的发布回执。

验证动作

草稿箱和回执，是最直观的闭环信号。

18

折腾心得

自己折腾 OpenClaw 时，Codex 和 OpenClaw 最好分工清楚。

一个更适合排查和写 Skill，一个更适合长期编排和接管。

Codex / Claude Code

看源码改配置写 skill 托管排查

这次它真实帮我做过：核对配置、检查绑定、清理脏目录、验证服务，还把部分问题沉淀成后面可以拆成短视频的排查切片。

OpenClaw

记忆路由定时任务多入口

它更适合把已经成熟的能力接进来，帮你长期接住输入、触发动作、记录过程，而不是每次都重新从零开始。

模型偏好

模型输入输出习惯会直接影响执行成功率。

Skill 封装力度

封得太浅容易飘，封得太死又不灵活。

平台适配差异

同一个 skill，适配的平台和执行过程偏好会很不一样。

你想要的工作流

边界没定义清楚，每次失败都会额外消耗大脑。

写 skill 用工程兵，做长期编排用本地中枢。

19

普通人最关心的

真实成本，就直说。

安装不是大头，反复试错和排查更消耗上下文。

Codex token 面板

三个数字

Codex 两个搭车号：16.8。核心两线程合计：168,085,724；相关 6 线程合计：198,396,863。

token 口径

这不是账单，而是本地线程累计的上下文消耗。更适合说明：为了把它跑通，到底吃了多少上下文。

OpenClaw 本地工程 footprint

5,368browser artifacts

8workspace dirs

7skills dirs

2memory DBs

工作区沉淀

474.4 MB · 9,142 files

技能仓

318.6 MB · 4,417 files

浏览器痕迹

271.2 MB · 5,368 files

媒体缓存

36.3 MB · 24 files

Agent 会话

25.3 MB · 39 files

日志

2.1 MB · 3 files

2agent profiles

2bindings

2Feishu accounts

1enabled plugins

usage-cost（近 31 天）

1,788,713 tokens · $0.96。安装和配置主线：2026-03-10 至今。

footprint 是什么意思

它不是 token，而是 OpenClaw 本地工程在磁盘上的沉淀：工作区、技能仓、浏览器痕迹、会话、记忆库和日志。

失败最贵的不是钱，是上下文、耐心和想象力。

20

后面想把它做成什么

目标不是再多一个聊天框，而是一个全流程创作入口和分发平台。

接住点子，再把写作、剪辑、校验、发布和复盘串起来。

1. 统一入口

微信 / 飞书 / 网页 Dashboard 点子截图 / md / 链接 / 录音文件夹监听 / 移动端补录

2. 创作编排

选题判断标题与大纲样式包 / 配图包 / 素材包

3. 执行引擎

wechat-writer 浏览器 Agent / 发布 Agent 视频切章 / 粗剪 / 封面

4. 分发与复盘

公众号 / 小红书 / 视频号 / 社区回执 / 日志 / 指标面板下一次复用的模板与记忆

目标不是“今天演示一次”，而是让创作入口、执行链路和分发回执长期留下来。

21

当前难点

Agent 现在最拧巴的地方，在交互、角色、权限和上下文。

能力在变强，但体验、稳定性和可控性还没有一起收敛。

IM 只是入口

纯 IM 很容易卡在多会话和上下文限制里，长流程一复杂，就需要网页 Dashboard、文件流或任务板来接住。

多 Agent 是必然

难的不是多开几个 Agent，而是任务、状态和结果怎么稳定交换。

Skill 越多越黑盒

触发语义、角色边界、适配平台和权限策略没讲清楚，Skill 多了反而会让人更疲劳。

本地自由度最高

但权限管理、稳定性和配置复杂度也最高。普通人没有必要把全部注意力花在这里。

失败最贵的是脑力

每一次失败都可能同时消耗 token、注意力、耐心和想象力，所以能观测、能复盘特别重要。

很多难题会很快被 API 吃掉

今天还在用 Skill 模拟人点网页，两个月后可能就会变成一个 MCP、一个 CLI 或一行接口。

更可行的方向

少量强接口优先，少量稳定 Skill 优先，先把验收点和回执做实，再谈全自动。

下一步方向

把输入、任务、回执、日志和记忆都文件化 / 面板化，让 Agent 之间通过任务通信，而不是继续把一切都塞进单一聊天窗口。

22

生态开放

真实世界交互，正在从模拟点击走向原生接口。

淘宝开始支持 MCP，Chrome 生态开始支持 CLI / CDP 直接操作，这些信号都在说明：很多今天复杂的 Skill，明天会变成平台原生能力。

淘宝 mac 版已支持 MCP

Chrome 生态开始支持 CLI / CDP 直接操作

平台在开放

MCP、CLI、API 都在变成更稳定的真实入口。

网页模拟会收敛

很多反复点网页、对抗反爬的动作，会逐步被原生接口取代。

Skill 的角色会变化

从补丁和兜底，慢慢转向编排、验收和跨平台连接。

今天还靠 Skill 模拟人点网页，明天可能就是一个 MCP、一个 CLI、一个 API。

23

Dashboard 视角

当 Agent 不只停在 IM 里，它才更像一个长期系统。

左边是 Dashboard 形态，右边是一个适合系统理解 Agent 架构的学习入口。

@超级峰Dashboard 作者

全流程快放 · 35s -> 20s

OpenClaw

Web Dashboard

OpenClaw Dashboard 版

网页工作台把多入口、多任务和长流程放到了更清楚的操作界面里。

Learn Claude Code

角色分工

上下文与记忆

工具与编排

多 Agent 协作

GitHub 项目

角色、上下文、工具和协作，这四块串起来看，会对 Agent 理解得更完整。

github.com/hesreallyhim/learn-claude-code

中文梳理文档

角色、上下文、工具和协作关系，放到中文梳理里会更好消化。

Feishu 文档入口

先把 Agent 怎么协作想明白，再回来折腾 Skill 和编排。

24

结尾

先把主链跑通，再把过程持续公开。

后续会继续更新全流程智能体发布工作流、深浅技巧和踩坑实录。

后续更新入口

企业级后端架构设计 / AI 工程落地 / 技术 IP 合作与演讲。

后续会继续更新：全流程智能体发布工作流、深浅技巧、踩坑实录。

个人微信

项目合作 / 架构咨询 / 演讲邀约

AI 生产力交流群

工作流拆解 / Agent 落地 / 更新同步