AI不只是写代码
OpenClaw 在创作工作流里的第一次公开实验
从买票、表单填写、旅行规划、浏览器操作、视频剪辑,到公众号创作,再到为什么我还要继续折腾 OpenClaw。
OpenClaw 在创作工作流里的第一次公开实验
从买票、表单填写、旅行规划、浏览器操作、视频剪辑,到公众号创作,再到为什么我还要继续折腾 OpenClaw。
2019 - 2026
云原生 / 后端架构 / 企业交付
基础架构 / 游戏业务 / 企业 AI 应用平台
团队内容榜单第一 / 内容影响力 > 99%
影像表达、家族纪录与 AI 辅助创作,是我做内容时的另一条底层能力。
长期参与舞台与影像表达训练,让内容展示更重节奏和现场感。
用 AI 影像去完成跨代际叙事,关注技术之外的人和情感。
AI 辅助编导家族纪录片,在字节跳动内部发布后获得 2w 互动。
买票、表单填写、旅行规划、浏览器操作、视频剪辑、小红书平台web自动化发布、素材整理、公众号创作,这些都已经是我真实在用的工作流。
费用、能力范围、我实际拿它做的事,都放在一起了。
它们不一定最酷,但最像普通人每天都会遇到的真实重复动作。
问题:同一路线,价格散在不同平台里。
结果:先把价格扫一遍,再决定在哪下单。
问题:申请页长、字段多、重复核对很耗神。
结果:先让它跑第一遍,人只做最后确认。
这两类动作看起来不酷,但最能实打实地省掉注意力。
问题:酒店、航班、路线在不同地方来回看。
结果:把信息归到一个判断面板里再做选择。
问题:网页、对话、录音散在多个入口。
结果:先把资料捞回来,后面才谈整理和复用。
重点不在原理,而在它已经能替人省掉哪一段重复动作。
问题:长录屏很难从头看到尾。
结果:先切章、先归纳,再决定怎么剪。
问题:有些流程不需要人手一步步做。
结果:20 秒快放就能看清它已经可以独立跑完。
前者解决杂乱输入,后者证明高价值内容链已经可以跑通。
问题:灵感、截图、录屏乱着放,根本没法继续创作。
结果:先把零散内容整理成一包,再进入后面的写作和发布。
问题:它高频、高价值,还天然连接标题、配图、预览和发布。
结果:定制版 Youmind 的起点,就在这条链上。
下单记录、接受回执、可执行方案,都已经进入真实流程。
已经进入实际下单与出票流程。
OpenAI 已接受并发放 6 个月 ChatGPT Pro。
同一份输出里,能直接看到行程信息、推荐方案和候选对比。
这些工具已经进入后续流程,留下了可回看的结果。
对话资料已经被导出并进入后续整理。
成片已经进入视频号发布链。
文章已经进入公众号公开内容。
跨工具、跨设备、跨 Agent、带记忆、能接管、能复盘,缺一块都很难形成长期系统。
每个工具各管一段,真正重要的偏好和记忆不在一起。
手机、电脑、网页、飞书来回切,流程一长就容易断。
做完就做完了,下次想复用,得重新拼回整个过程。
接住输入,编排执行,留下记忆,再把结果送出去。
灵感进入、编排执行、分发回执,这是内容工厂最小可行骨架。
先把一条主链跑通。
稳定之前,不急着铺所有平台。
先把验收点讲清楚,再多交给 AI。
从点子起点到后台验证,一共 6 个核心环节。
输入就是一张绿色气泡图:源自一次 Plan F 会员群里我自己说过的话。
先让机器人把文章思路、标题方向和开头判断说出来,再决定要不要接着写。
回到飞书文档里看正文内容和可读性,而不是只看一个空白壳子。
同一份内容切几种样式,直到它适合公众号阅读。
发布时要看到明确回执和草稿 ID。
最后看见后台草稿,整条链才算闭环。
可读性 / 回执 / 发布结果
同一份内容切几种样式,直接看版式差异。
看到草稿 ID 和回执,这条发布链就闭环了。
手机阅读界面,对应最终发布结果。
文章不只是能生成,还要经得起回读和调整。
关键不是点下按钮,而是收到可验证的发布回执。
草稿箱和回执,是最直观的闭环信号。
一个更适合排查和写 Skill,一个更适合长期编排和接管。
这次它真实帮我做过:核对配置、检查绑定、清理脏目录、验证服务,还把部分问题沉淀成后面可以拆成短视频的排查切片。
它更适合把已经成熟的能力接进来,帮你长期接住输入、触发动作、记录过程,而不是每次都重新从零开始。
模型输入输出习惯会直接影响执行成功率。
封得太浅容易飘,封得太死又不灵活。
同一个 skill,适配的平台和执行过程偏好会很不一样。
边界没定义清楚,每次失败都会额外消耗大脑。
安装不是大头,反复试错和排查更消耗上下文。
Codex 两个搭车号:16.8。核心两线程合计:168,085,724;相关 6 线程合计:198,396,863。
这不是账单,而是本地线程累计的上下文消耗。更适合说明:为了把它跑通,到底吃了多少上下文。
1,788,713 tokens · $0.96。安装和配置主线:2026-03-10 至今。
它不是 token,而是 OpenClaw 本地工程在磁盘上的沉淀:工作区、技能仓、浏览器痕迹、会话、记忆库和日志。
接住点子,再把写作、剪辑、校验、发布和复盘串起来。
能力在变强,但体验、稳定性和可控性还没有一起收敛。
纯 IM 很容易卡在多会话和上下文限制里,长流程一复杂,就需要网页 Dashboard、文件流或任务板来接住。
难的不是多开几个 Agent,而是任务、状态和结果怎么稳定交换。
触发语义、角色边界、适配平台和权限策略没讲清楚,Skill 多了反而会让人更疲劳。
但权限管理、稳定性和配置复杂度也最高。普通人没有必要把全部注意力花在这里。
每一次失败都可能同时消耗 token、注意力、耐心和想象力,所以能观测、能复盘特别重要。
今天还在用 Skill 模拟人点网页,两个月后可能就会变成一个 MCP、一个 CLI 或一行接口。
少量强接口优先,少量稳定 Skill 优先,先把验收点和回执做实,再谈全自动。
把输入、任务、回执、日志和记忆都文件化 / 面板化,让 Agent 之间通过任务通信,而不是继续把一切都塞进单一聊天窗口。
淘宝开始支持 MCP,Chrome 生态开始支持 CLI / CDP 直接操作,这些信号都在说明:很多今天复杂的 Skill,明天会变成平台原生能力。
MCP、CLI、API 都在变成更稳定的真实入口。
很多反复点网页、对抗反爬的动作,会逐步被原生接口取代。
从补丁和兜底,慢慢转向编排、验收和跨平台连接。
左边是 Dashboard 形态,右边是一个适合系统理解 Agent 架构的学习入口。
网页工作台把多入口、多任务和长流程放到了更清楚的操作界面里。
角色、上下文、工具和协作,这四块串起来看,会对 Agent 理解得更完整。
github.com/hesreallyhim/learn-claude-code角色、上下文、工具和协作关系,放到中文梳理里会更好消化。
Feishu 文档入口后续会继续更新全流程智能体发布工作流、深浅技巧和踩坑实录。
项目合作 / 架构咨询 / 演讲邀约
工作流拆解 / Agent 落地 / 更新同步