系列文章(4/4)| 作者:Allen | allen00.top
前三篇聊了 Agent 的概念、架构和产品设计。这篇不讲理论了,直接上手——我把自己用这三款产品的安装过程、日常操作和踩过的坑都整理出来了。
每个产品按"5 分钟上手 → 日常怎么用 → 进阶玩法"的顺序写。中间穿插了不少我自己摸索出来的技巧和遇到的问题,希望能帮你少走弯路。
零、前置准备
三款产品对环境的要求不太一样,但有几个基础工具是通用的。我建议先花几分钟把这些搞定,免得后面装到一半卡住。
终端(Terminal)
Mac 用户:打开"终端"应用(Spotlight 搜 "Terminal" 最快),或者装个 iTerm2,体验好很多。
Windows 用户:推荐 Windows Terminal(微软商店免费),比自带的 cmd 好用太多。PowerShell 也行。
Linux 用户:你应该不需要我教这个。
如果你之前没怎么用过终端也别慌,后面的命令都是复制粘贴就能跑的。
Git
Git 是代码版本管理工具。哪怕你不写代码,Agent 操作文件时也依赖它来做版本追踪——改坏了能回滚,这很重要。
检查是否已安装:
git --version
如果显示版本号(比如 git version 2.39.0),说明已经装了。
如果没有:
- Mac:终端输入
xcode-select --install - Windows:去 git-scm.com 下载安装
- Linux:
sudo apt install git或sudo yum install git
Node.js
Claude Code 和 OpenClaw 都需要 Node.js(Codex CLI 也需要)。
检查是否已安装:
node --version
需要 v18 或更高版本。没有的话去 nodejs.org 下载 LTS 版本。我个人推荐用 nvm 来管理 Node 版本,后面升级方便,也不容易遇到权限问题。
GitHub 账号
三款产品都跟 GitHub 有不同程度的集成。如果还没有 GitHub 账号,去 github.com 注册一个。Codex 对 GitHub 的依赖最深——它直接从你的仓库拉代码、提 PR,没有 GitHub 基本没法用。
三款产品安装流程对比
Claude Code 最快上手,Codex 零安装,OpenClaw 配置最多但能力也最全
一、Claude Code
1.1 五分钟上手
安装:
npm install -g @anthropic-ai/claude-code
装完后验证:
claude --version
我第一次装 Claude Code 时就卡在了 EACCES: permission denied。Mac 和 Linux 上用系统自带的 Node.js 经常遇到这个。两个解法:一是 sudo npm install -g(简单粗暴),二是用 nvm 管理 Node.js(推荐,一劳永逸)。Windows 用户一般不会遇到这个问题。
首次启动:
cd 你的项目目录
claude
第一次运行会弹浏览器让你登录 Anthropic 账号。授权完回到终端就能用了。
有一点要注意:Claude Code 用的是 Anthropic API 的额度,不是 Claude.ai 的订阅。你需要在 Anthropic Console 里充值,或者用 Claude Max 订阅($100/月或 $200/月的那个)。我自己用的是 Max 订阅,日常写代码够用了。
登录成功后,直接用自然语言跟它说话:
> 帮我看看这个项目的目录结构,简单介绍一下每个文件的作用
它会自己去读文件、分析代码,然后给你一个概览。
第一个任务:
试试让它做点实际的事:
> 帮我在 README.md 里加一个"快速开始"章节,包含安装和运行步骤
它会先读现有的 README.md,分析项目结构搞清楚怎么安装和运行,写好新内容,然后问你是否确认修改。
注意最后一步——它会先让你确认,不会直接改文件。这是默认的权限控制,刚开始用的时候别急着关掉,等你熟悉了它的行为模式再放开权限。
1.2 日常使用
常用命令:
在 Claude Code 的交互界面里,除了自然语言,有几个斜杠命令我天天在用:
/status— 看当前上下文用了多少。我一般超过 60% 就 compact 一次/compact— 压缩上下文。长时间干活必备,不然 Agent 会开始"忘事"/cost— 看本次会话花了多少钱。用 Max 订阅的话这个数字仅供参考/clear— 清空对话,从头开始
我的日常工作流:
拿一个真实场景举例——上周我要给博客网站加暗色模式。整个过程大概是这样的:
cd ~/projects/allen-site && claude- "读一下项目结构,重点看 CSS 部分是怎么组织的"
- 它扫完告诉我 CSS 都写在各页面的
<style>标签里,没有统一的变量系统 - "帮我设计一套 CSS 变量,支持亮色和暗色两套主题,先改首页试试"
- 它改完首页后我在浏览器里看了看效果,发现代码块的背景色不对
- "代码块在暗色模式下背景太亮了,调暗一点"
- 调好后:"把这套变量同步到其他页面"
整个过程大概 20 分钟。如果我自己手写,光是设计变量体系就得半小时。
处理复杂任务的经验:
用了几个月,我总结出一个原则:给 Claude Code 的指令越具体,结果越好。
# 这样说它会很迷茫,改出来的东西你大概率不满意
> 帮我重构整个项目
# 这样说它知道该干什么
> 先帮我分析一下 src/services/ 目录下哪些文件耦合度最高
> (看完分析后)好,先重构 UserService,把数据库操作抽到 Repository 层
> (重构完后)跑一下测试看看有没有问题
另一个技巧:如果你发现它改着改着方向不对,直接说"停,回到上一步"或者 Ctrl+C 打断它。别等它改完一大堆再推翻,浪费时间也浪费 token。
1.3 进阶:CLAUDE.md 配置
CLAUDE.md 是 Claude Code 的项目级配置文件,放在项目根目录。每次启动时自动加载。
我一开始觉得这个文件可有可无,后来发现差别很大——没有它,你每次开新会话都得重新交代一遍"这个项目用什么框架""测试怎么跑""别动那个文件"。写好 CLAUDE.md 之后,Claude Code 一启动就知道这些,省了很多重复沟通。
分享一下我自己项目里在用的 CLAUDE.md(脱敏版):
# CLAUDE.md
## 项目简介
这是一个 Next.js + FastAPI 的全栈项目。
前端在 /frontend(Next.js 14, App Router),后端在 /backend(FastAPI + SQLAlchemy)。
数据库是 PostgreSQL,缓存用 Redis。
## 代码规范
- TypeScript 严格模式,不要用 any
- 函数命名 camelCase,组件命名 PascalCase
- 后端 Python 用 type hints,不要省略返回值类型
- Git 提交信息用中文,格式:feat/fix/refactor: 简短描述
## 常用命令
- 前端开发:cd frontend && npm run dev
- 后端开发:cd backend && uvicorn main:app --reload
- 跑测试:cd backend && pytest -v
- 前端类型检查:cd frontend && npx tsc --noEmit
- 数据库迁移:cd backend && alembic upgrade head
## 禁区(不要碰的文件)
- .env.production — 生产环境配置,改了会出事
- alembic/versions/ 下已有的迁移文件 — 只能新增不能改
- frontend/public/fonts/ — 字体文件是买的授权,别删
## 项目里的坑
- frontend 的 next.config.js 里有个自定义 webpack 配置,别轻易改
- backend 的 auth 模块用了自定义中间件,改登录逻辑前先读 middleware/auth.py
- 数据库连接池大小写死了 20,压测时可能不够
几个写 CLAUDE.md 的心得:
- "禁区"很重要——明确告诉它哪些文件不能动,比事后回滚省心多了
- "项目里的坑"这一节是我后来加的,因为 Claude Code 踩了两次同样的坑之后我烦了
- 常用命令写全,它需要跑测试或构建时会直接用这些命令,不用猜
- 别写太长,几十行就够了。写成小作文它反而抓不住重点
1.4 进阶:权限配置
刚开始用的时候,每次改文件都要点确认,安全但确实烦。用了一周之后我就开始配权限规则了。
在项目的 .claude/settings.json 里写:
{
"permissions": {
"allow": [
"Read(*)",
"Edit(*)",
"Bash(npm run *)",
"Bash(pytest *)",
"Bash(git status)",
"Bash(git diff *)"
],
"deny": [
"Bash(rm -rf *)",
"Read(.env.production)"
]
}
}
这套配置的思路是:读写文件和跑测试放行(这是它最常做的事),但删除操作和生产环境配置一律拦截。
我的建议是渐进式放开——先只放开 Read,用几天没问题再放开 Edit,再放开特定的 Bash 命令。一上来就全放开,万一它执行了什么奇怪的命令,你可能都不知道。
1.5 进阶:子代理
这个功能是我用了一个月之后才真正理解它的价值的。
问题是这样的:Claude Code 的上下文窗口是有限的。你跟它聊了很久、改了很多文件之后,它会开始"忘"前面的内容。子代理就是解决这个问题的——把大任务拆成小块,每块在独立的上下文里跑。
> 这个重构任务比较大,涉及 5 个文件。帮我拆成子任务分别处理,每个子任务改一个文件。
Claude Code 会自动创建子代理,每个子代理处理一个子任务,完成后汇总结果。
我踩过的坑:子代理有时候会因为上下文不够而"理解偏差"——它不知道主会话里讨论过的细节。所以拆任务的时候,每个子任务的描述要写得足够清楚,把必要的背景信息带上,别假设它知道你之前说了什么。
二、OpenAI Codex
2.1 五分钟上手
Codex 有三种用法,门槛从低到高:
方式一:Web 版(零安装,最快)
- 打开 chatgpt.com/codex
- 用你的 ChatGPT 账号登录(需要 Plus 或 Pro)
- 连接你的 GitHub 账号
- 选一个仓库,写任务描述,点"Code"
真的就这么简单。不用装任何东西,浏览器里就能用。我第一次用的时候有点不敢相信——选个仓库、写句话、点一下,它就在云端开始改代码了。
方式二:CLI 版
npm install -g @openai/codex
安装后运行:
codex
第一次会让你选登录方式——选"Sign in with ChatGPT",直接用你的 ChatGPT 订阅额度,不用单独充值。
CLI 版可以直接操作本地文件,适合喜欢在终端里干活的人:
codex "帮我写一个 Python 脚本,批量重命名当前目录下的图片文件"
方式三:IDE 插件
VS Code 扩展商店搜 "Codex",装 OpenAI 官方插件。装完后侧边栏会多一个 Codex 面板,写代码的时候随时可以让它帮忙。
2.2 日常使用
Web 版的典型流程:
- 打开 chatgpt.com/codex,选择要操作的 GitHub 仓库
- 输入任务描述,比如:"修复 issue #42 中描述的登录超时问题"
- 点"Code"(让它写代码)或"Ask"(只问问题不动代码)
- Codex 在云端沙盒里开始工作,页面上能实时看到它在读哪些文件、改了什么
- 完成后审查改动,满意的话直接创建 PR 到 GitHub
并行任务——Codex 最大的杀手锏:
这是 Codex 跟 Claude Code 最大的区别。Claude Code 同一时间只能做一件事,Codex 可以同时跑好几个任务:
- 任务 1:修复登录超时 bug
- 任务 2:给 API 加单元测试
- 任务 3:重构数据库查询逻辑
三个任务在不同的云端沙盒里同时跑,互不干扰。我试过同时开 5 个任务,都能正常完成。这对于要赶进度的时候太有用了——把 issue 列表里的任务批量丢给它,自己去做别的事。
GitHub 深度集成:
在 GitHub 的 issue 或 PR 评论里 @codex,它会自动创建任务:
@codex 请根据这个 issue 的描述修复 bug,并添加相关测试
这个功能在团队协作里很好用。产品经理提了 issue,直接 @codex 让它先出个初版 PR,开发再在这个基础上 review 和调整。
2.3 进阶:AGENTS.md 配置
跟 Claude Code 的 CLAUDE.md 一个思路,Codex 用 AGENTS.md 来了解项目。放在仓库根目录就行。
但 Codex 的 AGENTS.md 有个特别重要的用途:告诉它怎么验证自己的改动。因为 Codex 在云端沙盒里跑,它改完代码后会自己跑测试。如果你不告诉它测试命令,它可能猜错,或者干脆不跑测试就交差了。
# AGENTS.md
## 项目结构
- /src — 源代码
- /tests — 测试文件
- /docs — 文档
## 开发环境
- Python 3.11
- 依赖管理:poetry
- 安装依赖:poetry install
- 跑测试:poetry run pytest -v
- 代码检查:poetry run ruff check .
- 类型检查:poetry run mypy src/
## 验证清单(每次改完代码必须做)
1. poetry run pytest -v — 所有测试必须通过
2. poetry run ruff check . — 不能有 lint 错误
3. poetry run mypy src/ — 类型检查必须通过
## 代码规范
- 遵循 PEP 8
- 类型注解必须写,不要用 Any
- 每个公开函数必须有 docstring
- 测试覆盖率不低于 80%
## 注意事项
- 不要修改 migrations/ 目录下的已有文件
- 新增 API 端点需要同步更新 docs/api.md
- PR 标题格式:feat/fix/refactor: 简短描述
写好这个文件之后,Codex 生成的 PR 质量会明显提升——它会自己跑完验证清单里的命令,通过了才提交。
2.4 进阶:环境配置
Codex 的云端沙盒默认是一个干净的 Linux 环境。如果你的项目需要特殊依赖(比如系统级的库、特定版本的数据库客户端),需要在仓库设置里配置 setup 脚本。
在仓库根目录创建 codex-setup.sh:
#!/bin/bash
# Codex 沙盒初始化脚本
apt-get update && apt-get install -y libpq-dev # PostgreSQL 客户端库
poetry install # 安装 Python 依赖
npm ci --prefix frontend # 安装前端依赖
这样每次 Codex 创建沙盒时都会先跑这个脚本,环境就跟你本地一致了。我之前有个任务一直失败,查了半天发现是沙盒里没装 libpq-dev,加了这个脚本就好了。
2.5 Web 版 vs CLI 版怎么选
我两个都用过一段时间,说说体感:
- Web 版适合"甩手掌柜"模式——丢个任务过去,过一会儿回来看结果。不用开终端,不用在本地跑任何东西。我在手机上都能用 Web 版给 Codex 派任务。
- CLI 版适合需要跟本地文件交互的场景。比如你想让它改一个还没推到 GitHub 的本地文件,CLI 版可以直接操作。
- IDE 插件适合写代码时随手问问题或者让它补全一段逻辑。
三种方式共享同一个后端,任务和历史互通。我的习惯是:批量任务用 Web 版,本地调试用 CLI 版。
三、OpenClaw
3.1 五分钟上手
OpenClaw 的安装比前两个多几步,因为它不只是一个命令行工具——它是一个要 7×24 小时跑着的服务。但别被吓到,跟着走就行。
安装:
npm install -g openclaw
初始化:
openclaw init
这一步会引导你做三件事:
- 选模型:推荐先用 Gemini,Google 给的免费额度很大方,够你玩一阵子。后面觉得不够好再换 Claude 或 GPT
- 填 API Key:去对应模型厂商的控制台拿。Gemini 的在 Google AI Studio 里,30 秒就能搞定
- 连聊天渠道:可以先跳过,用终端对话也行。等你确定要长期用了再配飞书/QQ
启动:
openclaw gateway start
Gateway 会在后台运行。检查一下状态:
openclaw gateway status
看到 "running" 就说明启动成功了。现在可以在终端里跟它聊天:
openclaw chat
OpenClaw 最好跑在一台长期在线的机器上——云服务器、NAS、甚至一台吃灰的旧笔记本都行。我自己是跑在一台腾讯云轻量服务器上,2 核 4G 的配置绑绑有余。如果只是试玩,本地跑也没问题,关机了它就休息。
3.2 日常使用
OpenClaw 跟前两个产品最大的不同是:它不只是一个编程工具,更像一个全能助手。我日常用它做的事情五花八门:
终端对话:
openclaw chat
> 帮我看看当前目录有什么文件
> 总结一下这篇文章的要点(粘贴 URL)
> 帮我写一封请假邮件,明天有事
通过聊天渠道(这才是主要用法):
配置好飞书或 QQ Bot 之后,直接在手机上给它发消息就行。我现在的使用习惯是这样的:
- 早上通勤时在 QQ 上问它:"今天天气怎么样?需要带伞吗?"
- 工作中让它帮忙查资料:"帮我搜一下 React Server Components 的最新进展"
- 想到什么事情随手记:"记一下,下周三要交项目方案"
- 晚上让它帮忙整理:"把今天的工作日志整理一下"
因为它 7×24 小时在线,而且有记忆系统,用起来就像有个随时待命的私人助理。
定时任务:
openclaw cron add \
--name "每日新闻整理" \
--cron "0 9 * * *" \
--tz "Asia/Shanghai" \
--session isolated \
--message "搜索今天的 AI 行业新闻,整理成摘要发给我"
这样每天早上 9 点,它会自动搜新闻、整理摘要、推送给你。我设了三个定时任务:早间天气、AI 新闻摘要、每周五下午的周报提醒。省了不少重复劳动。
3.3 进阶:Skill 安装
Skill 是 OpenClaw 的能力扩展包。默认装完的 OpenClaw 能聊天、能搜索、能读写文件,但如果你想让它查天气、操作 GitHub、分析股票,就需要装对应的 Skill。
# 搜索可用的 Skill
openclaw skills search weather
# 安装
openclaw skills install weather
# 查看已安装的 Skill
openclaw skills list
装完之后不需要重启,Agent 下次对话时会自动加载新 Skill。
我目前装了这些,都是实际在用的:
weather— 天气查询,配合定时任务每天早上推送github— 查 issue、看 PR、管理仓库,不用打开网页summarize— 丢个链接给它就能出摘要,看长文章的利器stock-analysis— 股票行情和简单分析,盯盘用(不构成投资建议哈)youtube-watcher— 提取 YouTube 视频字幕并总结,看英文技术视频时特别有用
每个 Skill 安装后,在工作目录的 skills/ 文件夹下会有一个对应的目录,里面有 SKILL.md 说明文件。如果你想了解某个 Skill 的具体能力和配置项,直接看这个文件就行。
如果现有的 Skill 不能满足你的需求,可以自己写。一个 Skill 本质上就是一个目录加一个 SKILL.md 描述文件。OpenClaw 文档里有详细的 Skill 开发指南:docs.openclaw.ai
3.4 进阶:记忆系统配置
记忆系统是 OpenClaw 跟普通 AI 聊天最大的区别。ChatGPT 关掉窗口就忘了你是谁,OpenClaw 不会。
工作目录下有几个关键文件,理解它们的作用很重要:
MEMORY.md — 长期记忆
Agent 会自己维护这个文件,把它认为重要的事情记下来。比如你告诉它"我对花生过敏",下次你让它推荐餐厅时它会自动避开。你也可以手动编辑这个文件,主动告诉它一些背景信息:
# MEMORY.md
- Allen 是产品经理,在上海工作
- 常用的编程语言是 Python 和 TypeScript
- 喜欢简洁的写作风格,讨厌废话
- 每周三下午有固定的团队会议
- 对 AI Agent 领域特别关注
SOUL.md — Agent 的"性格"
这个文件定义 Agent 怎么跟你说话。我调了好几版才找到满意的风格:
# SOUL.md
- 说话简洁直接,不要客套话
- 有自己的判断,不要什么都说"好的"
- 不确定的事情先查证再回答,别瞎编
- 可以适当幽默,但别硬凹
- 用中文回复,技术术语保留英文
这个文件的效果比你想象的大。没配 SOUL.md 之前,Agent 回复总是一股"AI 客服味"——"好的,我来帮您处理"。配了之后明显自然多了。
AGENTS.md — 行为规范
定义 Agent 的工作流程、安全边界、工具使用规范。这个文件比较长,建议参考 OpenClaw 文档里的模板,根据自己的需求改。
memory/YYYY-MM-DD.md — 每日日志
Agent 每天的工作记录,自动生成的。偶尔翻翻能看到它做了什么、记了什么。我有时候会发现它记了一些有意思的东西——比如它注意到我连续三天问天气,就自己在日志里写了"考虑建议 Allen 设一个天气定时任务"。
3.5 进阶:多渠道配置
渠道就是你跟 Agent 聊天的入口。OpenClaw 支持不少渠道,我用过的有飞书、QQ Bot 和 Discord。
以飞书为例,配置过程大概是:
- 在飞书开放平台创建一个自建应用
- 开启机器人能力,配置事件订阅
- 把 App ID 和 App Secret 填到 OpenClaw 的配置里
- 重启 Gateway
# 配置飞书渠道
openclaw config set feishu.appId "cli_xxxx"
openclaw config set feishu.appSecret "your-secret"
openclaw gateway restart
配好之后,在飞书里搜索你的机器人名字,发消息就能聊了。
飞书的事件订阅配置有点绕。你需要在飞书开放平台的"事件与回调"里添加 im.message.receive_v1 事件,然后把 OpenClaw 的回调地址填进去。如果你的服务器没有公网 IP 或者在 NAT 后面,需要用 OpenClaw 的内置穿透功能或者自己配 ngrok。我第一次配的时候在这里卡了半小时。
QQ Bot 的配置更简单一些,因为 OpenClaw 对 QQ 官方机器人 API 做了封装。具体步骤看文档就行,这里不展开了。
一个 OpenClaw 实例可以同时连多个渠道。我现在是飞书和 QQ 同时连着——工作时间用飞书,下班后用 QQ。Agent 的记忆是跨渠道共享的,不管你从哪个渠道跟它说话,它都记得之前的对话。
3.6 进阶:模型配置和故障转移
OpenClaw 支持配置多个模型,这是它作为"长期运行服务"的一个重要设计——你不会希望凌晨 3 点某个模型 API 挂了,你的 Agent 就彻底罢工。
主力模型 → 备用模型 1 → 备用模型 2 → ...
主力模型挂了或者达到限额,自动切到下一个。用户无感知。
我自己的配置策略,供参考:
- 日常对话:Gemini Flash 打底(免费额度大,速度快),Claude Sonnet 备用
- 复杂任务:Claude Opus 主力(推理能力强),GPT-4o 备用
- 至少配 2 个不同厂商的模型,这样一家挂了另一家还能顶上
为什么不全用最强的模型?因为贵,而且慢。日常闲聊和简单查询用 Flash 级别的模型完全够了,响应还快。只有写长文、做分析这种需要深度思考的任务才值得用 Opus/GPT-4o。OpenClaw 可以根据任务复杂度自动选模型,但你也可以手动指定。
3.7 进阶:心跳和定时任务
心跳是让我觉得 OpenClaw 真正"活着"的功能。配置好后,Agent 会定期(默认 30 分钟)自己"醒来",检查有没有需要处理的事。不是你找它,是它主动找你。
在工作目录下创建 HEARTBEAT.md,写上每次心跳要检查的事项:
# HEARTBEAT.md
- 检查 GitHub 有没有新的 issue 或 PR 需要关注
- 检查最近的日志有没有需要整理的
- 如果是工作日早上,看看今天的日程
- 没什么事就回复 HEARTBEAT_OK,别打扰我
最后那句"别打扰我"很重要——不然它每 30 分钟给你发一条"一切正常",烦死了。
定时任务(Cron)更精确,适合固定时间要做的事:
# 每天早上 9 点推送天气
openclaw cron add \
--name "早间天气" \
--cron "0 9 * * *" \
--tz "Asia/Shanghai" \
--session isolated \
--message "查一下今天上海的天气,简短告诉我需不需要带伞"
# 每周一早上发周报提醒
openclaw cron add \
--name "周报提醒" \
--cron "0 10 * * 1" \
--tz "Asia/Shanghai" \
--session isolated \
--message "提醒:今天要写周报。帮我回顾一下上周的工作日志,列出关键事项"
心跳和 Cron 的区别:心跳是"有空就看看",Cron 是"准时执行"。我的经验是,检查类的任务用心跳(邮件、通知),推送类的任务用 Cron(天气、提醒)。
管理定时任务:
openclaw cron list # 查看所有任务
openclaw cron remove <id> # 删除任务
3.8 常见问题排查
用了几个月,踩过的坑整理一下:
Agent 不回复:
- 先看 Gateway 是不是挂了:
openclaw gateway status - 再看模型 API Key 是不是过期了:
openclaw status - 还不行就看日志:
openclaw logs --follow,一般日志里会有明确的错误信息 - 最常见的原因其实是模型厂商那边限流了,等几分钟再试就好
上下文满了(Agent 开始"忘事"或者胡说八道):
- 发
/compact压缩上下文,它会保留关键信息丢掉细节 - 如果 compact 后还是不行,
/reset重置会话 - 别担心丢信息——重要的东西 Agent 已经存到 MEMORY.md 了,重置后它还记得你是谁
Skill 装了但不生效:
- 确认 Skill 目录下有 SKILL.md 文件
- 试试重启 Gateway:
openclaw gateway restart - 直接问 Agent:"你现在有哪些 Skill?"看它能不能列出来
四、实用技巧汇总
Claude Code 技巧
- CLAUDE.md 是你最好的投资:花 10 分钟写好这个文件,能省你后面几十个小时的重复沟通。特别是"禁区"和"项目里的坑"这两节
- 大任务拆着给:别说"重构整个项目",说"先分析耦合度,然后从 UserService 开始"。Agent 跟人一样,目标越清晰干得越好
- 定期 /compact:我的习惯是每改完一个功能就 compact 一次。不然上下文满了它会开始犯低级错误
- 不确定就先问:在让它动手之前,先说"分析一下这个问题,给我方案但先别改代码"。看完方案再决定要不要执行
- Ctrl+C 是你的好朋友:发现方向不对立刻打断,别等它改完一大堆再推翻
Codex 技巧
- AGENTS.md 里写验证命令:这是提升 Codex PR 质量最有效的一招。它改完代码会自己跑验证,通过了才提交
- 并行是杀手锏:有 5 个独立的 bug 要修?一次全丢给它,别排队。我试过同时跑 5 个任务都没问题
- 在 GitHub 里 @codex:产品经理提 issue,直接 @codex 让它出初版 PR,开发在这个基础上 review。这个工作流在我们团队跑得很顺
- 别盲目合并:Codex 的代码质量不错,但它不了解你的业务上下文。每个 PR 都要认真 review,特别是涉及业务逻辑的部分
OpenClaw 技巧
- "记一下"三个字很有用:跟 Agent 说完重要的事,加一句"记一下"。它会写进 MEMORY.md,下次不用重复
- 定期翻 MEMORY.md:看看 Agent 记了什么,有错的及时纠正。我发现过它把我的生日记错了一天
- 先搜 Skill 再自己做:想让它干什么新事情之前,先
openclaw skills search看看有没有现成的 - 模型故障转移必须配:别只配一个模型。凌晨 3 点 API 挂了你不会想爬起来修的
- SOUL.md 值得花时间调:Agent 的"性格"直接影响你跟它相处的体验。多试几版,找到你舒服的风格
五、三款产品对比:选哪个?
| 你的场景 | 推荐 | 原因 |
|---|---|---|
| 日常写代码,想要个结对编程的搭档 | Claude Code | 终端里直接用,跟你的开发流程无缝衔接 |
| 一堆 bug 要修,想并行处理 | Codex | 同时跑多个任务,改完直接提 PR |
| 想要一个 7×24 在线的私人助手 | OpenClaw | 不只是编程,生活工作都能帮上忙 |
| 不想折腾,5 分钟就要能用 | Claude Code 或 Codex Web | 安装最简单,上手最快 |
| 想完全掌控,深度定制 | OpenClaw | 记忆、性格、Skill、渠道全都能自定义 |
| 预算有限 | OpenClaw + Gemini | Google 的免费额度很大方,日常够用 |
| 团队协作 | Codex | GitHub 深度集成,@codex 工作流很顺 |
说实话,这三个不是互斥的。我自己就同时用着 Claude Code 和 OpenClaw——写代码时开 Claude Code,其他时间跟 OpenClaw 聊。Codex 在需要批量处理 issue 的时候拿出来用。
不知道选哪个?看这个 👇
选择困难?从 Claude Code 开始,它上手最快。等你有更多需求了再加其他的。
结尾
这是系列的最后一篇。从第一篇的"Agent 到底是什么"到这篇的实战操作,四篇写下来,我自己对这三款产品的理解也更清晰了。
说几句真心话:Agent 工具现在还在早期,每个产品都有各自的毛病——Claude Code 偶尔会犯迷糊改错文件,Codex 的沙盒环境有时候跟本地不一致,OpenClaw 的配置确实有点多。但它们已经实实在在地改变了我的工作方式。我现在写代码的效率大概是一年前的 3 倍,不夸张。
别光看教程,打开终端试试。装一个 Claude Code 只要一分钟,跑起来之后你就知道 Agent 到底能帮你做什么了。
有问题欢迎来我的博客留言,或者直接在 GitHub 上找我。
Allen | AI 产品经理 | allen00.top