从11月份把 Claude Code 当作"更聪明的 Cursor",到现在把它当作一个靠谱的外包团队——这篇文章是20000次对话后的完整复盘。经 Claude Code 官方认证的重度用户,token 消耗量排在前1%。
认知转变:从 AI 助手到 AI 团队
11月份刚用 Claude Code 时,我觉得它只是更智能的 Cursor,编程准确度更高而已。
人还是得抬头看看世界。 在外部世界的启发下,以及和同事的交流中,我意识到 Claude Code 已经不能用"编程 AI 助手"来定义了。它不再是一个知识广泛的实习生,而是——
一个经验丰富、成本低廉的靠谱团队。
这个认知转变直接改变了我使用 Claude Code 的方式。不再是"写一个函数"这样的指令,而是"我有一个产品需求,帮我从 PRD 到上线全流程搞定"。
实战成果:20天做了3个产品
Claude Code 已经有了独立闭环一个产品的能力。这20天我用它做了:
| 产品 | 技术栈 | 用时 | 说明 |
|---|---|---|---|
| AI 对话 ChatBot | Flutter | 2天 | 支持语音文字、简历上传、AI 面试官 |
| iOS 启动器 App | iOS 原生 | 2天 | 快速原型验证 |
| GroAsk | macOS 原生 | 2周 | Claude Code 调度面板 |
三个产品全部 Vibe Coding,没有手写过一行代码。 Opus 4.5 时代还会看一下代码,到了 Opus 4.6,我没有看过一行代码。
GroAsk 是我自己日常使用 Claude Code 过程中,实在受不了反复切终端、忘记哪个 Session 在干嘛、上下文爆了还不知道,才动手做的。后面讲到的多 Session 管理和上下文管理,都跟它有关。
编程之外:Claude Code 还能做什么
很多人只把 Claude Code 当编程工具用,但它的能力远不止写代码:
- 自动发推特——借助浏览器 MCP 与 Skill,写完内容自动打开浏览器发布
- 自动写文章 & 多平台分发——自定义 Skill 一次性生成适配不同平台的文章
- 产品数据分析——读取真实运营数据,分析留存、转化、渠道效果
- 深度市场调研——调研竞品、收集用户痛点、分析市场趋势
Claude Code 本质上是一个通用的任务执行引擎,编程只是它最擅长的垂直场景。
我的产品迭代流程
小需求:一句话到上线
描述需求 → Claude Code 自动完成 → 直接上线 → 发现问题一句话修复
大部分日常需求都可以这样处理。比如"把菜单栏图标从 brain 换成闪电",一句话,30秒搞定。
大版本需求:结构化流程
需求收集 → PRD 产出 → 市场调研验证 → 技术方案 → 执行规划 → 按计划开发
具体来说:
- 需求收集:个人使用痛点 + Claude Code 社区反馈收集
- PRD 产出:描述原始需求,让 Claude Code 产出 PRD,结合市场调研验证
- 技术方案:Claude Code 编写技术方案,再用市场调研 review
- 执行规划:Claude Code 使用 TDD + Subagent 拆分任务
- 开发执行:Claude Code 按计划开发
一个3000字的 PRD → 10000字的技术方案 → 40000字的执行规划
核心原则
产品决策和技术决策是人最重要的工作。 完全交给 AI 决策,面对复杂任务时仍然不可靠——看似实现了需求,维护难度是地狱级的。做好方案,这是重中之重。
让 AI 实现一个小的需求点,远比让 AI 一次性完成大而全的需求,更容易、更可靠、效率也更高。
深度使用技巧
Skill:最强大的能力
核心理念:个人工作流程的固化。
Skill 是 Claude Code 最被低估的功能。它让你把反复执行的工作流程变成一条命令。
Skill 最重要的两部分:
- Prompt:用自然语言描述工作流程(需要模型理解判断的部分)
- Scripts:用代码描述工作流程(代码能搞定的部分)
只有需要模型理解判断的才用 Prompt,代码能搞定的都用 Script。
我的常用 Skill 举例:
/dev-ship:自动原子化提交 + 推送/dev-release:构建签名 → 公证 → 发布 GitHub Release/write-post:生成适配不同平台的分发文章/ops-status:一键拉取产品运营数据
把工作流固化成 Skill 的好处是:每次执行的质量是一致的。不会因为你今天状态好写得仔细,明天状态差就漏了步骤。
Subagent:复杂任务的上下文管理
Subagent 让你在一个会话内使用多个 Agent 管理工作。Claude 自带的 Task 工具就是 Subagent——主 Session 把部分工作交给内部 Session,自己只关注输入和输出。
使用场景:
- 并行处理多个独立子任务(比如同时为16个平台生成文章)
- 隔离上下文(子任务的中间过程不污染主 Session)
- 复杂任务分解(主 Session 做编排,子 Session 做执行)
MCP:扩展 Claude Code 的能力
- 我个人常用 8个 MCP,但强烈建议用更少的
- MCP 占据大量原始上下文,使用参数让 MCP 只保留接口
- 优先使用 Rust/Go 编译的 MCP,而非 Node,显著降低内存占用
Hooks:安全网
目前最有价值的 Hook:让 Claude Code 在删除任何未被备份的东西之前进行备份。
Hooks 是 Claude Code 的"事件钩子",在特定操作前后自动执行你定义的脚本。我用它来做安全检查:提交前检查是否有 print() 调试语句、是否忘了更新配置文件等。
终极调试技巧
在不同客户端实践中,让 AI 把日志写在本地,再根据日志排查问题。这是最有效的 bug 解决方式,没有之一。
你觉得 AI 搞不定了,就让它试试日志,绝对超出你的想象。很多时候 AI 看不到运行时的真实状态,日志把黑盒变成白盒,问题一下子就清晰了。
长期记忆:解决"今天说明天忘"
长期记忆是很多人的痛点。你今天跟 Claude Code 说了项目架构、编码规范、个人偏好,明天开新 Session 全忘了。
我的解决方案:知识分组。
- 维护一个分层的 Knowledge 文件夹,告诉 Claude Code"有价值的信息存储到知识里面"
- CLAUDE.md 分组管理:
- 根目录 CLAUDE.md:项目全局信息
- 子目录 CLAUDE.md:子项目特定规范
- Rules 目录:编码规范、经验沉淀
- 实现本地的长期记忆,越用越顺手
关键是分层——不要把所有信息塞进一个文件。Claude Code 的上下文是有限的,信息越精准、越结构化,模型理解得越好。
上下文管理:保持模型智能的关键
上下文管理是我认为最影响 Claude Code 使用体验的因素,也是最容易被忽略的。
| 策略 | 说明 |
|---|---|
| MCP 工具按需引入 | 使用参数精简接口暴露 |
| CLAUDE.md 分层分组 | 避免信息过载 |
| 上下文阈值 200k | 超过就换 Session |
| 避免压缩上下文 | 开新 Session 远优于压缩 |
| 实时监控 | 了解每个 Session 的上下文消耗 |
上下文不推荐超过200k(1M 窗口的20%)。区别就像工作日上午 vs 加班到深夜的同事——到了晚上,它脑子已经混乱了。永远用最智能的模型。
最后一条"实时监控"是最容易被忽略的。很多人用着用着上下文爆了还不知道,模型回答质量断崖下降才发现。这也是我做 GroAsk 的核心动机之一——菜单栏一眼能看到每个 Claude Code 终端的上下文用量、当前状态、排队情况,不用一个个切终端去查。
多 Session 管理:别只盯着一个窗口
不要同时只开一个 Claude Code 进程,盯着它干活太低效了。
- 舒适区:2-3个 Claude Code 进程并行
- 高强度场景:可以开到 5-10个
- 实时阅读每个 Session 的状态,只维护需要用户输入的 Session
但这里有个实际问题:当你开了 5 个以上的终端,光是 Cmd+Tab 找"哪个 Session 在等我"就够烦的了。我现在的做法是用 GroAsk 的调度面板把所有 Claude Code 终端集中管理——哪个在跑、哪个等输入、哪个上下文快满了,一目了然。⌥Space 呼出面板,点一下就跳到对应终端,不用在一堆窗口里翻找。
如果你也是多 Session 重度用户,可以试试:groask.com
模型的边界在哪里
模型的边界在于完全创新的能力。
做没有人做过的东西——训练数据里没有,只能推测。这时候,需要发挥的是人的创造力和判断力。
AI 可以帮你高效执行,但"做什么"和"怎么做"的决策,目前还是人的领地。
总结:三句话
- Claude Code 不是 AI 助手,是 AI 团队。 用管理团队的方式去用它。
- 人的核心价值是决策。 产品决策、技术决策、创新——这些交不出去。
- 工程化使用 AI。 Skill 固化流程、Subagent 管理复杂度、知识分组实现记忆、上下文管理保持智能。
作者日常使用 Claude Code 开发 GroAsk——一个 macOS 菜单栏 AI 工作台,⌥Space 直达所有 AI,实时监控多个 Claude Code 终端状态。如果你也在用 Claude Code,欢迎试试。