3 天, 61 个版本｜非程序员的我用 Claude Code 接棒维护了自己的博客主题-我不是咕咕鸽

前几天一个周末，我把自己博客用的主题 fork 了一份，花了 3 天时间，发了 61 个版本，解决了一堆多年来一直想改但没改的小问题，顺便踩了 N 个大坑。

这篇就把这段 "非程序员 × Claude Code" 的 vibe coding 实录和大家分享一下。也顺便聊聊用下来对几家 AI 订阅的真实看法，还有一点关于 "软件门槛" 和 "肉身能力" 的胡思乱想。

内容会有点长，但都是真金白银踩出来的体感。

起点——博客主题好久没更新了

咕咕这个博客用的是 Halo 平台 + Joe3 主题，作者是 Jiewenhuang。这个主题其实非常好用，做得也很漂亮，我前前后后用了好几年，一直挺满意的。

但最近一两年，作者因为工作原因更新慢了下来。这完全可以理解——开源主题作者本来就是用爱发电，有自己的主业和生活，能一直维护已经很难得。但对用户来说就是：

有几个小 bug 长期挂着没修
有几个想要的小功能提了 issue，但一直排队
深色模式有些细节抠得不够到位
性能上有些可以优化但还没做

这些东西我其实都想自己动手改，但之前一直有个拦路虎——我不是程序员，平时也就是会点 VPS 折腾、写写 Docker 命令，真要去啃主题源码，心里还是怯的。

那为啥现在突然敢动手了？因为一个东西：Claude Code。

从伸手党到自己动手——为什么决定 fork

我在openclaw出来不久的时候，一开始订阅了kimi的coding plan，后来觉得不够好用，听网上一堆人说GPT和Claude好用，就尝试订阅了 Claude Pro（每月 20 美元那种），偶尔用来问问问题、写写文案，确实不错。但一直没用它写代码——总觉得太复杂了。

直到有一次，我随口让 Claude 帮忙看了下主题里一段 CSS，想改个小边距。它不光改对了，还顺带解释了为什么这么改，甚至告诉我 "你这个改动会影响移动端，建议加个 media query"。

那一瞬间我突然意识到：原来这事儿是可以自己干的。

不是说我一夜之间学会了前端，而是——有 Claude 在，你只要能描述清楚你要什么、看得懂 git diff、会复制报错，剩下的它都能兜住。这个门槛突然低到一个非程序员也能跨过去的程度。

然后想法就顺理成章了：

要等主题原作者更新？大概率很难
要发 PR？很多功能其实只有我自己需要（比如一些自定义侧边栏、适配自己阅读习惯的字号行高），发上去作者不一定合，也不应该合
那 fork 一份自己维护就好了

打定主意，Max 套餐开了（后面会细聊为啥咬牙从 Pro 升 Max），本地 Halo 环境跑了起来，VS Code + Claude Code 都准备好了。

然后故事就开始了。

3 天 61 个版本——一发不可收拾，根本停不下来

一开始我没想到会搞这么快。本来预期是"一周弄个能用的版本"，结果 Claude Code 的节奏推着我往前走，一发不可收拾，根本停不下来。

这是真实的 git log 统计：

日期	星期	发了多少版	主要做了啥
2026-04-19	周日	5 版	热身 · SEO / 初版性能优化
2026-04-20	周一	44 版	暴风骤雨日 · 翻车最多的一天
2026-04-21	周二	12 版	安全补丁 hotfix 系列收官

3 天, 61 个 tag。 作为对比，原作者过去两年发了大概 30 个版本——Claude Code 这个节奏，直接比原作者快 15 倍（当然其实很多小改动完全可以合并起来一次发版，不知道是Claude还是我给的skill的原因，这边图快就直接一个改动一个 tag 推了，虚胖成分有一些）。

当然这不是在炫耀速度。这个速度之所以能跑起来，是因为：

小需求说清楚 → Claude 几分钟就能改完 + 解释
本地跑一下 → 有问题直接贴报错给它
没问题 → git commit + tag + push
GitHub Actions 自动打 release zip → Halo Console 一键升级

整个反馈循环被压缩到 10 分钟以内。人只要负责 "想清楚要啥 + 看一眼做对了没"。

仓库在这里，感兴趣的同学可以看下完整的 commit history：

👉 github.com/Lau0x/halo-theme-joe-next

翻车现场合集——61 版里至少一半是在修前一版

光说 "3 天 61 版" 好像挺厉害，但真相是：其中至少一半，都是在修前一个版本的坑。

下面这几个翻车故事，是这 3 天里最有代表性的。不展开技术细节，就聊故事感——让大家感受下 AI 写代码到底是啥体验。

翻车现场 1——"3 + 1 = 31" 的谜题

想加一个 "相关推荐" 小卡片，在每篇文章末尾展示 3 篇同分类的文章。

Claude 几分钟写完，跑起来一看——页面上出现了 30 张卡。多了整整 27 张。

让它修，它改了一版，还是 30 张。再改一版，还是 30 张。连续 10 个候选版本 (rc.01 → rc.10) 都没修对。

最后逼它把变量打出来看，才发现是个非常隐蔽的类型问题：后台的 "3" 不是数字 3，是字符串 "3"。字符串 "3" + 1 在某些语言里等于 "31"，然后程序就真的去拉了 31 条文章。

一个让人哭笑不得的 bug。但也正因为它这么反直觉，Claude 自己怎么改都绕着走。

教训：AI 连续两三版修不对同一个问题的时候，不要再让它瞎猜了，直接让它打印真实的变量值。否则就是纯纯在 token 上烧钱。

翻车现场 2——给 jQuery 加了个小优化, 整站炸了

Claude 看了下主题代码，说 "jQuery 这样加载影响性能，给它加个属性可以异步加载，更快"。

听着有道理，就让它改了。

改完推上去，整个博客都打不开了。

翻车原因说起来也合理：jQuery 延迟加载之后，页面里好几十处其他脚本依赖它的地方跑得太早，找不到 jQuery，整站一片红。

最后直接把改动撤了，恢复原状。这个 "优化" 看上去简单，但真要做对，得把主题里几十处相关脚本一起调整，不是一下午能搞完的活。

教训：性能优化类的改动，生产验证前别打 tag。开个浏览器点一遍主要功能再发版。省事儿的 10 分钟，能省下一晚上查事故。

翻车现场 3——四版 UI 改造, 全被自己否了

这个可能是最戏剧性的一段。

我某天看动态页觉得不够好看，跟 Claude 说 "美化一下，搞得稍微有设计感一些"。

Claude 很兴致地给了个方案，发了 rc.01。我一看：不好看，页面上这个蓝色小圈圈是干啥的。

Claude：好的，我马上收紧！发 rc.02，删了一些元素。

我：完全不想要这套了。

Claude：那换个设计语言！现代社交网络风格！rc.03。

我：……这是好看了，但布局塌了，左边一列文字挤得一个字一行。

Claude：我修！rc.04，布局修对了。

我：还是没有原来的好看。算了，咱们回原版吧。

四个版本全废，一键 git revert 回到上一个 stable。

这段翻车事后反思，根因不是 Claude 审美差——而是我一开始就没把"想要什么样"说清楚。它在自己的审美空间里闭环了四版，每版都是"它认为的美化"，但和我脑子里那个隐约的画面完全对不上。

所以后来我给自己加了条规矩：以后让 AI 做视觉类改动，开工前必须给它一个参考站 URL，或者几个情绪板关键词。不然就是四版起步的翻车。

翻车现场 4——修了个隐私漏洞, 结果所有内容都不显示了

这个翻车比较严重。

起因是一个真实的安全问题：后台某条动态设为 "私有" 之后，但管理员登录访问博客前台，私有动态居然还能看到内容。

典型的主题层漏了一道过滤。

我让 Claude 加过滤，它加了一行判断，推上去。

我一看：所有动态都不显示了，包括本该显示的公开动态。

再查才发现 Claude 用错了比较方式——字段的实际类型和它以为的不一样，导致判断永远失败，全部被过滤掉了。

再改一版，修对了。再改一版，清理掉调试代码，收官。就为了修这一个 bug，一口气发了三个补丁版本。

教训：AI 的判断看起来都挺合理，但一定要跑真实数据验证。不然它拍胸脯说"这下肯定对了"，上生产之后可能就是另一个故事。

翻车现场 5——CSS 里的神秘竖条

这个就是翻车 3 里那个 rc.03。上完新设计，打开一看——两列内容里，左边一列宽大约 100 像素, 右边一列 800 像素。左边那列里的文字被压得一个字一行竖着排，像被揉过一样。

Claude 以为是自己写错了参数，改了好几次边距和间距，都没用。

后来查出来是 CSS 里的一个经典陷阱——简单说就是 "平均分配宽度" 这个写法遇到了 "不能换行的超长内容"，两边就不平均了。

这个坑是前端圈公认的经典老坑，但如果不踩一次，你根本不知道会有这种问题。

这就是 vibe coding 的真实面貌——你不是在写代码, 你是在和各种古怪的坑玩。

一个月付了 $168 AI 订阅费, 为啥最后都用 Claude

聊完翻车，顺带聊一下订阅选择。因为这一波下来，我对 "哪家 AI 最值得付费" 有了点新认识。

从 Pro 咬牙升到 Max

我一开始用的是 Claude Pro（每月 $20），觉得挺够用的，日常搞点东西没啥压力。

但真要让 Claude Code 做 vibe coding 这种 "一天 20+ 版本" 的节奏，Pro 套餐很快就触顶——几个小时就把当日额度用完，然后就只能干等着刷新。

咬着牙升了 Max（每月 $100）。升级那一刻说实话是有点肉疼的。

但用了两天就想通了：

100 美元每月, 当学费其实很便宜。

你想想——如果我去找个独立开发者，把这 3 天干的活外包出去，主题 fork + 新 feature + 安全补丁 + SEO 优化 + 性能优化 + 几个 bug fix，怎么也得 500-1000 美元起步。Max 这 $100，算当月 "学费 + 外包费"，比外包便宜，比自学快，最后东西还完全属于我自己。

除此之外，我还可以用它来辅助我的工作（excel里也可以用Claude了）。

顺便放张 Max 使用面板截图给大家感受一下强度：

一周用到 77%（All models），Current session 也跑了 17%。真用爆了。

月付 $168 的 AI 订阅全家桶

为了写这篇，我盘了下自己每月的 AI 订阅费：

工具	月费	主要用途	实测体感
Claude Max	$100	Claude Code / 主力 vibe coding / 长对话	⭐⭐⭐⭐⭐ 最稳最聪明，开发主力
ChatGPT Plus	$20	OpenClaw / 日常问答 / GPT 5.4	⭐⭐⭐⭐ 最近升级的 GPT 5.4 确实聪明了不少
Gemini Pro	$20	偶尔对比答案，长文本场景	⭐⭐⭐ 特定场景还行
Kimi	¥199 (≈$28)	中文长文，OpenClaw 备用	⭐⭐ 体感明显弱一个档次

合计：约 $168 / 月。

这个钱多不多？不少。但我就当学习AI交的学费了，之后看看能不能取消掉1-2个不常用的。

一条选型经验——选你能力范围内最好的模型

过去这段时间同一套 OpenClaw 工具链，我分别用 Kimi 2.5、GPT 5.4 试了一遍：

Kimi 2.5：总感觉差点意思，回答经常跑偏，得反复 prompt 才能拉回来
GPT 5.4：明显聪明，大部分需求一次过

同一个任务，两家结果差异非常大。

我得出的一条经验是：

选模型，在自己能力范围内选最好的，会用得更爽。

便宜 20% 但差 50%，算总账其实亏。因为差的模型浪费的不是钱, 是你自己的时间和耐心，甚至你还会怀疑这个东西真的好用吗？。就和你刚学琴买了一把300块的吉他，F和弦怎么也按不出来，你会怀疑自己我是不是真的学不会吉他。

最后吐个槽。GPT 的 Codex（OpenAI 自己的命令行工具）我也试了，结果最大的体验是——老是弹这个：

⚠️ Agent failed before reply: OAuth token refresh failed for openai-codex:
Failed to refresh OAuth token for openai-codex. 
Please try again or re-authenticate.

每几天就让你重新登录一次。体感很差。

最大的收获是"掌控感"

聊完钱，聊聊情绪。

回头看这 3 天、61 个版本、5 个典型翻车、一堆踩坑笔记，最大的收获不是技术层面的，而是——掌控感。

自己的博客, 自己说了算

这种感觉很难形容。

以前看到博客某个样式不喜欢，只能忍。
想加个小功能，只能发 issue 等。
字号大小、行高、颜色有几个小细节不爽，只能告诉自己习惯就好。

现在？

想改就改。想删就删。想加啥加啥。不喜欢这个主题了——甚至可以让 Claude 帮我从头写一个。

这种 "一切都在自己手里" 的感觉太爽了！

从博客到小工具, 软件的门槛在降低

而且这事不只是博客。

我最近还在琢磨几个小想法——想做一个 iOS 小 APP，专门用来提醒自己 VPS 和各种订阅服务到期续费，免得哪天 "传家宝 VPS" 突然就没了（其实现在已经做差不多了）；也想搞个 Chrome 插件，还没想好具体做啥，但感觉总能用上。

这些以前想都不敢想。Swift 学起来多难啊，Xcode 折腾一整天，可能只出一个崩溃。

但现在，描述清楚需求，Claude 自己写、自己跑、自己调、自己解释。一个非程序员，3 天能发 61 版博客主题，那做个小 APP 呢？可能也就是一个周末。

软件的门槛，正在以肉眼可见的速度降低。

不是说程序员没用了——真正的工程问题还是需要专业的人。但对于 "我想给自己做个小东西" 这个诉求，门槛已经被 AI 摊平了。这是肉眼可见的变化。

写在最后——软件门槛降低了, 下一道墙在哪?

聊到这儿，我想说点更胡思乱想的东西。

如果软件门槛真的降低了, 那下一道墙在哪？

我最近一直在琢磨这个问题。想法不成熟，但大致是这样。

第一道墙：硬件。

代码可以让 AI 写，但服务器会坏、光纤会断、电池会衰减、螺丝会生锈。未来 3 年 5 年，能动手改硬件、能拆能焊、能找到小众元器件、能修能造的人，可能反而稀缺。毕竟 AI 目前还没长手。

当然，机器人也在路上。

特斯拉的 Optimus、波士顿动力的 Atlas、还有国内各种人形机器人——再过几年，它们大概率能帮你做一部分 "需要手" 的事：拧螺丝、搬东西、简单清洁、甚至可能插插线修修电路。

但即便如此，我觉得还是有些事它们短期干不了：

判断当下最该做什么（机器人执行能力强，但"决定干啥"这事儿，还是人擅长）
精细手艺和经验（修老机器、拆解古董电子产品、手工打磨——这些靠的是感觉和长年积累的手感）
和人打交道的事（带朋友打麻将、哄孩子睡觉、陪父母聊天——这些不是机器人来"代做"就有意义的）

所以硬件这道墙，会被机器人慢慢矮化，但不会马上塌。

第二道墙, 可能更有意思——肉身能力。

我越来越觉得，那些必须花时间训练才能掌握的能力——英语、西班牙语、游泳、骑车、做饭、长跑——反而变得越来越重要。

为啥？因为软件可以让 AI 写，文案可以让 AI 编，图片可以让 AI 画，视频可以让 AI 生成。硬件未来让机器人干。

但你的身体不能让 AI 代练，也不能让机器人代练。

机器人再强，也没法替你去学一门新语言的肌肉记忆、没法替你游 1000 米感受水的阻力、没法替你骑车穿过一整座城市感受风。这些东西必须是你自己的时间、汗水、年轻换来的。

当所有人都有 AI 之后，大家的 "软件产出" 会被拉到差不多的水平。再过几年当所有人都有机器人之后，生活里 "需要动手做的事" 也会被拉到差不多。

那时候，真正拉开差距的，反而是那些最原始、最肉身、最不能外包的能力。

所以如果你问我，现在手头有点闲时间，该干啥？

去学一门新语言。去游个泳。去学骑公路车。去学做红烧肉。

因为那些东西，将来可能比写代码还值钱。

主题的仓库在这里：github.com/Lau0x/halo-theme-joe-next。

如果你也用 Joe3 主题，欢迎去下载最新版 zip 试试看，也欢迎提 issue。我维护得动，就一直维护下去，维护不动了，至少留一份 fork 给后来人。

OK，那差不多今天就聊这些，不知道有没有勾起大家 vibe coding 的兴趣，也欢迎大家评论区留下你的 AI 订阅搭配和踩坑经历～

目录CONTENT

3 天, 61 个版本｜非程序员的我用 Claude Code 接棒维护了自己的博客主题