目 录CONTENT

文章目录

3 天, 61 个版本|非程序员的我用 Claude Code 接棒维护了自己的博客主题

咕咕
2026-04-22 / 2 评论 / 1 点赞 / 63 阅读 / 0 字
温馨提示:
部分素材来自网络,若不小心影响到您的利益,请联系我们删除。
广告 广告

前几天一个周末,我把自己博客用的主题 fork 了一份,花了 3 天时间,发了 61 个版本,解决了一堆多年来一直想改但没改的小问题,顺便踩了 N 个大坑。

这篇就把这段 "非程序员 × Claude Code" 的 vibe coding 实录和大家分享一下。也顺便聊聊用下来对几家 AI 订阅的真实看法,还有一点关于 "软件门槛" 和 "肉身能力" 的胡思乱想。

内容会有点长,但都是真金白银踩出来的体感。

起点——博客主题好久没更新了

咕咕这个博客用的是 Halo 平台 + Joe3 主题,作者是 Jiewenhuang。这个主题其实非常好用,做得也很漂亮,我前前后后用了好几年,一直挺满意的。

但最近一两年,作者因为工作原因更新慢了下来。这完全可以理解——开源主题作者本来就是用爱发电,有自己的主业和生活,能一直维护已经很难得。但对用户来说就是:

  • 有几个小 bug 长期挂着没修
  • 有几个想要的小功能提了 issue,但一直排队
  • 深色模式有些细节抠得不够到位
  • 性能上有些可以优化但还没做

这些东西我其实都想自己动手改,但之前一直有个拦路虎——我不是程序员,平时也就是会点 VPS 折腾、写写 Docker 命令,真要去啃主题源码,心里还是怯的。

那为啥现在突然敢动手了?因为一个东西:Claude Code

从伸手党到自己动手——为什么决定 fork

我在openclaw出来不久的时候,一开始订阅了kimi的coding plan,后来觉得不够好用,听网上一堆人说GPT和Claude好用,就尝试订阅了 Claude Pro(每月 20 美元那种),偶尔用来问问问题、写写文案,确实不错。但一直没用它写代码——总觉得太复杂了。

直到有一次,我随口让 Claude 帮忙看了下主题里一段 CSS,想改个小边距。它不光改对了,还顺带解释了为什么这么改,甚至告诉我 "你这个改动会影响移动端,建议加个 media query"。

那一瞬间我突然意识到:原来这事儿是可以自己干的。

不是说我一夜之间学会了前端,而是——有 Claude 在,你只要能描述清楚你要什么、看得懂 git diff、会复制报错,剩下的它都能兜住。这个门槛突然低到一个非程序员也能跨过去的程度。

然后想法就顺理成章了:

  • 要等主题原作者更新?大概率很难
  • 要发 PR?很多功能其实只有我自己需要(比如一些自定义侧边栏、适配自己阅读习惯的字号行高),发上去作者不一定合,也不应该合
  • 那 fork 一份自己维护就好了

打定主意,Max 套餐开了(后面会细聊为啥咬牙从 Pro 升 Max),本地 Halo 环境跑了起来,VS Code + Claude Code 都准备好了。

然后故事就开始了。

3 天 61 个版本——一发不可收拾,根本停不下来

一开始我没想到会搞这么快。本来预期是"一周弄个能用的版本",结果 Claude Code 的节奏推着我往前走,一发不可收拾,根本停不下来。

2e0532b448b0787187335d641374daac.png

这是真实的 git log 统计:

日期 星期 发了多少版 主要做了啥
2026-04-19 周日 5 版 热身 · SEO / 初版性能优化
2026-04-20 周一 44 版 暴风骤雨日 · 翻车最多的一天
2026-04-21 周二 12 版 安全补丁 hotfix 系列收官

3 天, 61 个 tag。 作为对比,原作者过去两年发了大概 30 个版本——Claude Code 这个节奏,直接比原作者快 15 倍(当然其实很多小改动完全可以合并起来一次发版,不知道是Claude还是我给的skill的原因,这边图快就直接一个改动一个 tag 推了,虚胖成分有一些)。

当然这不是在炫耀速度。这个速度之所以能跑起来,是因为:

  • 小需求说清楚 → Claude 几分钟就能改完 + 解释
  • 本地跑一下 → 有问题直接贴报错给它
  • 没问题 → git commit + tag + push
  • GitHub Actions 自动打 release zip → Halo Console 一键升级

整个反馈循环被压缩到 10 分钟以内。人只要负责 "想清楚要啥 + 看一眼做对了没"。

仓库在这里,感兴趣的同学可以看下完整的 commit history:

👉 github.com/Lau0x/halo-theme-joe-next

翻车现场合集——61 版里至少一半是在修前一版

光说 "3 天 61 版" 好像挺厉害,但真相是:其中至少一半,都是在修前一个版本的坑

下面这几个翻车故事,是这 3 天里最有代表性的。不展开技术细节,就聊故事感——让大家感受下 AI 写代码到底是啥体验。

翻车现场 1——"3 + 1 = 31" 的谜题

想加一个 "相关推荐" 小卡片,在每篇文章末尾展示 3 篇同分类的文章。

Claude 几分钟写完,跑起来一看——页面上出现了 30 张卡。多了整整 27 张。

让它修,它改了一版,还是 30 张。再改一版,还是 30 张。连续 10 个候选版本 (rc.01 → rc.10) 都没修对。

最后逼它把变量打出来看,才发现是个非常隐蔽的类型问题:后台的 "3" 不是数字 3,是字符串 "3"。字符串 "3" + 1 在某些语言里等于 "31",然后程序就真的去拉了 31 条文章。

一个让人哭笑不得的 bug。但也正因为它这么反直觉,Claude 自己怎么改都绕着走。

教训:AI 连续两三版修不对同一个问题的时候,不要再让它瞎猜了,直接让它打印真实的变量值。否则就是纯纯在 token 上烧钱。

翻车现场 2——给 jQuery 加了个小优化, 整站炸了

Claude 看了下主题代码,说 "jQuery 这样加载影响性能,给它加个属性可以异步加载,更快"。

听着有道理,就让它改了。

改完推上去,整个博客都打不开了。

翻车原因说起来也合理:jQuery 延迟加载之后,页面里好几十处其他脚本依赖它的地方跑得太早,找不到 jQuery,整站一片红。

最后直接把改动撤了,恢复原状。这个 "优化" 看上去简单,但真要做对,得把主题里几十处相关脚本一起调整,不是一下午能搞完的活。

教训性能优化类的改动,生产验证前别打 tag。开个浏览器点一遍主要功能再发版。省事儿的 10 分钟,能省下一晚上查事故。

翻车现场 3——四版 UI 改造, 全被自己否了

这个可能是最戏剧性的一段。

我某天看动态页觉得不够好看,跟 Claude 说 "美化一下,搞得稍微有设计感一些"。

Claude 很兴致地给了个方案,发了 rc.01。我一看:不好看,页面上这个蓝色小圈圈是干啥的

Claude:好的,我马上收紧!发 rc.02,删了一些元素。

我:完全不想要这套了

Claude:那换个设计语言!现代社交网络风格!rc.03。

我:……这是好看了,但布局塌了,左边一列文字挤得一个字一行

Claude:我修!rc.04,布局修对了。

我:还是没有原来的好看。算了,咱们回原版吧。

四个版本全废,一键 git revert 回到上一个 stable。

这段翻车事后反思,根因不是 Claude 审美差——而是我一开始就没把"想要什么样"说清楚。它在自己的审美空间里闭环了四版,每版都是"它认为的美化",但和我脑子里那个隐约的画面完全对不上。

所以后来我给自己加了条规矩:以后让 AI 做视觉类改动,开工前必须给它一个参考站 URL,或者几个情绪板关键词。不然就是四版起步的翻车。

翻车现场 4——修了个隐私漏洞, 结果所有内容都不显示了

这个翻车比较严重。

起因是一个真实的安全问题:后台某条动态设为 "私有" 之后,但管理员登录访问博客前台,私有动态居然还能看到内容。

典型的主题层漏了一道过滤。

我让 Claude 加过滤,它加了一行判断,推上去。

我一看:所有动态都不显示了,包括本该显示的公开动态。

再查才发现 Claude 用错了比较方式——字段的实际类型和它以为的不一样,导致判断永远失败,全部被过滤掉了。

再改一版,修对了。再改一版,清理掉调试代码,收官。就为了修这一个 bug,一口气发了三个补丁版本。

教训:AI 的判断看起来都挺合理,但一定要跑真实数据验证。不然它拍胸脯说"这下肯定对了",上生产之后可能就是另一个故事。

翻车现场 5——CSS 里的神秘竖条

这个就是翻车 3 里那个 rc.03。上完新设计,打开一看——两列内容里,左边一列宽大约 100 像素, 右边一列 800 像素。左边那列里的文字被压得一个字一行竖着排,像被揉过一样。

Claude 以为是自己写错了参数,改了好几次边距和间距,都没用。

后来查出来是 CSS 里的一个经典陷阱——简单说就是 "平均分配宽度" 这个写法遇到了 "不能换行的超长内容",两边就不平均了。

这个坑是前端圈公认的经典老坑,但如果不踩一次,你根本不知道会有这种问题。

这就是 vibe coding 的真实面貌——你不是在写代码, 你是在和各种古怪的坑玩。

一个月付了 $168 AI 订阅费, 为啥最后都用 Claude

聊完翻车,顺带聊一下订阅选择。因为这一波下来,我对 "哪家 AI 最值得付费" 有了点新认识。

从 Pro 咬牙升到 Max

我一开始用的是 Claude Pro(每月 $20),觉得挺够用的,日常搞点东西没啥压力。

但真要让 Claude Code 做 vibe coding 这种 "一天 20+ 版本" 的节奏,Pro 套餐很快就触顶——几个小时就把当日额度用完,然后就只能干等着刷新。

咬着牙升了 Max(每月 $100)。升级那一刻说实话是有点肉疼的。

但用了两天就想通了:

100 美元每月, 当学费其实很便宜。

你想想——如果我去找个独立开发者,把这 3 天干的活外包出去,主题 fork + 新 feature + 安全补丁 + SEO 优化 + 性能优化 + 几个 bug fix,怎么也得 500-1000 美元起步。Max 这 $100,算当月 "学费 + 外包费",比外包便宜,比自学快,最后东西还完全属于我自己。

除此之外,我还可以用它来辅助我的工作(excel里也可以用Claude了)。

顺便放张 Max 使用面板截图给大家感受一下强度:

340e03b65e8744760fe7d2f6e8edd13b.png
6ad4b8472387bc1f7b97e2af7a656856.png

一周用到 77%(All models),Current session 也跑了 17%。真用爆了。

月付 $168 的 AI 订阅全家桶

为了写这篇,我盘了下自己每月的 AI 订阅费:

工具 月费 主要用途 实测体感
Claude Max $100 Claude Code / 主力 vibe coding / 长对话 ⭐⭐⭐⭐⭐ 最稳最聪明,开发主力
ChatGPT Plus $20 OpenClaw / 日常问答 / GPT 5.4 ⭐⭐⭐⭐ 最近升级的 GPT 5.4 确实聪明了不少
Gemini Pro $20 偶尔对比答案,长文本场景 ⭐⭐⭐ 特定场景还行
Kimi ¥199 (≈$28) 中文长文,OpenClaw 备用 ⭐⭐ 体感明显弱一个档次

合计:约 $168 / 月。

这个钱多不多?不少。但我就当学习AI交的学费了,之后看看能不能取消掉1-2个不常用的。

一条选型经验——选你能力范围内最好的模型

过去这段时间同一套 OpenClaw 工具链,我分别用 Kimi 2.5、GPT 5.4 试了一遍:

  • Kimi 2.5:总感觉差点意思,回答经常跑偏,得反复 prompt 才能拉回来
  • GPT 5.4:明显聪明,大部分需求一次过

同一个任务,两家结果差异非常大。

我得出的一条经验是:

选模型,在自己能力范围内选最好的,会用得更爽。

便宜 20% 但差 50%,算总账其实亏。因为差的模型浪费的不是钱, 是你自己的时间和耐心,甚至你还会怀疑这个东西真的好用吗?。就和你刚学琴买了一把300块的吉他,F和弦怎么也按不出来,你会怀疑自己我是不是真的学不会吉他。

最后吐个槽。GPT 的 Codex(OpenAI 自己的命令行工具)我也试了,结果最大的体验是——老是弹这个:

⚠️ Agent failed before reply: OAuth token refresh failed for openai-codex:
Failed to refresh OAuth token for openai-codex. 
Please try again or re-authenticate.

每几天就让你重新登录一次。体感很差。

最大的收获是"掌控感"

聊完钱,聊聊情绪。

回头看这 3 天、61 个版本、5 个典型翻车、一堆踩坑笔记,最大的收获不是技术层面的,而是——掌控感

自己的博客, 自己说了算

这种感觉很难形容。

以前看到博客某个样式不喜欢,只能
想加个小功能,只能发 issue 等
字号大小、行高、颜色有几个小细节不爽,只能告诉自己习惯就好

现在?

想改就改。想删就删。想加啥加啥。不喜欢这个主题了——甚至可以让 Claude 帮我从头写一个

这种 "一切都在自己手里" 的感觉太爽了!

从博客到小工具, 软件的门槛在降低

而且这事不只是博客。

我最近还在琢磨几个小想法——想做一个 iOS 小 APP,专门用来提醒自己 VPS 和各种订阅服务到期续费,免得哪天 "传家宝 VPS" 突然就没了(其实现在已经做差不多了);也想搞个 Chrome 插件,还没想好具体做啥,但感觉总能用上。

这些以前想都不敢想。Swift 学起来多难啊,Xcode 折腾一整天,可能只出一个崩溃。

但现在,描述清楚需求,Claude 自己写、自己跑、自己调、自己解释。一个非程序员,3 天能发 61 版博客主题,那做个小 APP 呢?可能也就是一个周末。

软件的门槛,正在以肉眼可见的速度降低。

不是说程序员没用了——真正的工程问题还是需要专业的人。但对于 "我想给自己做个小东西" 这个诉求,门槛已经被 AI 摊平了。这是肉眼可见的变化。

写在最后——软件门槛降低了, 下一道墙在哪?

聊到这儿,我想说点更胡思乱想的东西。

如果软件门槛真的降低了, 那下一道墙在哪?

我最近一直在琢磨这个问题。想法不成熟,但大致是这样。

第一道墙:硬件。

代码可以让 AI 写,但服务器会坏、光纤会断、电池会衰减、螺丝会生锈。未来 3 年 5 年,能动手改硬件、能拆能焊、能找到小众元器件、能修能造的人,可能反而稀缺。毕竟 AI 目前还没长手。

当然,机器人也在路上。

特斯拉的 Optimus、波士顿动力的 Atlas、还有国内各种人形机器人——再过几年,它们大概率能帮你做一部分 "需要手" 的事:拧螺丝、搬东西、简单清洁、甚至可能插插线修修电路。

但即便如此,我觉得还是有些事它们短期干不了:

  • 判断当下最该做什么(机器人执行能力强,但"决定干啥"这事儿,还是人擅长)
  • 精细手艺和经验(修老机器、拆解古董电子产品、手工打磨——这些靠的是感觉和长年积累的手感)
  • 和人打交道的事(带朋友打麻将、哄孩子睡觉、陪父母聊天——这些不是机器人来"代做"就有意义的)

所以硬件这道墙,会被机器人慢慢矮化,但不会马上塌。

第二道墙, 可能更有意思——肉身能力。

我越来越觉得,那些必须花时间训练才能掌握的能力——英语、西班牙语、游泳、骑车、做饭、长跑——反而变得越来越重要

为啥?因为软件可以让 AI 写,文案可以让 AI 编,图片可以让 AI 画,视频可以让 AI 生成。硬件未来让机器人干。

但你的身体不能让 AI 代练,也不能让机器人代练。

机器人再强,也没法替你去学一门新语言的肌肉记忆、没法替你游 1000 米感受水的阻力、没法替你骑车穿过一整座城市感受风。这些东西必须是你自己的时间、汗水、年轻换来的。

当所有人都有 AI 之后,大家的 "软件产出" 会被拉到差不多的水平。再过几年当所有人都有机器人之后,生活里 "需要动手做的事" 也会被拉到差不多。

那时候,真正拉开差距的,反而是那些最原始、最肉身、最不能外包的能力。

所以如果你问我,现在手头有点闲时间,该干啥?

去学一门新语言。去游个泳。去学骑公路车。去学做红烧肉。

因为那些东西,将来可能比写代码还值钱。


主题的仓库在这里:github.com/Lau0x/halo-theme-joe-next

如果你也用 Joe3 主题,欢迎去下载最新版 zip 试试看,也欢迎提 issue。我维护得动,就一直维护下去,维护不动了,至少留一份 fork 给后来人。

OK,那差不多今天就聊这些,不知道有没有勾起大家 vibe coding 的兴趣,也欢迎大家评论区留下你的 AI 订阅搭配和踩坑经历~

1
  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin
广告 广告

评论区