总结:要不试一试 Alma,比这个好玩。
https://x.com/fengzhou/status/2024332482322329905?s=20
总结:要不试一试 Alma,比这个好玩。
https://x.com/fengzhou/status/2024332482322329905?s=20
https://x.com/i/status/2024377436423541145
https://x.com/i/status/2024377436423541145
忍不住想给正在折腾的同志们指条路:试试 @NowledgeMem 吧,这玩意儿才是为 AI 而生的记忆系统,代差级体验。
先说下区别吧:
qmd 是人类的知识检索工具——适合"我有 10 年 Obsidian 笔记,想快速定位某段内容"的场景。它的逻辑是本地混合检索(BM25 + 向量 + rerank),你得维护索引、管理结构,本质是帮你更快找到你写的东西。
NowledgeMem 是 AI 的...
Read more: https://versun.me/blog/2026-02-17-22-39
忍不住想给正在折腾的同志们指条路:试试 @NowledgeMem 吧,这玩意儿才是为 AI 而生的记忆系统,代差级体验。
先说下区别吧:
qmd 是人类的知识检索工具——适合"我有 10 年 Obsidian 笔记,想快速定位某段内容"的场景。它的逻辑是本地混合检索(BM25 + 向量 + rerank),你得维护索引、管理结构,本质是帮你更快找到你写的东西。
NowledgeMem 是 AI 的...
Read more: https://versun.me/blog/2026-02-17-22-39
pi-mono,我弃坑了。
不是它不行,是我在反复折腾中,把自己绕进去了。
折腾了一周,本想基于 pi 搭个精简版 AI 代理,结果架构重构了 N 次,参考了 OpenClaw、ZeroClaw 一圈分身,代码越写越复杂,最后抬头一看——这不就是另一个 OpenClaw 吗?省 token、省内存、抠速度……全是工程师自嗨。
我们把"优化"当成目标,却忘了最初的目的是"用它做点什么有价值的事"。就像为了省油钱,把汽车拆了换成自行车,...
Read more: https://versun.me/blog/lessons-from-pi
pi-mono,我弃坑了。
不是它不行,是我在反复折腾中,把自己绕进去了。
折腾了一周,本想基于 pi 搭个精简版 AI 代理,结果架构重构了 N 次,参考了 OpenClaw、ZeroClaw 一圈分身,代码越写越复杂,最后抬头一看——这不就是另一个 OpenClaw 吗?省 token、省内存、抠速度……全是工程师自嗨。
我们把"优化"当成目标,却忘了最初的目的是"用它做点什么有价值的事"。就像为了省油钱,把汽车拆了换成自行车,...
Read more: https://versun.me/blog/lessons-from-pi
赶在除夕夜前,上线了我的第3个AI小轮子应用:https://send.versun.me
一个极简的匿名文件快递站。
文件拖进去,拿取件码,对方输入就能下载。24小时后自动销毁,不留痕迹。
为什么做?
之前传个临时文件要么注册账号(烦),要么永久留存(怕),要么用微信,我就想要一个像寄快递一样简单的东西:给码,取货,自动消失。
怎么做?
依旧全程 Vibe Coding 搞定:
软件:Codex App
...
Read more: https://versun.me/blog/50-apps-challenge-3-send
赶在除夕夜前,上线了我的第3个AI小轮子应用:https://send.versun.me
一个极简的匿名文件快递站。
文件拖进去,拿取件码,对方输入就能下载。24小时后自动销毁,不留痕迹。
为什么做?
之前传个临时文件要么注册账号(烦),要么永久留存(怕),要么用微信,我就想要一个像寄快递一样简单的东西:给码,取货,自动消失。
怎么做?
依旧全程 Vibe Coding 搞定:
软件:Codex App
...
Read more: https://versun.me/blog/50-apps-challenge-3-send
我把主流的几个(OpenClaw / Moltis / IronClaw / ZeroClaw / NanoClaw / PicoClaw / ZeptoClaw)丢给 Opus 做了波深度代码审计,从可维护性到可持续性扒了个透。
报告在此,供各位折腾党参考,别再造轮子了 ,用不过来啦,过年休息会吧!
https://openclaw-forks-evaluation-report-2026.versun.me/
我把主流的几个(OpenClaw / Moltis / IronClaw / ZeroClaw / NanoClaw / PicoClaw / ZeptoClaw)丢给 Opus 做了波深度代码审计,从可维护性到可持续性扒了个透。
报告在此,供各位折腾党参考,别再造轮子了 ,用不过来啦,过年休息会吧!
https://openclaw-forks-evaluation-report-2026.versun.me/
后续打算使用一个国内模型和一个国外模型,暂定 Kimi 和 OpenAI (感谢 @InsForge_dev 赞助),保持简洁,减少压力。。。
后续打算使用一个国内模型和一个国外模型,暂定 Kimi 和 OpenAI (感谢 @InsForge_dev 赞助),保持简洁,减少压力。。。
测试汇总:coding-model-comparison.versun.me
任务: 单页面力导向图,随机 100 个数据点,带基础交互功能。
完整复现包(提示词、生成结果、编码录屏)都扔 GitHub 了
TLDR:
完成度最高:GLM 5
速度最高:Opus 4.6
综合排名:GLM 5 > Opus...
Read more: https://versun.me/blog/2026-02-13-20-51
https://x.com/VersunPan/status/2022179861746663530?s=20
测试汇总:coding-model-comparison.versun.me
任务: 单页面力导向图,随机 100 个数据点,带基础交互功能。
完整复现包(提示词、生成结果、编码录屏)都扔 GitHub 了
TLDR:
完成度最高:GLM 5
速度最高:Opus 4.6
综合排名:GLM 5 > Opus...
Read more: https://versun.me/blog/2026-02-13-20-51
https://x.com/VersunPan/status/2022179861746663530?s=20
参赛选手:GLM-5, MiniMax-2.5, Kimi-2.5, GPT-5.3-Codex, Claude-Opus-4.6
让它们写啥程序能测出真实水平?除了贪吃蛇。。。
参赛选手:GLM-5, MiniMax-2.5, Kimi-2.5, GPT-5.3-Codex, Claude-Opus-4.6
让它们写啥程序能测出真实水平?除了贪吃蛇。。。
左边是5.3-codex,右边是5.3-codex-spark
也是做贪吃蛇,不过加了AI
提示词:
做个"贪吃蛇大作战",你控制一条,JS再跑一条自动寻路的AI蛇,AI要会抢食物、避障、偶尔犯傻(太强的AI没意思)。
结果:
速度:spark远胜
质量:5.3-codex一次成功,spark两次成功
左边是5.3-codex,右边是5.3-codex-spark
也是做贪吃蛇,不过加了AI
提示词:
做个"贪吃蛇大作战",你控制一条,JS再跑一条自动寻路的AI蛇,AI要会抢食物、避障、偶尔犯傻(太强的AI没意思)。
结果:
速度:spark远胜
质量:5.3-codex一次成功,spark两次成功
不通知的问题我是知道的,所以我准备去清理下一堆的黄色私信和币圈诈骗私信。
然后,搞笑的来了,竟然真有一个商单的私信!!核验过了,是真的账号,1月底发的!!我才一千多粉,还能轮得到我喝汤?🤣
我已经回复了,不知道还有机会吗😆
不通知的问题我是知道的,所以我准备去清理下一堆的黄色私信和币圈诈骗私信。
然后,搞笑的来了,竟然真有一个商单的私信!!核验过了,是真的账号,1月底发的!!我才一千多粉,还能轮得到我喝汤?🤣
我已经回复了,不知道还有机会吗😆
既然我们要让 AI 像人一样工作,就该让 AI 学会人的思维方式,而不是让人迁就 AI 的局限。
所以我给 Pi 助理写了一个 skill:自动判断话题是该延续,还是开启新对话,话题切换时自动判断是否要保存上下文,不用手动 /new,对话流转交给 AI 自己决定。
Skill 内容参考:clip.versun.me/p/qTdyXm...
Read more: https://versun.me/blog/2026-02-10-20-53
既然我们要让 AI 像人一样工作,就该让 AI 学会人的思维方式,而不是让人迁就 AI 的局限。
所以我给 Pi 助理写了一个 skill:自动判断话题是该延续,还是开启新对话,话题切换时自动判断是否要保存上下文,不用手动 /new,对话流转交给 AI 自己决定。
Skill 内容参考:clip.versun.me/p/qTdyXm...
Read more: https://versun.me/blog/2026-02-10-20-53
1. 提供商切换
注意:我没有使用pi内置的模型接口,而是通过自定义扩展来接入模型接口
clip.versun.me/p/3hLbCC0B
2. 并行会话和插话功能
clip.versun.me/p/2Ax9wE4O
3./new前自动保存会话
clip.versun.me/p/Ep5p64KF
https://x.com/VersunPan/status/2020335498427023589?s=20
1. 提供商切换
注意:我没有使用pi内置的模型接口,而是通过自定义扩展来接入模型接口
clip.versun.me/p/3hLbCC0B
2. 并行会话和插话功能
clip.versun.me/p/2Ax9wE4O
3./new前自动保存会话
clip.versun.me/p/Ep5p64KF
https://x.com/VersunPan/status/2020335498427023589?s=20
之前在 PayPal 薅了一年 Pro 羊毛,结果用了几个月就吃灰。
这几天上去瞅了眼,还是那些功能,界面都没怎么动。
AI 时代这么卷,原地踏步就是在等死啊。。。
之前在 PayPal 薅了一年 Pro 羊毛,结果用了几个月就吃灰。
这几天上去瞅了眼,还是那些功能,界面都没怎么动。
AI 时代这么卷,原地踏步就是在等死啊。。。
上次发了 LKS 之后,居然真的有人在用——这种"我做的轮子居然还有人用"的感觉还挺奇妙的😂
趁热打铁,第二个应用也上线了:Clip,一个极简代码分享工具。
网址:https://clip.versun.me/
动机:
平时和AI结对编程,经常要分享代码片段,要么发聊天框里格式全乱,要么用Pastebin那种老牌工具,界面丑得像是2005年的产物。我就想,能不能搞一个干干净净、即开即用的代码板?
功能:
- 粘贴代码 → 选语言 ...
Read more: https://versun.me/blog/ai-50-2-clip
上次发了 LKS 之后,居然真的有人在用——这种"我做的轮子居然还有人用"的感觉还挺奇妙的😂
趁热打铁,第二个应用也上线了:Clip,一个极简代码分享工具。
网址:https://clip.versun.me/
动机:
平时和AI结对编程,经常要分享代码片段,要么发聊天框里格式全乱,要么用Pastebin那种老牌工具,界面丑得像是2005年的产物。我就想,能不能搞一个干干净净、即开即用的代码板?
功能:
- 粘贴代码 → 选语言 ...
Read more: https://versun.me/blog/ai-50-2-clip
这两天基本上把 Pi 的整体框架搭起来了,同时还实现了几个对我来说非常重要的功能:
1. 提供商自动切换
模型有时候因为网络问题或者额度用完直接罢工,现在 Pi 会在重试 3 次后自动切到下一个提供商,并通知我一声。不用手动去改配置,如图。
2. 多主题并行会话
不再是那种你一句我一句的串行聊天了,现在可以同时聊多个话题,跟真人交流差不多。比如这边在写代码,那边突然想问个别的问题,不用等当前对话结束。
3. 临时改意图
人类是善变...
Read more: https://versun.me/blog/custom-openclaw-pi-1
这两天基本上把 Pi 的整体框架搭起来了,同时还实现了几个对我来说非常重要的功能:
1. 提供商自动切换
模型有时候因为网络问题或者额度用完直接罢工,现在 Pi 会在重试 3 次后自动切到下一个提供商,并通知我一声。不用手动去改配置,如图。
2. 多主题并行会话
不再是那种你一句我一句的串行聊天了,现在可以同时聊多个话题,跟真人交流差不多。比如这边在写代码,那边突然想问个别的问题,不用等当前对话结束。
3. 临时改意图
人类是善变...
Read more: https://versun.me/blog/custom-openclaw-pi-1
开局稍微费点功夫,模型配置和 API 密钥那部分得手动填,别的都还好。一旦跑起来,后续所有功能开发全在聊天框里闭环完成。让 AI 自己写扩展自己的功能,这种自举的感觉确实有点不真实。
关键是轻量,要啥装啥,绝不给你硬塞臃肿模块。相比 OpenClaw 那坨黑盒,这种从 0 到 1 的全盘掌控感爽多了。
现在就一个感受:工具链还是要捏在自己手里才踏实。😎
有想折腾的同志不?人多我后续出个踩坑实录,帮你们省点摸黑时间。
开局稍微费点功夫,模型配置和 API 密钥那部分得手动填,别的都还好。一旦跑起来,后续所有功能开发全在聊天框里闭环完成。让 AI 自己写扩展自己的功能,这种自举的感觉确实有点不真实。
关键是轻量,要啥装啥,绝不给你硬塞臃肿模块。相比 OpenClaw 那坨黑盒,这种从 0 到 1 的全盘掌控感爽多了。
现在就一个感受:工具链还是要捏在自己手里才踏实。😎
有想折腾的同志不?人多我后续出个踩坑实录,帮你们省点摸黑时间。
Opus-4.6倒真不错,速度和 debug 能力明显提升。
日常 Kimi + Opus 够用了
Opus-4.6倒真不错,速度和 debug 能力明显提升。
日常 Kimi + Opus 够用了
我只根据官方的发布文档进行比较,由于双方的基准测试版本不同,所以没法完全对比,其中只有一个指标是同一个版本的:
1. Terminal-Bench 2.0• Opus 4.6: 65.4%
• GPT 5.3: 77.3%
GPT 5.3 Codex 在终端命令行的交互上更好,效率更高
其余的编程指标:
2...
Read more: https://versun.me/blog/2026-02-06-09-02
https://x.com/VersunPan/status/2019570268491088056?s=20
我只根据官方的发布文档进行比较,由于双方的基准测试版本不同,所以没法完全对比,其中只有一个指标是同一个版本的:
1. Terminal-Bench 2.0• Opus 4.6: 65.4%
• GPT 5.3: 77.3%
GPT 5.3 Codex 在终端命令行的交互上更好,效率更高
其余的编程指标:
2...
Read more: https://versun.me/blog/2026-02-06-09-02
https://x.com/VersunPan/status/2019570268491088056?s=20
第一个:InsForge(@InsForge_dev)这是专门为 AI Agent 开发的后端 Supabase,通过 MCP 和 SKill 让各种 Agent 直接帮你部署数据库、配置后端,省去了大量的运维工作。同时还集成了模型网关(中转 OpenRouter ),一站式解决 Agent 开发的基础设施问题,非常方便,后台功能如图:
我个人更习惯在终端直接命令 Agent 操作,所以后台界面用得不多,但功能挺全的。特别适合不想在后...
Read more: https://versun.me/blog/2026-02-05-11-31
第一个:InsForge(@InsForge_dev)这是专门为 AI Agent 开发的后端 Supabase,通过 MCP 和 SKill 让各种 Agent 直接帮你部署数据库、配置后端,省去了大量的运维工作。同时还集成了模型网关(中转 OpenRouter ),一站式解决 Agent 开发的基础设施问题,非常方便,后台功能如图:
我个人更习惯在终端直接命令 Agent 操作,所以后台界面用得不多,但功能挺全的。特别适合不想在后...
Read more: https://versun.me/blog/2026-02-05-11-31
1. Agentic terminal coding 是终端交互能力,提升明显,编写脚本、操作文件更顺畅
2. Agentic coding 是核心编程能力,降低了0.1,也就是说代码能力和 Opus 4.5 基本一致
3. Scaled tool use 是工具调用能力,降低了2.8,不会更积极的调用 MCP
4. Novel problem-solving 是算法/逻辑能力,由于上下文的巨大提升,可以解决更复杂的 b...
Read more: https://versun.me/blog/2026-02-06-08-33
1. Agentic terminal coding 是终端交互能力,提升明显,编写脚本、操作文件更顺畅
2. Agentic coding 是核心编程能力,降低了0.1,也就是说代码能力和 Opus 4.5 基本一致
3. Scaled tool use 是工具调用能力,降低了2.8,不会更积极的调用 MCP
4. Novel problem-solving 是算法/逻辑能力,由于上下文的巨大提升,可以解决更复杂的 b...
Read more: https://versun.me/blog/2026-02-06-08-33
果然程序员都是海王,喜新厌旧是职业病,永远只爱"年轻"的(指刚发布的新工具)😆
https://x.com/op7418/status/2018892524937695533
果然程序员都是海王,喜新厌旧是职业病,永远只爱"年轻"的(指刚发布的新工具)😆
https://x.com/op7418/status/2018892524937695533