$ whoami
c4bbage
在算力、模型与混乱之间记录
一个随手记点东西的地方。旧版(2017–2020 的笔记)封存在 legacy-2017。
最新文章
查看全部 →GLM-5.1-FP8 部署调优复盘:8 卡 H20 从 31 tok/s 到 122 tok/s
一次 GLM-5.1-FP8 在 SGLang 上的部署和调优记录:先给结论,再拆测试方法、参数取舍、性能对照和踩过的坑。
LLM 中的人格张力、情绪表征与社会心理镜像
一个关于 personality tension prompting 的工程假设:模型如何响应角色、评价、责任、挑战、反迎合和社会心理结构。
我 25 天在 Cursor 大号上花了 3018.98 美元
记录一份 Cursor 使用分析报告:个人用量、AI 给出的诊断,以及我准备怎么调整模型和上下文使用习惯。
SenseNova-U1-8B 统一多模态模型实测:单卡 H20 跑通端到端图像生成
商汤 2026 年 4 月开源的 NEO-Unify 架构统一多模态模型,在 H20 上的完整部署 + 13 个测试用例 + 性能数据 + 横向对比。
重启 · 把这里改造成新版博客
旧的 MkDocs 站封存,新版用 Astro 5 重建。简单记一笔为什么、怎么做。