$ cat ~/about.md
从网络攻防到 AI —— 我的两个十年
一份叙事式的自我介绍 —— 第一个十年泡在网络安全里,第二个十年完整切到了 AI 工程。
网名 c4bbage。职业生涯从 2012 年开始算起,到今年差不多走完两个十年 —— 第一个十年完整泡在网络安全里,第二个十年完整切到了 AI 工程。 GitHub 账号是 2013 年底注册的,沿用至今。
这是一份叙事式的自我介绍,按时间线写,不按项目清单写。
第一个十年(2012–2022):网络安全
入行就是攻方。 最早几年是 渗透测试 / 红队 / 漏洞复现 / 漏洞研究 / 破解与逆向工程 —— 写 PoC、跑红蓝对抗、翻译工具链文档、复现各种公开/半公开的攻击路径。 那也是国内攻防社区最热闹的一段,一波 0day、一波 APT、一波蜜罐与对抗。 GitHub 上现在还能翻到的小工具和翻译,大都来自那个阶段。
中段开始往企业防御那一侧切,从外打到内:
- 内网资产梳理、CMDB / 堡垒机类工具的工程化
- 2000+ 台生产主机的安全监控(含 EDR、合规、巡检、漏洞回响闭环)
- 零信任架构落地(身份、设备、网络分段、最小权限)
- 态势感知:日志中台 / 事件关联 / 告警治理 / 攻击路径还原
- 应急响应流程化 —— 从拉日志、回溯、写报告,到沉淀手册、值班 SOP
- 红蓝里"蓝方"那种不性感、要长期啃的活
最后几年偏向安全产品的工程化 —— 从"做一次入侵分析"变成"做一个能让别人重复做入侵分析的系统"。 这是我第一次切身体会到 "一次性脚本"和"可被别人用的能力"是两个完全不同的工程目标。 这条原则后面在做 AI 工程时反复出现。
那十年里写过、翻译过的零碎东西,整站封存在
legacy-2017 tag。
不删,但不再更新,更不放到新博客的导航里。
转折:怎么切到 AI
赶上了 LLM 这波。 起点其实不是被分配的任务,而是个人这边先嗨起来了 —— ChatGPT 一出,自己第一时间充了 Plus;后来 Poe 年费上车,市面上能订的模型挨个摸了一圈。 那段时间几乎所有能用 AI 摁住的零碎活(写脚本、查资料、出报告、文档结构化重写、做小工具)都被我 prompt 化了, 本职工作上的提效是真实可见的 —— 这是 AI 人民币玩家路线最早的回报。
老板(CTO) 注意到了这股热情和实际效果,顺势把 AI 正式加进了我的工作范围 —— 拉来一位浙大博士一起做后训练项目, 同时我自己开始搭一堆系统:RAG 知识库、IT agent、内部问答、各种小工具。 这才是我"真正切到 AI"的起点。
之后才慢慢意识到 —— 模型 + 算力打开的设计空间,比单纯做防御侧的攻防博弈大得多, 于是把主线整个迁了过去。
安全那十年的训练并没有浪费 —— 攻防侧"先假设系统是错的"那种直觉, 在做 agent / 做 AIGC 服务的运行时安全的时候, 反而比纯做 AI 出身的人占便宜不少。
第二个十年(2022– 至今):AI 工程
这几年的工作横切起来大致是这样一个层级,从底往上:
1. 底层 · 算力
手上一个训练 / 推理混跑的小集群 —— 几节点的规模、数十张企业级训练卡、跨两个算力梯度(一档主力、一档备用与跑批)。 日常基本就是把这堆卡 "别躺平、别相互踩、别浪费钱" 这三件事做好。
具体:调度与隔离 · 空闲率治理 · 闲时任务接入(夜间编译 / 扫描 / 异步 agent)· 任务级成本核算 · ROI 反向治理业务侧。
2. 中间 · AIGC 生成能力
文 → 图、图 → 图、文 → 视频、图 → 视频、超分、抠图、人像修复 —— 这一层是把模型变成对内可用的 API、对外接到业务侧。
训练侧也做了一段时间: 全参微调(最大到 14B 规模)/ LoRA / 蒸馏 / 量化 都跑过,最近在测 NTP + flash-attention 的加速 baseline。 不过比起追单模型 SOTA,我更喜欢模型组合 —— 用便宜的基模托底、贵的高质感模型只在关键路径上插入。 成本/质量曲线上的工程问题,比"哪个模型分数高 0.5"有趣得多。
3. 业务侧
中间这层能力,往上接到几条具体业务:
- 短剧平台 —— 把生图、生视频、超分等能力组装成面向短剧创作的流水线
- 美术与运营工具 —— 团队日常的生图、修图、视频化工具
- 内部学习与文档平台 —— 让工具的使用方式可被消费、可被审计
4. 上层 · AIGC 能力平台
把上面这些拼起来对内提供服务的整体平台。 日活 60 人左右 —— 听起来不多,但每个人都是真正在用算力、用模型、产生成本的人。 所以从平台运营、成本治理、稳定性、安全审计的角度看,这个量级一点都不轻松。
5. Agent 体系(最近一年的主线)
最近精力的大头都在这里 —— 把组织里的重复劳动改造成 agentic 工作流,而不是再写更多一次性脚本。
按服务对象分三条线:
- IT agent —— 服务 IT / 基础设施,覆盖部署、巡检、监控、变更
- 安全 agent —— 服务安全侧,覆盖巡检、日报、入侵分析、应急响应
- 短剧 agent —— 服务业务侧,覆盖剧本草稿、分镜、素材生成、批量出图与视频
底层我把可复用的能力都做成 Unix 风格的小命令组合 —— 每个命令一件事,命令之间用结构化文档落盘传递,每步有自动 check 闭环。 这个口径跟十年前在安全产品那段时间领悟到的"做能力,不做一次性脚本",是同一件事的两个十年版本。
工具上不太省钱
接着前面"AI 人民币玩家"那条线,几年下来工具开销越来越重也越来越值。 工程审美一句话:模型每年都在变,自己烧钱试,比看别人写的"最强 AI 工具排名"靠谱一万倍。
现在日常订阅大致是:
- Cursor —— 月开销在 3000 美元上下,是主战场
- Claude —— 长期订阅,Claude Code 几乎每天用
- ChatGPT —— 订阅一直在
- Poe —— 年度会员,主要用来横评不同 prompt 在不同模型上的差异
- OpenCode 等 agentic 编辑器轮流试
我真的把这些工具当 "多了一个能写、能查、能跑的同事" 在用, 不是辅助补全。使用心得后面会单独写。
这里会写什么
博客 v2 主要是给自己留个"思考留痕"的地方,节奏弹性 ——
- AI 工程笔记(算力 / 模型 / agent)
- 工具建设与试用心得
- paper 阅读与新模型杂感
- 旧的攻防方向偶尔也会冒出来一两篇,但不会再是主线