Skip to content

速记卡

每章浓缩成几张卡片:一句话核心 + 类比 + 最容易错的点。用于碎片时间快速唤起记忆——读不懂的,点链接回正文。


第 0 章 · 认知

🃏 LLM 在做什么

核心:预测下一个 Token,不是"思考"。 类比:超强版输入法联想。 易错:以为它"理解",其实它匹配的是词语模式 → 这解释了幻觉、换问法结果差。

🃏 能力边界

核心:擅长模式匹配与变换;不擅长精确计算、实时信息、持久记忆、稳定复杂推理。 掌控本质:把任务设计成它擅长的形式,用工具补它不擅长的。 易错:让它直接算数 / 凭记忆答最新信息 → 应该给工具。

🃏 国产生态

核心:国内做工程优先国产模型(便宜、稳、中文强、多兼容 OpenAI 协议)。 选型:主力 DeepSeek,补位阿里百炼(Embedding/多模态)。


第 1 章 · LLM 工程

🃏 Token 与上下文

核心:Token 是计费和上下文的基本单位;上下文窗口 = 工作内存,超了就忘事。 易错:上下文大 ≠ 全被认真处理("中间迷失")。重要信息放开头/结尾或 System Prompt。

🃏 Prompt 工程

核心:角色 + 任务 + 上下文 + 格式 + 约束。Few-shot 给范例最有效,CoT 让难题更准。 易错:追"魔法咒语"。真正有效的是把任务设计成 AI 擅长的样子。

🃏 生成参数

核心:temperature 低=稳定、高=发散;代码 0.2,对话 0.7,创意 1.0。 易错:temperature 和 top_p 一般不要同时大改。

🃏 Tool Use

核心:AI 不执行代码,只发"调用请求",你的代码执行后把结果喂回去,循环到结束。 易错:工具出错不反馈给 AI → 它会假设成功继续跑偏。Description 写不清 → 用错工具。

🃏 推理模型

核心:先想再答,靠 test-time compute 换准确率;难题强,但慢且贵。 易错:无脑全用。默认普通模型,搞不定再上推理模型。

🃏 OpenAI 兼容协议

核心:换模型只改 baseURL + apiKey + model,业务代码不变。 易错:Embedding 不能跨模型混用;Anthropic SDK 是另一套协议。


第 2 章 · 构建产品

🃏 RAG

核心:先检索相关文档,再让 AI 基于它生成回答。解决知识固定/实时性问题。 易错:效果差先查分块,别急着换模型。分块大小 + 重叠很关键。

🃏 Agent 失控

核心:推理雪崩、上下文污染、错误未处理、任务歧义、规则稀释。 最有效的防失控:System Prompt 里写"遇到不确定就停下来问,别假设"。

🃏 评估

核心:为你的具体场景建自己的评估集,每次改动跑一遍看数字。 易错:只看通用 Benchmark,对你的场景没意义。


第 3 章 · 原理

🃏 Transformer / Attention

核心:每个词同时"看到"所有词,动态决定关注谁。 推论:上下文越长,计算量按平方涨(更贵更慢);注意力被稀释。

🃏 训练三+一阶段

核心:预训练(学语言)→ SFT(学听话)→ RLHF(学价值观)→ 推理训练(学思考)。 :AI 的"性格"来自 SFT 数据 + RLHF 偏好。

🃏 Fine-tune vs RAG

核心:动态知识/事实 → RAG;固定风格/格式/任务 → Fine-tune。 铁律:别用 Fine-tune"注入知识";先把 Prompt 做到位再考虑 Fine-tune。


第 4 章 · MCP 与 Agent 生态

🃏 MCP

核心:AI 与工具之间的标准协议,工具写一次到处可用(Tools/Resources/Prompts 三种能力)。 配置claude mcp add,作用域 local / project(.mcp.json) / user。

🃏 多 Agent

核心:适合并行/超长/专业分工;Handoff 信息要传完整,用文件共享状态最可靠。 原则:从单 Agent 开始,按需引入,别过度设计。

🃏 Harness 脚手架

核心:Agent = Model + Harness,表现一大半来自模型外的挽具。 比喻:模型是烈马,Harness 是挽具+缰绳+车夫。模型负责聪明,Harness 负责靠谱。 零件:控制流、错误恢复、反馈回路、计划追踪、动态强度、补偿性代码。

🃏 上下文工程

核心:上下文窗口=办公桌桌面,每步只放此刻最该看的东西。 三手法:按需注入(用时才放)、压缩(旧的摘成便签)、隔离(子任务另开桌只回传结论)。


下一页:自测题库

写给自己的 AI 学习地图