速记卡

每章浓缩成几张卡片：一句话核心 + 类比 + 最容易错的点。用于碎片时间快速唤起记忆——读不懂的，点链接回正文。

第 0 章 · 认知

🃏 LLM 在做什么

核心：预测下一个 Token，不是"思考"。类比：超强版输入法联想。易错：以为它"理解"，其实它匹配的是词语模式 → 这解释了幻觉、换问法结果差。

🃏 能力边界

核心：擅长模式匹配与变换；不擅长精确计算、实时信息、持久记忆、稳定复杂推理。 掌控本质：把任务设计成它擅长的形式，用工具补它不擅长的。易错：让它直接算数 / 凭记忆答最新信息 → 应该给工具。

🃏 国产生态

核心：国内做工程优先国产模型（便宜、稳、中文强、多兼容 OpenAI 协议）。选型：主力 DeepSeek，补位阿里百炼（Embedding/多模态）。

第 1 章 · LLM 工程

🃏 Token 与上下文

核心：Token 是计费和上下文的基本单位；上下文窗口 = 工作内存，超了就忘事。易错：上下文大 ≠ 全被认真处理（"中间迷失"）。重要信息放开头/结尾或 System Prompt。

🃏 Prompt 工程

核心：角色 + 任务 + 上下文 + 格式 + 约束。Few-shot 给范例最有效，CoT 让难题更准。易错：追"魔法咒语"。真正有效的是把任务设计成 AI 擅长的样子。

🃏 生成参数

核心：temperature 低=稳定、高=发散；代码 0.2，对话 0.7，创意 1.0。易错：temperature 和 top_p 一般不要同时大改。

🃏 Tool Use

核心：AI 不执行代码，只发"调用请求"，你的代码执行后把结果喂回去，循环到结束。易错：工具出错不反馈给 AI → 它会假设成功继续跑偏。Description 写不清 → 用错工具。

🃏 推理模型

核心：先想再答，靠 test-time compute 换准确率；难题强，但慢且贵。易错：无脑全用。默认普通模型，搞不定再上推理模型。

🃏 OpenAI 兼容协议

核心：换模型只改 baseURL + apiKey + model，业务代码不变。易错：Embedding 不能跨模型混用；Anthropic SDK 是另一套协议。

第 2 章 · 构建产品

🃏 RAG

核心：先检索相关文档，再让 AI 基于它生成回答。解决知识固定/实时性问题。易错：效果差先查分块，别急着换模型。分块大小 + 重叠很关键。

🃏 Agent 失控

核心：推理雪崩、上下文污染、错误未处理、任务歧义、规则稀释。 最有效的防失控：System Prompt 里写"遇到不确定就停下来问，别假设"。

🃏 评估

核心：为你的具体场景建自己的评估集，每次改动跑一遍看数字。易错：只看通用 Benchmark，对你的场景没意义。

第 3 章 · 原理

🃏 Transformer / Attention

核心：每个词同时"看到"所有词，动态决定关注谁。推论：上下文越长，计算量按平方涨（更贵更慢）；注意力被稀释。

🃏 训练三+一阶段

核心：预训练（学语言）→ SFT（学听话）→ RLHF（学价值观）→ 推理训练（学思考）。记：AI 的"性格"来自 SFT 数据 + RLHF 偏好。

🃏 Fine-tune vs RAG

核心：动态知识/事实 → RAG；固定风格/格式/任务 → Fine-tune。铁律：别用 Fine-tune"注入知识"；先把 Prompt 做到位再考虑 Fine-tune。

第 4 章 · MCP 与 Agent 生态

🃏 MCP

核心：AI 与工具之间的标准协议，工具写一次到处可用（Tools/Resources/Prompts 三种能力）。配置：claude mcp add，作用域 local / project(.mcp.json) / user。

🃏 多 Agent

核心：适合并行/超长/专业分工；Handoff 信息要传完整，用文件共享状态最可靠。原则：从单 Agent 开始，按需引入，别过度设计。

🃏 Harness 脚手架

核心：Agent = Model + Harness，表现一大半来自模型外的挽具。比喻：模型是烈马，Harness 是挽具+缰绳+车夫。模型负责聪明，Harness 负责靠谱。零件：控制流、错误恢复、反馈回路、计划追踪、动态强度、补偿性代码。

🃏 上下文工程

核心：上下文窗口=办公桌桌面，每步只放此刻最该看的东西。 三手法：按需注入（用时才放）、压缩（旧的摘成便签）、隔离（子任务另开桌只回传结论）。

下一页：自测题库

速记卡 ​

第 0 章 · 认知 ​

第 1 章 · LLM 工程 ​

第 2 章 · 构建产品 ​

第 3 章 · 原理 ​

第 4 章 · MCP 与 Agent 生态 ​

速记卡

第 0 章 · 认知

第 1 章 · LLM 工程

第 2 章 · 构建产品

第 3 章 · 原理

第 4 章 · MCP 与 Agent 生态