Skip to content

自测题库

主动回忆比反复阅读记得牢。先自己想答案,再点开看。手机上随时自测


第 0 章

Q1. 为什么 AI 会"幻觉"?

看答案

因为它在预测"听起来最合理的下一个词",而不是"最真实的下一个词"。不确定时它不会说"不知道",而是生成最像答案的内容。→ 0.2

Q2. 需要精确计算时,正确做法是?

看答案

让 AI 写代码去算,而不是让它直接给数字。AI 生成的是"看起来像答案的数字"。→ 0.3

Q3. AI "不记得"上次对话,是 bug 吗?怎么解决?

看答案

不是 bug,是架构设计(每次调用无状态)。解决:用外部存储(数据库/文件)持久化,每次用时读取。→ 0.3


第 1 章

Q4. "上下文 200k" 指 200k 个汉字吗?

看答案

不是,指 200k 个 Token,中文大概 10-15 万汉字。→ 0.2

Q5. 输入 Token 和输出 Token,哪个更贵?

看答案

输出更贵,通常是输入的 3-5 倍。→ 1.1

Q6. 让 AI 输出准确的复杂答案,一个简单 Prompt 技巧是?

看答案

CoT(思维链):让它"先分析推理过程,再给答案"。因为每个 Token 都影响后续 Token。→ 1.2

Q7. Tool Use 里,工具执行报错了,最该做什么?

看答案

把清晰的错误信息返回给 AI,让它能感知并调整。否则它会假设成功继续,导致跑偏。→ 1.4

Q8. 什么时候该用推理模型?什么时候不该?

看答案

该用:多步数学/逻辑、复杂代码、难题。不该用:简单问答/分类/翻译、实时交互、大批量低难度任务(又慢又贵)。默认用普通模型。→ 1.7

Q9. 把代码从 DeepSeek 换成本地 Ollama,要改什么?

看答案

只改 baseURL(http://localhost:11434/v1)、apiKey(占位)、model(如 qwen2.5:14b),业务代码不变——因为都兼容 OpenAI 协议。→ 1.9


第 2 章

Q10. RAG 检索效果差,第一个该排查的是?

看答案

分块(Chunking)——大小、重叠、切分方式。先调好分块再考虑换模型。→ 2.2

Q11. 同一个向量库,能用 A 模型存、B 模型查吗?

看答案

不能。不同 Embedding 模型维度和语义空间不同,必须用同一个模型。换模型 = 整库重建。→ 2.2

Q12. 最简单有效的"防 Agent 失控"措施是?

看答案

在 System Prompt 里写:"遇到不确定或错误就停下来说明、等待指示,不要假设、不要继续。"→ 2.4

Q13. 该不该用通用 Benchmark(MMLU 等)来判断模型对你项目好不好?

看答案

不太够。更有用的是为你的具体场景建自己的评估集。→ 2.5


第 3 章

Q14. 为什么长上下文模型更贵更慢?

看答案

Attention 计算量随输入长度的平方增长。100k→200k,计算量变 4 倍。→ 3.1

Q15. AI 的"性格/价值观"从哪来?

看答案

SFT 阶段的训练数据风格 + RLHF 阶段标注者的偏好。→ 3.3

Q16. 四个场景,分别用 Prompt / RAG / Fine-tune?(a) 200页每月更新的产品文档问答 (b) 固定团队代码风格 (c) 查用户历史订单 (d) 5000份标注合同分类

看答案

(a) RAG (b) Fine-tune (c) Tool Use + RAG (d) Fine-tune。→ 3.4


第 4 章

Q17. MCP 解决了什么问题?

看答案

工具和 AI 的紧耦合:以前每个 AI 平台都要写不同集成。MCP 让工具"写一次、所有支持 MCP 的 AI 都能用"。→ 4.1

Q18. 想让团队所有人 clone 项目后自动拥有同一套 MCP Server,配到哪?

看答案

project 作用域 → 项目根目录的 .mcp.json,提交进 Git。→ 4.2

Q19. "Agent = Model + Harness" 这个公式想说明什么?

看答案

Agent 不只是模型,而是"模型 + 外面那层脚手架",表现一大半来自 Harness。所以调 Agent 常常是在调脚手架,而不是换更强的模型。→ 4.8

Q20. 工具调用报错了,Harness 正确的处理方式是?为什么有效?

看答案

完整的错误信息/栈喂回给模型,让它自己看着改(Error Recovery)。有效是因为模型很擅长根据具体报错修正自己的参数;只说"失败了"它只能瞎猜。→ 4.8

Q21. "补偿性代码(Compensatory Code)"是干嘛的?举两个例子。

看答案

替模型兜底、补它短板的确定性代码——模型负责"聪明",它负责"靠谱"。例如:用代码精确计数/计算(模型算不准)、JSON schema 强制校验(模型偶尔输出非法 JSON)、权限门禁(拦住危险操作)。→ 4.8

Q22. 上下文工程的目标是"把上下文窗口塞满"吗?

看答案

不是。目标是每一步只放此刻最该看的东西。桌子(窗口)大也要会收拾——塞太多反而稀释重点、"中间迷失"。→ 4.9

Q23. 上下文工程的三大手法是什么?各用一句话。

看答案

①按需注入:用时才把指令/工具/资料放上桌,用完撤走;②压缩(Compaction):旧内容摘成便签、原件收走腾 token;③隔离:子任务在独立上下文里跑,只把结论带回主线程。→ 4.9

Q24. 长任务里 Agent "把前面说的忘了",对照上下文工程,可能怎么解决?

看答案

重要信息别只埋在对话历史里(会被压缩掉)→ 放进 System Prompt / 文件 / 计划清单;或把大任务拆成多个干净的小对话 + 用隔离。→ 4.9


下一页:决策速查

写给自己的 AI 学习地图