0.4 当前技术版图

AI 领域的新东西太多，很容易陷入"什么都想学、什么都没学透"的状态。这一节帮你建立一张地图，知道哪些东西在哪个位置。

整体版图

┌─────────────────────────────────────────────┐
│              你能直接使用的层                  │
│  Claude / GPT / Gemini / DeepSeek / Qwen    │
│        Codex / Cursor / Claude Code          │
├─────────────────────────────────────────────┤
│              工程能力层（重点学习）             │
│   Prompt工程 · RAG · Agent · MCP · 评估     │
├─────────────────────────────────────────────┤
│              基础设施层（理解即可）             │
│   向量数据库 · 模型服务 · API 网关            │
├─────────────────────────────────────────────┤
│              模型层（了解原理）                │
│   Transformer · 训练 · Fine-tuning          │
└─────────────────────────────────────────────┘

你现在主要在顶层，目标是把中间两层也搞透。底层的模型层，了解原理就够，不需要自己动手。

主要模型提供商

国际厂商：

提供商	主要模型	特点
Anthropic	Claude 4 系列（Opus/Sonnet/Haiku）	长上下文、代码强、安全性高
OpenAI	GPT 系列、o 系列推理模型	生态最成熟、工具最多
Google	Gemini 系列	多模态强、超长上下文、与 Google 生态集成好
Meta	Llama 系列	开源、可以本地运行
Mistral	Mistral、Codestral	轻量、开源

国产厂商（国内做工程通常优先这些，详见 0.5 国产大模型生态）：

提供商	主要模型	特点
深度求索 DeepSeek	DeepSeek-V4	性价比极高、代码与推理强、开源
阿里通义千问	Qwen 系列	生态最全、模型矩阵最大、有 Embedding
智谱 GLM	GLM 系列	推理与 Agent 能力强
字节豆包	Doubao 系列	价格激进、火山引擎生态

📌 你不需要每个都会用。选 1-2 个主力（根据你的项目），深入理解它的特性和限制就够了。国内项目建议主力 DeepSeek，补位阿里百炼。

工具生态

开发辅助类（你正在用的）

Claude Code — Anthropic 官方 CLI，支持 Agent 模式
Codex — OpenAI 的代码 Agent
Cursor、Windsurf — AI 增强的 IDE
GitHub Copilot — 嵌入式代码补全

框架类（用来构建 AI 产品）

LangChain、LlamaIndex — RAG 和 Agent 框架
Vercel AI SDK — 前端友好的 AI 集成
Mastra — 新兴的 Agent 框架

基础设施类

Pinecone、Weaviate、Qdrant — 向量数据库
OpenRouter — 统一的多模型 API 网关

哪些在快速变化，哪些相对稳定

⚠️ 快速变化的（追热点意义不大）

具体的模型版本（GPT-4o → o1 → o3 每几个月就换）
新框架（每周都有人发布"更好的 LangChain"）
各种 benchmark 排名

✅ 相对稳定的（值得深投资）

Transformer 架构的基本原理（2017年提出至今未变）
RAG 的核心思路
Prompt 工程的基本方法论
Agent 的设计模式
MCP 协议（刚刚标准化，生态在建立）

📌 关键结论

AI 版图分四层，你需要从顶层开始，向下逐层理解
不需要学所有模型，选 1-2 个深入就够
把时间投在"相对稳定"的部分，快速变化的部分跟踪就好，不要深钻

下一节：0.5 国产大模型生态

0.4 当前技术版图 ​

整体版图 ​

主要模型提供商 ​

工具生态 ​

哪些在快速变化，哪些相对稳定 ​