Skip to content

0.4 当前技术版图

AI 领域的新东西太多,很容易陷入"什么都想学、什么都没学透"的状态。这一节帮你建立一张地图,知道哪些东西在哪个位置。

整体版图

┌─────────────────────────────────────────────┐
│              你能直接使用的层                  │
│  Claude / GPT / Gemini / DeepSeek / Qwen    │
│        Codex / Cursor / Claude Code          │
├─────────────────────────────────────────────┤
│              工程能力层(重点学习)             │
│   Prompt工程 · RAG · Agent · MCP · 评估     │
├─────────────────────────────────────────────┤
│              基础设施层(理解即可)             │
│   向量数据库 · 模型服务 · API 网关            │
├─────────────────────────────────────────────┤
│              模型层(了解原理)                │
│   Transformer · 训练 · Fine-tuning          │
└─────────────────────────────────────────────┘

你现在主要在顶层,目标是把中间两层也搞透。底层的模型层,了解原理就够,不需要自己动手。


主要模型提供商

国际厂商:

提供商主要模型特点
AnthropicClaude 4 系列(Opus/Sonnet/Haiku)长上下文、代码强、安全性高
OpenAIGPT 系列、o 系列推理模型生态最成熟、工具最多
GoogleGemini 系列多模态强、超长上下文、与 Google 生态集成好
MetaLlama 系列开源、可以本地运行
MistralMistral、Codestral轻量、开源

国产厂商(国内做工程通常优先这些,详见 0.5 国产大模型生态):

提供商主要模型特点
深度求索 DeepSeekDeepSeek-V4性价比极高、代码与推理强、开源
阿里 通义千问Qwen 系列生态最全、模型矩阵最大、有 Embedding
智谱 GLMGLM 系列推理与 Agent 能力强
字节 豆包Doubao 系列价格激进、火山引擎生态

📌 你不需要每个都会用。选 1-2 个主力(根据你的项目),深入理解它的特性和限制就够了。国内项目建议主力 DeepSeek,补位阿里百炼。


工具生态

开发辅助类(你正在用的)

  • Claude Code — Anthropic 官方 CLI,支持 Agent 模式
  • Codex — OpenAI 的代码 Agent
  • Cursor、Windsurf — AI 增强的 IDE
  • GitHub Copilot — 嵌入式代码补全

框架类(用来构建 AI 产品)

  • LangChain、LlamaIndex — RAG 和 Agent 框架
  • Vercel AI SDK — 前端友好的 AI 集成
  • Mastra — 新兴的 Agent 框架

基础设施类

  • Pinecone、Weaviate、Qdrant — 向量数据库
  • OpenRouter — 统一的多模型 API 网关

哪些在快速变化,哪些相对稳定

⚠️ 快速变化的(追热点意义不大)

  • 具体的模型版本(GPT-4o → o1 → o3 每几个月就换)
  • 新框架(每周都有人发布"更好的 LangChain")
  • 各种 benchmark 排名

相对稳定的(值得深投资)

  • Transformer 架构的基本原理(2017年提出至今未变)
  • RAG 的核心思路
  • Prompt 工程的基本方法论
  • Agent 的设计模式
  • MCP 协议(刚刚标准化,生态在建立)

📌 关键结论

  1. AI 版图分四层,你需要从顶层开始,向下逐层理解
  2. 不需要学所有模型,选 1-2 个深入就够
  3. 把时间投在"相对稳定"的部分,快速变化的部分跟踪就好,不要深钻

下一节:0.5 国产大模型生态

写给自己的 AI 学习地图