Skip to content

0.1 AI 到底是什么

先把几个词拆开

你肯定见过这几个词混着用:AI、机器学习、深度学习、大语言模型。它们不是同一件事,但是层层包含的关系:

AI(人工智能)
└── 机器学习 Machine Learning
    └── 深度学习 Deep Learning
        └── 大语言模型 LLM(GPT、Claude、Gemini 这类)

AI 是最大的概念,泛指"让机器表现得像有智能"的一切技术。
机器学习 是其中一个分支:不是程序员手写规则,而是让机器从数据中自己学出规律。
深度学习 是机器学习的一种方法,用"神经网络"来学习——这是一种模仿大脑神经元连接方式设计的计算结构,你不需要深入了解它,只需要知道它是深度学习里的核心技术。
LLM(大语言模型) 是深度学习在语言上的应用,也就是你现在每天用的 Claude、GPT 这类。

💡 类比:就像"交通工具 → 汽车 → 电动汽车 → 特斯拉",是从大到小的包含关系,不是同级别的对比。


你现在用的 AI 是什么

你用的 Claude、GPT、Codex 这些,都属于 LLM(大语言模型),更具体一点叫 生成式 AI(Generative AI)

它和以前的 AI 最大的区别是:它能生成新内容,不只是分类或预测。

以前的 AI 能做:

  • 这张图里有没有猫(图像分类)
  • 这封邮件是不是垃圾邮件(文本分类)
  • 明天会不会下雨(预测)

现在你用的 AI 能做:

  • 写代码、写文章、回答问题
  • 理解你说的意思,进行对话
  • 操控工具、浏览网页、执行任务

关于"AI 会思考"这个误解

⚠️ 最重要的认知纠正:LLM 不会"思考",它在做的事情是预测下一个词

每次你给 AI 发一段话,它做的事情是:根据你给的内容,以及它训练时见过的海量文字,计算"接下来最可能出现什么词",然后一个词一个词地生成出来。

这听起来很简单,但正是因为训练数据够多、模型够大,这个"预测下一个词"的过程,产生了看起来像"理解"和"推理"的效果。

💡 类比:你打微信时,输入法会猜你下一个字。LLM 做的是同样的事,只是它见过的东西多到难以想象,猜得极其准。

这个认知为什么重要?

因为一旦你理解了 AI 是"超强预测机器"而不是"真的会思考",你就能理解:

  • 为什么 AI 会"幻觉"(一本正经说错话)
  • 为什么同样的问题换个问法结果差很多
  • 为什么 AI 不能真正"理解"你,只能理解你说的词语的模式

📌 关键结论

  1. 你用的 Claude、GPT 是 LLM,是 AI 里的一个具体分支
  2. LLM 做的事是"预测下一个词",不是真正的思考
  3. 它强大,但也有根本性的局限——理解这些局限,是掌控 AI 的第一步

下一节:0.2 LLM 在做什么事

写给自己的 AI 学习地图