AI学习路径 | 从零开始的人工智能之旅

欢迎来到阶段三的核心内容——RAG（Retrieval-Augmented Generation，检索增强生成）。这是目前让AI「懂」你的私有数据最主流的技术方案。

如果你曾经困惑：「为什么AI不知道我公司的产品信息？」或「怎么让AI基于我的文档来回答问题？」——RAG就是答案。

为什么需要RAG？

大语言模型虽然强大，但有几个关键局限：

RAG的核心思想很简单：既然LLM不知道，那就先帮它「查资料」，然后让它基于查到的资料来回答。

把RAG想象成「开卷考试」——LLM本来是闭卷答题，容易答错或编造；RAG让它可以先查阅相关资料，再给出答案。

RAG的工作分为两个主要阶段：

[图示：RAG工作流程图]

RAG = 检索（Retrieval）+ 生成（Generation）

向量听起来很数学，但概念其实很简单：

Embedding就是把文字转换成一组数字（向量），这组数字能够表达文字的「语义」。

概念示例

"国王" → [0.2, 0.8, 0.1, ...]
"皇帝" → [0.21, 0.79, 0.11, ...]  // 与"国王"很接近
"苹果" → [0.9, 0.1, 0.7, ...]      // 与"国王"很远

语义相近的文字，转换后的向量也会相近。这就是为什么可以用向量来「搜索」——找到与问题语义最相关的内容。

你不需要理解向量的数学原理，只需要知道：Embedding是一种把文字「翻译」成数字的方法，翻译后意思相近的文字会「靠得很近」。

让AI学习新知识有两种主要方法：

对于大多数企业知识库场景，RAG是更好的选择，因为：