听懂不等于懂：AI 术语完整指南

2026年5月10日内容管家

AI领域评论8字数 3980阅读13分16秒阅读模式

AI 术语速查：读完少踩一半坑

人工智能正在重塑世界，同时也创造出一套全新的语言体系。LLM、RAG、RLHF……随便翻几篇 AI 文章，就会撞上一堆缩写，让不少科技从业者都心里发虚。这份术语表正是为此而生，我们会随领域演进定期更新——它是一部"活文档"，正如它所描述的 AI 系统一样。

AGI：通用人工智能

AGI（Artificial General Intelligence）是一个模糊概念，但通常指在大多数任务上比普通人更有能力的 AI。

OpenAI CEO 山姆·奥特曼曾将 AGI 描述为"可以聘请为同事的普通人类水平"
OpenAI 宪章则定义为"高度自主的系统，在大多数经济有价值的工作上超越人类"
Google DeepMind 的理解略有不同：AGI 是"至少与人类在大多数认知任务上同样能力的 AI"

三个定义各有侧重，就算普通人，就连前沿研究者也感到困惑。这个术语目前更多是一种愿景而非精确的技术指标。

AI 智能体

AI 智能体（AI Agent）指利用 AI 技术代替你完成一系列任务的工具，比基础聊天机器人更进一步——例如报销差旅、预订机票餐厅，甚至编写和维护代码。

但需要注意的是，这个领域仍在快速演进，"AI 智能体"对不同人可能意味着不同东西。支撑其能力的基础设施也仍在建设当中。其核心逻辑是一种自主系统，可以调用多个 AI 子系统协作完成多步骤任务。

API 端点

可以把 API 端点想象成软件背面的"按钮"——其他程序可以按下这些按钮来驱动软件执行操作。

开发者利用这些接口构建集成方案：比如让一个应用从另一个应用拉取数据，或者让 AI 智能体直接控制第三方服务，无需人工逐个界面操作。大多数智能家居设备和互联平台都隐藏着这些按钮，普通人几乎从不会注意到。

随着 AI 智能体能力越来越强，它们正在学会自主发现并调用这些端点，从而打开强大——有时也出人意料——的自动化可能。

思维链（Chain of Thought）

遇到简单问题，人脑几乎不用刻意思考就能回答，比如"长颈鹿和猫哪个更高？"但面对复杂问题时，往往需要纸笔辅助，因为中间存在过渡步骤。

例如：农民养鸡和猪，共 40 个头、120 条腿，需要列方程才能算出（20 只鸡、20 只猪）。

在 AI 语境下，思维链推理指将问题拆解为更小的中间步骤，以提高最终答案质量。这种方式耗时更长，但正确率更高，尤其在逻辑推理和编程场景效果显著。

推理模型（Reasoning models）正是从传统大语言模型发展而来，通过强化学习针对思维链思维做了优化。 （参见：Large language model / 大语言模型）

编程智能体

编程智能体（Coding Agent）是"AI 智能体"的一个垂直细化——特指能够自主按步骤采取行动、完成编程目标的程序。

与简单提供代码供人工审核粘贴不同，编程智能体可以自主编写、测试、调试代码，处理那些通常消耗开发者大量时间的迭代试错工作。它们能够跨越整个代码库发现 bug、运行测试、推动修复，人工介入极少。

可以想象成雇了一个效率极高、永不疲倦、永不分心的实习生——当然，和任何实习生一样，最终仍需要人工 Review 其工作成果。

模型压缩与优化：从蒸馏到缓存

Diffusion（扩散模型）是多种文生图、文生音乐、文生文本 AI 的核心技术。其灵感来源于物理学中的扩散现象——系统逐步向数据添加噪声，直至原有结构完全破坏。物理学中的扩散不可逆（糖溶于咖啡无法还原），但 AI 扩散模型通过学习"反向扩散"过程，让数据从噪声中重建。

蒸馏（Distillation）

蒸馏是一种"师-生"压缩技术：向大型教师模型发送请求并记录输出，与标准答案比对后，用这些数据训练更小的学生模型，使其近似教师行为。这一过程可大幅压缩模型体积、同时保持性能，被认为是大模型落地的关键技术之一。

微调（Fine-tuning）

微调指在已有模型基础上，使用特定领域或任务的专用数据进一步训练，以提升模型在垂直场景的表现。许多 AI 创业公司以开源大模型为起点，通过微调补充行业知识库，从而在医疗、法律、金融等垂直领域构建商业产品。

生成对抗网络（GAN）

GAN（Generative Adversarial Network）由两个神经网络组成：生成器负责基于训练数据创建内容，判别器负责识别哪些是伪造的。两者不断博弈——生成器试图"骗过"判别器，判别器持续提升鉴别能力——最终产出更逼真的数据。GAN 是 deepfake 工具的核心技术，但更适合图像、视频等窄场景，而非通用 AI。

幻觉（Hallucination）

"幻觉"是 AI 行业对模型虚构信息的委婉说法。由于训练数据存在盲区，模型可能在回答中编造不准确甚至危险的答案（如给出有害的健康建议），这推动了垂直领域 AI 的发展——专业数据越丰富，幻觉风险越低。

推理（Inference）

推理是模型实际运行、基于已有知识做出预测的过程。没有训练就无法推理——模型必须先从数据中学习模式，才能在新输入上生成输出。推理可在多种硬件上执行，从手机芯片到高端 GPU 乃至专用 AI 加速器，但大模型在笔记本上的推理速度远不如配备高端芯片的云服务器。

大语言模型（LLM）

LLM 是 AI 助手（ChatGPT、Claude、Gemini、Llama、Mistral 等）背后的核心。它们是包含数十亿参数的多层深度神经网络，通过学习海量文本中的词汇关系，构建起多维语言地图。当你向 AI 助手提问时，LLM 在数十亿书籍、文章、语料中匹配最可能的回答模式。

记忆缓存（Memory Cache）

缓存是提升推理效率的关键优化技术。AI 推理依赖大量数学计算，缓存通过保存中间计算结果供后续复用，减少重复运算。其中 KV（键值）缓存广泛应用于 Transformer 架构模型，显著缩短响应时间并降低算力消耗。

神经网络（Neural Network）

神经网络是深度学习和生成式 AI 的底层架构，由多层算法节点组成。它是大型语言模型（LLM）得以涌现的技术基础，也是这一波 AI 浪潮的核心支柱。

开源与闭源：AI 行业的基础性分歧

开源（Open Source）指软件（或越来越多的 AI 模型）底层代码向公众公开，任何人都可以使用、检查或修改。在 AI 领域，Meta 的 Llama 系列模型是典型案例；操作系统领域则对应 Linux 这段历史经典。开源方式让全球研究者、开发者、企业能够在彼此工作基础上继续建设，从而加速进步，并实现闭源系统难以提供的独立安全审计。

闭源（Closed Source）则意味着代码私有化——你可以使用产品，却无法窥见其内部运作原理，OpenAI 的 GPT 系列模型即属此列。这一差异已成为 AI 行业最具代表性的争议焦点之一。

并行化：GPU 时代的核心工程能力

并行化（Parallelization）即同时处理多项任务，而非依次逐条完成——就像 10 名员工同时推进项目不同环节，而非一人顺序包办全部工作。在 AI 领域，并行化贯穿训练与推理全过程：现代 GPU 专为并行执行数千次计算而设计，这也是它们成为行业硬件支柱的关键原因。

随着 AI 系统复杂度持续攀升、模型规模日益庞大，在多芯片、多机器间并行化任务的能力，已成为决定模型构建与部署速度及成本效益的核心要素。新一代并行化策略研究，如今已发展为一个独立学术领域。

内存危机：AI 竞赛的意外牺牲品

"RAMageddon" 是科技行业一股不太有趣的趋势的名称：随机存取存储器（RAM 芯片）持续短缺。这种芯片几乎为所有日常消费电子产品提供算力支撑。随着 AI 产业蓬勃发展，各大科技公司与 AI 实验室争相打造最强性能、最高效率的系统，大量购入数据中心所需内存，导致消费市场供应严重不足。供应瓶颈进一步推高剩余库存价格。

受影响领域包括：

游戏产业：主流公司已因设备内存芯片采购困难而上调主机售价
消费电子：内存短缺可能引发十多年来最大幅度的智能手机出货量下滑
企业级计算：各公司连自身数据中心所需内存都无法满足

内存价格飙升预计将持续至短缺结束为止——然而不幸的是，短期内并无明显迹象显示情况会有所好转。

强化学习：AI 自我进化的训练范式

强化学习（Reinforcement Learning）是一种让 AI 系统通过尝试与奖励反馈来学习的训练方式——类似用零食训练宠物，只是这里的"宠物"是神经网络，"零食"则是代表成功的数学信号。区别于监督学习（基于固定标注数据集训练），强化学习允许模型探索环境、执行动作，并根据收到的反馈持续调整行为。

这种范式已被证明在以下场景格外有效：

AI 游戏对战能力训练
机器人控制系统
近年来：提升大语言模型的推理能力

通过人类反馈进行强化学习（RLHF）等技术，如今已成为头部 AI 实验室微调模型、使其更高效、更准确、更安全的关键手段。

Token：人机沟通的基本单元

Token（词元）是人类与 AI 之间通信的基础构件，代表 LLM 处理或生成的离散数据片段。Token 通过"分词"（Tokenization）过程生成——将原始文本拆解为语言模型能够消化的小块单元，类似于编译器将人类语言翻译为计算机可执行的二进制代码。

在企业场景下，Token 还直接关联成本——大多数 AI 公司按量计费（LLM 使用按 Token 计费），用量越多，账单越高。

Token 吞吐量：AI 基础设施的核心指标

Token 吞吐量（Token Throughput）衡量系统在单位时间内能够处理的 Token 数量。由于 AI 语言模型将语言拆解为往往不足完整单词的微小片段，Token 可类比为理解 AI 工作负载时的"词"单位。吞吐量越高，系统并发处理能力越强，用户获得响应的速度也越快。

AI 研究员 Andrej Karpathy 曾在公开场合描述过订阅的 AI 服务闲置时产生的焦虑感——如同当年读博期间昂贵硬件未被充分利用时的心情。这一共鸣精准解释了为何最大化 Token 吞吐量已成为该领域的执念。

模型训练：深度学习的技术起点

虽然受人脑神经回路启发的数据处理算法设计理念可追溯至 1940 年代，但真正释放其实践潜力的，是游戏产业推动的图形处理硬件（GPU）快速普及。这类芯片让训练层数远超早期时代的算法成为可能，使神经网络 AI 系统在语音识别、自动驾驶、药物研发等多个领域实现显著性能突破。

什么是训练（Training）

开发机器学习 AI 的核心环节是训练：将数据输入模型，使其从数据模式中学习，最终生成有用的输出。简单理解，就是让系统识别数据中的特征，据此调整输出以逼近目标——无论是识别猫的图片，还是按要求写一首俳句。

训练成本高昂，因为需要大量数据输入，而所需的数据量还在持续增长。这也是混合方案受到关注的原因——比如先用规则型 AI，再通过定向数据微调，可以有效控制成本，不必从零开始训练。

迁移学习（Transfer Learning）

迁移学习是一种高效建模技术：用已经训练好的 AI 模型作为起点，开发一个用于不同但通常相关任务的新模型，从而复用在前期训练中积累的知识。

迁移学习的优势在于两点：一是缩短模型开发周期，节省资源；二是在目标任务数据有限时尤其有用。不过需要注意的是它的局限性：依赖迁移学习获得泛化能力的模型，往往还需要在目标领域补充训练数据，才能达到理想效果。

权重（Weights）

权重是 AI 训练的核心要素。它决定了在给定训练任务中，不同特征（输入变量）被赋予多大的重要性，从而塑造模型的输出结果。

权重本质上是数值型参数，用来标记数据集中哪些信息最为关键。它们通过乘法运算作用于输入数据。模型训练初期，权重是随机分配的；随着训练推进，权重会不断调整，使输出逐渐接近目标值。

举例来说，一个用于预测房价的 AI 模型，以某地区的房产历史数据为训练集，其中可能包含以下特征及其权重：卧室数量、卫生间数量、房屋类型（独栋/半独栋）、是否有停车位、是否有车库等。最终，模型赋予每个输入特征的权重，反映了该特征对房价的影响程度。

验证损失（Validation Loss）

验证损失是一个数值，用来实时反映 AI 模型在训练过程中的学习效果——数值越低越好。研究人员将它视为训练过程的"实时成绩单"，据以判断何时停止训练、是否需要调整超参数，或是否需要排查潜在问题。

验证损失最重要的作用之一是帮助发现过拟合（Overfitting）：模型不是在学习可泛化的规律，而是直接"背诵"了训练数据。例如，一个学生真正理解了知识点，另一个只是死记硬背了去年的考题——验证损失能帮你判断模型正在变成哪一种。