听懂不等于懂:AI 术语完整指南

内容管家 AI领域评论8字数 3980阅读13分16秒阅读模式
听懂不等于懂:AI 术语完整指南

AI 术语速查:读完少踩一半坑

人工智能正在重塑世界,同时也创造出一套全新的语言体系。LLM、RAG、RLHF……随便翻几篇 AI 文章,就会撞上一堆缩写,让不少科技从业者都心里发虚。这份术语表正是为此而生,我们会随领域演进定期更新——它是一部"活文档",正如它所描述的 AI 系统一样。

AGI:通用人工智能

AGI(Artificial General Intelligence)是一个模糊概念,但通常指在大多数任务上比普通人更有能力的 AI

  • OpenAI CEO 山姆·奥特曼曾将 AGI 描述为"可以聘请为同事的普通人类水平"
  • OpenAI 宪章则定义为"高度自主的系统,在大多数经济有价值的工作上超越人类"
  • Google DeepMind 的理解略有不同:AGI 是"至少与人类在大多数认知任务上同样能力的 AI"

三个定义各有侧重,就算普通人,就连前沿研究者也感到困惑。这个术语目前更多是一种愿景而非精确的技术指标。

AI 智能体

AI 智能体(AI Agent)指利用 AI 技术代替你完成一系列任务的工具,比基础聊天机器人更进一步——例如报销差旅、预订机票餐厅,甚至编写和维护代码。

但需要注意的是,这个领域仍在快速演进,"AI 智能体"对不同人可能意味着不同东西。支撑其能力的基础设施也仍在建设当中。其核心逻辑是一种自主系统,可以调用多个 AI 子系统协作完成多步骤任务

API 端点

可以把 API 端点想象成软件背面的"按钮"——其他程序可以按下这些按钮来驱动软件执行操作。

开发者利用这些接口构建集成方案:比如让一个应用从另一个应用拉取数据,或者让 AI 智能体直接控制第三方服务,无需人工逐个界面操作。大多数智能家居设备和互联平台都隐藏着这些按钮,普通人几乎从不会注意到。

随着 AI 智能体能力越来越强,它们正在学会自主发现并调用这些端点,从而打开强大——有时也出人意料——的自动化可能。

思维链(Chain of Thought)

遇到简单问题,人脑几乎不用刻意思考就能回答,比如"长颈鹿和猫哪个更高?"但面对复杂问题时,往往需要纸笔辅助,因为中间存在过渡步骤。

例如:农民养鸡和猪,共 40 个头、120 条腿,需要列方程才能算出(20 只鸡、20 只猪)。

在 AI 语境下,思维链推理指将问题拆解为更小的中间步骤,以提高最终答案质量。这种方式耗时更长,但正确率更高,尤其在逻辑推理和编程场景效果显著。

推理模型(Reasoning models)正是从传统大语言模型发展而来,通过强化学习针对思维链思维做了优化。 (参见:Large language model / 大语言模型)

编程智能体

编程智能体(Coding Agent)是"AI 智能体"的一个垂直细化——特指能够自主按步骤采取行动、完成编程目标的程序

与简单提供代码供人工审核粘贴不同,编程智能体可以自主编写、测试、调试代码,处理那些通常消耗开发者大量时间的迭代试错工作。它们能够跨越整个代码库发现 bug、运行测试、推动修复,人工介入极少。

可以想象成雇了一个效率极高、永不疲倦、永不分心的实习生——当然,和任何实习生一样,最终仍需要人工 Review 其工作成果。

模型压缩与优化:从蒸馏到缓存

Diffusion(扩散模型)是多种文生图、文生音乐、文生文本 AI 的核心技术。其灵感来源于物理学中的扩散现象——系统逐步向数据添加噪声,直至原有结构完全破坏。物理学中的扩散不可逆(糖溶于咖啡无法还原),但 AI 扩散模型通过学习"反向扩散"过程,让数据从噪声中重建。

蒸馏(Distillation)

蒸馏是一种"师-生"压缩技术:向大型教师模型发送请求并记录输出,与标准答案比对后,用这些数据训练更小的学生模型,使其近似教师行为。这一过程可大幅压缩模型体积、同时保持性能,被认为是大模型落地的关键技术之一。

微调(Fine-tuning)

微调指在已有模型基础上,使用特定领域或任务的专用数据进一步训练,以提升模型在垂直场景的表现。许多 AI 创业公司以开源大模型为起点,通过微调补充行业知识库,从而在医疗、法律、金融等垂直领域构建商业产品。

生成对抗网络(GAN)

GAN(Generative Adversarial Network)由两个神经网络组成:生成器负责基于训练数据创建内容,判别器负责识别哪些是伪造的。两者不断博弈——生成器试图"骗过"判别器,判别器持续提升鉴别能力——最终产出更逼真的数据。GAN 是 deepfake 工具的核心技术,但更适合图像、视频等窄场景,而非通用 AI。

幻觉(Hallucination)

"幻觉"是 AI 行业对模型虚构信息的委婉说法。由于训练数据存在盲区,模型可能在回答中编造不准确甚至危险的答案(如给出有害的健康建议),这推动了垂直领域 AI 的发展——专业数据越丰富,幻觉风险越低。

推理(Inference)

推理是模型实际运行、基于已有知识做出预测的过程。没有训练就无法推理——模型必须先从数据中学习模式,才能在新输入上生成输出。推理可在多种硬件上执行,从手机芯片到高端 GPU 乃至专用 AI 加速器,但大模型在笔记本上的推理速度远不如配备高端芯片的云服务器。

大语言模型(LLM)

LLM 是 AI 助手(ChatGPT、Claude、Gemini、Llama、Mistral 等)背后的核心。它们是包含数十亿参数的多层深度神经网络,通过学习海量文本中的词汇关系,构建起多维语言地图。当你向 AI 助手提问时,LLM 在数十亿书籍、文章、语料中匹配最可能的回答模式。

记忆缓存(Memory Cache)

缓存是提升推理效率的关键优化技术。AI 推理依赖大量数学计算,缓存通过保存中间计算结果供后续复用,减少重复运算。其中 KV(键值)缓存广泛应用于 Transformer 架构模型,显著缩短响应时间并降低算力消耗。

神经网络(Neural Network)

神经网络是深度学习和生成式 AI 的底层架构,由多层算法节点组成。它是大型语言模型(LLM)得以涌现的技术基础,也是这一波 AI 浪潮的核心支柱。

开源与闭源:AI 行业的基础性分歧

开源(Open Source)指软件(或越来越多的 AI 模型)底层代码向公众公开,任何人都可以使用、检查或修改。在 AI 领域,Meta 的 Llama 系列模型是典型案例;操作系统领域则对应 Linux 这段历史经典。开源方式让全球研究者、开发者、企业能够在彼此工作基础上继续建设,从而加速进步,并实现闭源系统难以提供的独立安全审计。

闭源(Closed Source)则意味着代码私有化——你可以使用产品,却无法窥见其内部运作原理,OpenAI 的 GPT 系列模型即属此列。这一差异已成为 AI 行业最具代表性的争议焦点之一。

并行化:GPU 时代的核心工程能力

并行化(Parallelization)即同时处理多项任务,而非依次逐条完成——就像 10 名员工同时推进项目不同环节,而非一人顺序包办全部工作。在 AI 领域,并行化贯穿训练与推理全过程:现代 GPU 专为并行执行数千次计算而设计,这也是它们成为行业硬件支柱的关键原因。

随着 AI 系统复杂度持续攀升、模型规模日益庞大,在多芯片、多机器间并行化任务的能力,已成为决定模型构建与部署速度及成本效益的核心要素。新一代并行化策略研究,如今已发展为一个独立学术领域。

内存危机:AI 竞赛的意外牺牲品

"RAMageddon" 是科技行业一股不太有趣的趋势的名称:随机存取存储器(RAM 芯片)持续短缺。这种芯片几乎为所有日常消费电子产品提供算力支撑。随着 AI 产业蓬勃发展,各大科技公司与 AI 实验室争相打造最强性能、最高效率的系统,大量购入数据中心所需内存,导致消费市场供应严重不足。供应瓶颈进一步推高剩余库存价格。

受影响领域包括:

  • 游戏产业:主流公司已因设备内存芯片采购困难而上调主机售价
  • 消费电子:内存短缺可能引发十多年来最大幅度的智能手机出货量下滑
  • 企业级计算:各公司连自身数据中心所需内存都无法满足

内存价格飙升预计将持续至短缺结束为止——然而不幸的是,短期内并无明显迹象显示情况会有所好转。

强化学习:AI 自我进化的训练范式

强化学习(Reinforcement Learning)是一种让 AI 系统通过尝试与奖励反馈来学习的训练方式——类似用零食训练宠物,只是这里的"宠物"是神经网络,"零食"则是代表成功的数学信号。区别于监督学习(基于固定标注数据集训练),强化学习允许模型探索环境、执行动作,并根据收到的反馈持续调整行为。

这种范式已被证明在以下场景格外有效:

  • AI 游戏对战能力训练
  • 机器人控制系统
  • 近年来:提升大语言模型的推理能力

通过人类反馈进行强化学习(RLHF)等技术,如今已成为头部 AI 实验室微调模型、使其更高效、更准确、更安全的关键手段。

Token:人机沟通的基本单元

Token(词元)是人类与 AI 之间通信的基础构件,代表 LLM 处理或生成的离散数据片段。Token 通过"分词"(Tokenization)过程生成——将原始文本拆解为语言模型能够消化的小块单元,类似于编译器将人类语言翻译为计算机可执行的二进制代码。

在企业场景下,Token 还直接关联成本——大多数 AI 公司按量计费(LLM 使用按 Token 计费),用量越多,账单越高。

Token 吞吐量:AI 基础设施的核心指标

Token 吞吐量(Token Throughput)衡量系统在单位时间内能够处理的 Token 数量。由于 AI 语言模型将语言拆解为往往不足完整单词的微小片段,Token 可类比为理解 AI 工作负载时的"词"单位。吞吐量越高,系统并发处理能力越强,用户获得响应的速度也越快。

AI 研究员 Andrej Karpathy 曾在公开场合描述过订阅的 AI 服务闲置时产生的焦虑感——如同当年读博期间昂贵硬件未被充分利用时的心情。这一共鸣精准解释了为何最大化 Token 吞吐量已成为该领域的执念。

模型训练:深度学习的技术起点

虽然受人脑神经回路启发的数据处理算法设计理念可追溯至 1940 年代,但真正释放其实践潜力的,是游戏产业推动的图形处理硬件(GPU)快速普及。这类芯片让训练层数远超早期时代的算法成为可能,使神经网络 AI 系统在语音识别、自动驾驶、药物研发等多个领域实现显著性能突破。

什么是训练(Training)

开发机器学习 AI 的核心环节是训练:将数据输入模型,使其从数据模式中学习,最终生成有用的输出。简单理解,就是让系统识别数据中的特征,据此调整输出以逼近目标——无论是识别猫的图片,还是按要求写一首俳句。

训练成本高昂,因为需要大量数据输入,而所需的数据量还在持续增长。这也是混合方案受到关注的原因——比如先用规则型 AI,再通过定向数据微调,可以有效控制成本,不必从零开始训练。

迁移学习(Transfer Learning)

迁移学习是一种高效建模技术:用已经训练好的 AI 模型作为起点,开发一个用于不同但通常相关任务的新模型,从而复用在前期训练中积累的知识。

迁移学习的优势在于两点:一是缩短模型开发周期,节省资源;二是在目标任务数据有限时尤其有用。不过需要注意的是它的局限性:依赖迁移学习获得泛化能力的模型,往往还需要在目标领域补充训练数据,才能达到理想效果。

权重(Weights)

权重是 AI 训练的核心要素。它决定了在给定训练任务中,不同特征(输入变量)被赋予多大的重要性,从而塑造模型的输出结果。

权重本质上是数值型参数,用来标记数据集中哪些信息最为关键。它们通过乘法运算作用于输入数据。模型训练初期,权重是随机分配的;随着训练推进,权重会不断调整,使输出逐渐接近目标值。

举例来说,一个用于预测房价的 AI 模型,以某地区的房产历史数据为训练集,其中可能包含以下特征及其权重:卧室数量、卫生间数量、房屋类型(独栋/半独栋)、是否有停车位、是否有车库等。最终,模型赋予每个输入特征的权重,反映了该特征对房价的影响程度。

验证损失(Validation Loss)

验证损失是一个数值,用来实时反映 AI 模型在训练过程中的学习效果——数值越低越好。研究人员将它视为训练过程的"实时成绩单",据以判断何时停止训练、是否需要调整超参数,或是否需要排查潜在问题。

验证损失最重要的作用之一是帮助发现过拟合(Overfitting):模型不是在学习可泛化的规律,而是直接"背诵"了训练数据。例如,一个学生真正理解了知识点,另一个只是死记硬背了去年的考题——验证损失能帮你判断模型正在变成哪一种。

延伸阅读

 
内容管家

发表评论