Google AI 怎么连自家名字都拼不对

2026年5月28日内容管家

内容管家

1450
文章

0
评论

AI领域评论7字数 682阅读2分16秒阅读模式

Google AI Overview 最近又出洋相了——它居然答不上来 Google 这个词里有多少个字母 P。

TechCrunch 报道了这起翻车事件。Google 发言人向该媒体解释称："数单词里的字母一直是 LLM 已知的能力短板，我们正在修复这类问题。"

为什么大语言模型不懂拼写？

事情源于用户向 Google 搜索提问"Google 这个词里有多少个 P"，AI Overview 给出的答案是"2 个"——然而正确答案应该是 1 个 P，因为 G-o-o-g-l-e 里其实只有 1 个 P。

这已经不是 Google AI Overview 第一次闹笑话了。去年首次上线时，它曾引用《The Onion》和 Reddit 的讽刺帖子，建议人们吃石头、在披萨上抹胶水。本轮搜索改造以生成式 AI 为核心，类似的翻车似乎并不意外。

更深层的问题在于：LLM 根本不理解拼写。

研究人员早已指出，大语言模型并不能像人类一样"阅读"文本。多数 LLM 基于 Transformer 架构，会将输入文本分解为 token——这些 token 可能是完整单词、音节，甚至单个字母，具体取决于模型设计。模型把文本转换成数值表示，再通过上下文来生成回答。

阿尔伯塔大学 AI 研究员 Matthew Guzdial 助理教授向 TechCrunch 解释："LLM 基于 Transformer 架构，但实际上并不是在真正阅读文本。当你输入提示时，它会被翻译成一种编码。当模型看到'the'这个单词时，它有这个词的编码表示，但并不知道字母 T、H、E 分别是什么。" 由于 token 化架构的天然局限，研究人员对解决拼写问题并不乐观。

东北大学研究大语言模型可解释性的博士生 Sheridan Feucht 表示："很难定义什么叫'单词'对语言模型来说是什么。即使让人类专家就完美的 token 词汇达成共识，模型仍可能发现把内容进一步'分块'更有用。我的猜测是，由于这种模糊性，根本不存在完美的分词器。"

AI 不是万能的

对研究人员来说，拼写错误并非紧迫问题——LLM 的价值本来就不在于拼写。但这类低级失误恰好提醒我们：AI 并不完美，有时看似全知全能，实则充满缺陷。我们不能盲目信任 AI 输出，必须核查其准确性。

Google 已在上周修复了另一个问题：搜索"disregard"会错误地返回"好的，随时有新问题随时告诉我"，但拼写类错误仍然顽固存在。

为什么大语言模型不懂拼写？

AI 不是万能的

发表评论