用 LLM 做翻译：它在哪里出彩，又在哪里翻车

语言模型翻译得足够流畅，流畅到让人觉得这个问题已经解决了。本文谈它真正出彩之处、它悄无声息翻车之处，以及流畅为何会把错误藏起来。

use-cases2026-05-27 13:55 KST·主编·7 分钟

翻译，感觉就像是大语言模型直接解决掉的问题之一。粘贴一段一种语言的文字，得到另一种语言里流畅、自然的文本——远胜十年前那种生硬的机器翻译。对很多日常用途来说，它确实就是这么好。但"流畅"和"正确"是两种不同的属性，而二者之间的鸿沟，正是用语言模型做翻译变得危险的地方——因为输出读起来太顺了，错误根本不像错误。本文谈 LLM 翻译真正出彩之处、它悄无声息翻车之处，以及如何使用它而不至于发出一个自信满满的误译。

它真正出彩之处

它的强项是流畅与自然。老一代系统逐词翻译，产出的文本技术上正确，却一看就是外语腔。现代模型产出的文本读起来仿佛出自母语者之手，能以早期方法做不到的方式处理习语、语域和行文节奏。对于理解一份外文文档的大意、用于日常沟通、或得到一份供人后续打磨的翻译初稿，这都是一次真正的飞跃，也是巨大的省时利器。

它在单段文字内部利用上下文的能力也出奇地好。给它一段话，它能从周围的句子里挑出某个有歧义词语的正确含义，匹配语气，产出连贯的内容，而不是一串彼此脱节的句子。正是这种上下文意识，把它和人们记忆中那些糟糕的翻译工具区分开来。

流畅为何是个陷阱

核心风险在于：无论准确与否，输出永远是流畅的。误译不会像老式机器翻译那样用别扭的措辞主动暴露自己。它读起来天衣无缝，含义却与原文有着微妙的——甚至彻底的——差别。一个不懂源语言的读者无从察觉这个错误，因为他唯一能用上的信号，也就是别扭感，已经被抹掉了。

这颠覆了人们所依赖的"自信与正确"之间的惯常关系。我们习惯于更信任流畅、自信的文本，而非磕磕绊绊的文本。在 LLM 翻译这里，这种本能失灵了，因为流畅是被保证的，而正确不是。模型在"听起来像母语"上做得越好，读者就越难分辨它什么时候错了。

它悄无声息翻车之处

这些失败聚集在一些可预测的地方。人名、技术术语和领域专有词汇，本该原样保留或使用约定俗成的对应译法，却被"翻译"了。否定和条件——那些会翻转含义的小词——被丢掉或软化，从而改变了一个句子所承诺的内容。数字、单位和格式在不同惯例之间被处理错。文化指涉或习语被逐字直译成某种语法正确却毫无意义的东西。

更长的文档还会引入它自己的失败：一致性。在第一页被译成一种说法的术语，到第十页飘移成了另一个词，因为每一块文本都是在不严格记住先前选择的情况下被处理的。在法律合同或技术手册里，同一个术语每次都必须指同一样东西，这种飘移即便每个单句本身都没问题，也是一个实实在在的缺陷。

语言并不平等

一个不显眼却重要的现实是：质量会因语言对而天差地别。在两种使用广泛、训练数据丰富的语言之间翻译，效果出色。涉及一种资源较少的语言、或两种很少同时出现的语言之间的翻译，则明显更弱——更直译、更易出错，也更可能把那种占主导地位的语言当作一个看不见的中间桥梁来兜底。像 Hugging Face 文档中记载的那些工具与模型家族，让这种差距变得可见：能力跟随数据，而数据在世界各语言之间的分布并不均匀。

陷阱在于，无论如何输出看上去都同样流畅。一个在两种主要语言之间翻译时体验极佳的用户，会想当然地以为同样的质量也适用于一个更冷门的语言对，而流畅的输出不会给他任何怀疑的理由。自信是均匀的，准确却不是。

高风险翻译是另一类问题

对于随意的理解性用途，偶尔的错误无伤大雅。但对于任何有后果的事情——法律文件、医疗信息、安全须知、代表品牌形象的营销文案——算盘就完全变了。合同中一处微妙的误译可能改变责任归属；用药说明里的误译可能伤害到人；一份公开声明里的误译可能酿成一桩四处扩散的尴尬。让输出读起来舒服的那份流畅，恰恰也是让一个严重错误一路蒙混过关、直到要紧时才被发现的原因。

对于高风险工作，成熟的做法是把模型当作一台初稿引擎，而把人类译者当作权威。模型快速完成大部分工作；一个精通两种语言的人，去抓出那个被丢掉的否定、那个飘移的术语、那个被直译的习语。这种分工比从零翻译更快，也远比直接发出原始输出更安全。人工复核的力度，应当与"出错的代价"成正比——内部邮件可以轻一点，正式发布的合同则要重得多。

怎样用它而不被烫到

有几条做法把安全使用与冒险使用区分开来。一开始就想清楚这项工作是"看懂这个"还是"发布这个"，因为二者要求的审查程度不同。对于要发布的内容，让一个能读懂两种语言的人来复核输出，重点关注人名、数字、否定和一致性，而不只是整体的可读性。维护一份术语表，规定哪些词必须按特定方式翻译，并检查输出是否遵守。对冷门语言对要格外小心，那里流畅会掩盖更弱的准确性。这些都不玄乎，无非是一种纪律：不把流畅当作真相的替身。

总结

LLM 翻译是一次实实在在的飞跃：流畅、自然、有上下文意识，对于理解和初稿都是巨大的省时利器。它的危险正是它强项的反面——无论正确与否，输出永远顺滑，于是那些老系统会用别扭主动暴露的错误，如今披着完美的外衣到来。它会在人名、否定、数字、习语和长文档一致性上悄无声息地翻车，在资源较少的语言对上要弱得多，却显得一样自信。让你的审查力度与风险相匹配：在大意层面信任它，在所有事情上用它打初稿，并在模型与任何将被发布的内容之间放一个双语的人。做到这些，它就是一件强大的工具。在高风险工作中直接发出原始输出，你迟早会发布一个满屋子人都看不出来的自信错误。

#translation#localization#language#quality

原始来源

Hugging Face documentation