LSP 可以与客户分享以加快文件准备的重要提示

Tom Imhof 2022年11月17日 读完需 10 分钟
LSP 可以与客户分享以加快文件准备的重要提示

在过去的 10 年里,Trados Studio 等现代化翻译环境所支持的文件类型有了明显的增长。译员如今可以顺利地打开大多数文档并直接翻译,而无需对这些文件做进一步的准备或后处理,但是在过去,这是翻译流程中的一项常见任务。然而,即使在今天,有时候文件的准备效果也不太理想。例如,译员可能会遇到这样的情况:句子在中间被截断,一部分被放在下一个句段的开头,这就导致翻译这些内容变得非常棘手。 

准备棘手文件时面临的挑战

对于难以处理的文件,有时需要很长时间才能完全把它加载到翻译编辑器中,甚至在长时间等待后仍无法打开。即使可以打开,译员有时需要等待几秒钟才能从一个句段跳到下一个句段。译员可能还会收到客户投诉,因为不该翻译的文本被翻译了,甚至更糟糕的是,有些内容根本没有翻译(例如,翻译编辑器从一开始就没将这些内容视为可翻译)。对于处理双字节、从右到左和东欧语言的译员而言,让他们头疼的是在完成翻译后,目标语言文档中的文字显得杂乱无章,或者完全没有被展示出来。另一个常见的问题是,已翻译文档的版面和源文档完全不一样,因此在完成翻译后,他们不得不花费大量的时间来重新排版。 

综上所述,我们离准确无误的翻译流程还有很长一段路要走。很多时候,我们必须完成大量的工程工作才能将文档转换为可翻译格式,或者需要在翻译完成后纠正排版问题。为什么会发生这些问题?如何指导客户避免或至少在将来尽量减少这类糟糕的意外情况?

可与客户分享的能节省时间的文件准备提示

下面是一些实用提示,其中包含可以与客户分享的一般性建议。这些提示将能帮助客户从一开始就从文档中获得优质翻译结果,也可以帮助项目经理节省大量时间。在创建内容时(即在创作过程中),应充分考虑以下大部分提示:
  1. 避免创建高达数百万字节的庞大文档,正确做法是将内容编排成较小的内容块,避免造成译员电脑的内存不足。在现代化翻译环境(如 Trados Studio)中,文本从源文档中提取出来并放入双语中间文档(包含原文文本和译文文本)中,方便译员进行翻译。由于中间双语文件同时包含原文文本和译文文本,因此文本量实际上会加倍,所以中间文件的大小可能会变得非常大。
  2. 在大多数时候,明智的做法是为已翻译文本留出充足的排版空间,因为译文会变长,占用更多位置。例如,与英语相比,相同的内容翻译成法语、西班牙语、葡萄牙语和意大利语等罗马语言,以及波兰语、俄语、克罗地亚语、塞尔维亚语等东欧语言后会显著变长。因此在很多时候,原来的排版可能装不下翻译后的文本。 
  3. 避免在图片上添加文本(JPG、PNG、TIFF),因为在许多时候,这些文本无法被提取出来进行翻译。创建可翻译内容时,避免使用 Adobe Illustrator 或 Photoshop 等图形应用程序自带的文本功能。明智的做法是使用 InDesign、Word、FrameMaker 等应用程序来创建可翻译内容,使用图形应用程序来创建可视化内容。 
  4. 避免在句子中间使用分段符,而是使用软换行符。请记住,将可翻译文本导入翻译编辑器后,文本将被分割成一系列句段,即翻译编辑器将创建较小的内容块,例如每个句子成为一个句段。如果您使用分段符来编排文档的版面,句段将在中间被截断,翻译将成为噩梦。 
  5. 在创建版面时使用样式,避免手动设置格式。避免使用空格或制表符创建缩进——如果可能,请使用具有自动缩进的样式。 
  6. 当选择公司字体作为公司标识的一部分时,请提前计划它们是否需要本地化以及需要本地化成哪些语言。为您的 CI 选择一种公司字体,而且这种字体支持目标语言的所有字符集。
  7. 避免发送 PDF 文件进行翻译。首选开放格式。即使在许多时候我们都可以从生成的或扫描版 PDF 中提取内容,但是最后生成的译文版面还不如基本的开放文本格式那么美观。 
  8. 避免将 PDF 文档嵌入到主文档中,明智的做法是嵌入到开放格式中,因为在大多数时候这些格式都可以导入到翻译编辑器中。 
  9. 在发送文档进行翻译之前,请确保您知道哪些文本必须翻译,哪些文本不需要翻译,并务必把这些要求告知译员或 LSP。Trados Studio 等现代化翻译环境提供许多功能。在这些功能的帮助下,译员可以选择要翻译的文本或排除不需要翻译的文本,换言之,具有更大的话语权,可以根据具体要求导入需要翻译的文档部分,或忽略不需要翻译的文档部分。
除了上面的一般性建议外,以下几条提示对于处理某些特定文件类型尤其有用。

如何处理 CMS 内容
 
当从 CMS(内容管理系统)或 PIM(产品信息管理)导出要翻译的内容时,XML 始终优于 Excel。即使到了 2019 年,Excel 单元格对于可容纳的最大字符数仍有限制。因此,如果文本在翻译后变得更长,内容就有可能不符合 Excel 单元格对于最大字符数的限制,在这种情况下,内容将被截断。此外,与 Excel 单元格中的嵌入式 HTML 代码相比,XML 更易于配置为可翻译格式,在大多数时候,如果内容从一开始就使用 XML 格式生成,翻译编辑器将能更合理地对其进行分段。

处理桌面排版应用程序生成的文件的提示
 
如果文件是采用桌面排版软件(如 InDesign 和 QuarkXPress)生成的,建议采用以下最佳实践: 
  1. 使用文本层将需要翻译的文本与不需要翻译的文本分开。
  2. 使用内置的表格编辑器而不是制表符来创建表格。留出足够的空间,因为表格标题可能会变长。 
  3. 避免创建多语言文档(每种语言一层),因为这会使文档变得更大,在性能较低的计算机上更难处理。此外,最重要的是,如果您希望将此类文档翻译成多种语言,则翻译只能按顺序进行,即先完成一种语言的翻译,再完成另一种语言的翻译;这不是一件简单的工作,因为您无法将同一文档发送给多名译员,让他们同时将文档翻译成多种语言,并随后将所有译文合并回同一个文件。在这种情况下,从一种语言一个文档入手就容易多了。

处理 Microsoft Office 应用程序生成的文件的提示

  1. 避免在表格单元格中输入长文本块——Excel 的表格单元格限制为每单元格最多容纳 32767 个字符。 
  2. 使用 MS Word 或 PowerPoint 时,请使用样式或隐藏文本功能将需要翻译的文本与不需要翻译的文本分开。对于 Excel 文档,请始终告诉译员哪行/列包含需要翻译的文本,以及哪行/列包含不需要翻译的文本。请勿折叠或隐藏需要翻译的列或行,否则这些列或行将不会导入到翻译编辑器中。 
  3. 使用宏时,请避免使用 VBA 代码对可翻译文本进行硬编码。 
  4. 理想情况下,先接受所有跟踪修订,再开始翻译文档。
  5. 避免使用旧的二进制文件格式(DOC、XLS 和 PPT),明智的做法是使用现代化文件格式(DOCX、XLSX、PPTX)。 
  6. 尽量避免使用 Microsoft Publisher,而是使用 InDesign(或 QuarkXPress),因为目前 MS Publisher 没有可靠的文件类型筛选器,这意味着翻译完这些文档后还有大量繁琐的工作在等着。
Alex Rodrigues
创作人员

Tom Imhof

Localix 资深业务顾问
Tom 拥有多年翻译行业从业经验,他的职业之旅始于俄语译员和术语专家。2009 年,他创立了自己的语言技术咨询公司 localix.biz,并与各界公司、语言服务提供商和自由译员合作,帮助他们在自己的流程中应用翻译技术。
全部来自 Tom Imhof