生成式字幕:从语音到理解

Shirley Coady 2024年9月3日 读完需 8 分钟
An introduction to translation collaboration
去年,我写了一篇关于视频本地化的博客。在技术领域,一年的时间仿佛被拉长了许多——实际上,不论是哪个领域,一年的光阴都是一段漫长的时光。在过去的 12 个月里,佛得角成为 50 年来首个被世界卫生组织宣布无疟疾的撒哈拉以南国家。丹麦的玛格丽特女王退位,这也让世界暂时没有了在位的女性君主。日本成为了第五个在月球上放置航天器的国家。  TikTok 跻身全球下载量排名第三的社交媒体平台。  
 
无论世界如何变幻,我们似乎都会一直录制关于这一切的视频。据 Statista 报道,媒体内容预计将在 2024 年产生 1.6 万亿美元的收入,并且这一数字还将持续攀升。人们如今越来越习惯于通过短视频接收信息,或者拿起身边的设备观看想看的电影。我们还借助录制会议的功能,实现了昼夜不停的高效工作模式(Life Pro 小贴士:我发现了一个省时小妙招,那就是跳过那些我没有任何实质性贡献的会议,然后在需要的时候,以 1.5 倍度观看录制内容。) 
 
同时,AI 技术正以惊人的速度蓬勃发展。我满怀期待地憧憬着 AI 在未来的某一天或许能帮我做家务,比方说,能够灵巧穿梭于楼梯间吸尘的 Roomba 扫地机器人?但与此同时,我们可以继续开发出更多新颖的方法来提升生产力,提高质量,并节省资金。  
 
随着 AI 能够为我们分担更多琐碎的任务,专家技能将继续凸显其价值。但这意味着视频本地化将依旧是一个成本高昂且需要深厚专业知识的领域。为什么?在这里,我稍微“偷个懒”,直接从去年的博客中搬运答案: 
  • 这是一个非常复杂的流程。因此,人们构建了一些专门的应用程序,帮助专业人员完成这项工作。 
  • 字幕难以翻译。文本长度有限制,需要确保文本与视频内容相匹配,由于停顿或场景变化,句子可能会被截断……等等。这也是为什么这项工作通常由专业人员来处理的原因。 
  • 自动翻译无法很好地处理句段片段,而另一方面,字幕必须与视频屏幕上的内容匹配。 
  • 需要花费大量时间在质量保证上。您需要反复查看、收听和阅读…不断循环…每种语言的整个视频。 
  • 精确到毫秒。如果字幕与实际讲话有偏差,观众马上就会注意到。 
当下一季的《鱿鱼游戏》推出时,我衷心期盼新一季的字幕能够尽善尽美。网飞啊,请务必请专业语言学家参与本地化过程!而对于我错过的网络研讨会,我需要了解其内容,但又希望跳过扣人心弦的环节。遗憾的是,由于视频本地化成本高昂,而这些网络研讨会的预算又都不高,因此,它们往往没有字幕或没有经过本地化处理……不过现在开始情况又不一样了! 
 

新的 Trados 生成式字幕功能惊艳来袭

 
借助“生成式字幕”,您可以为视频快速创建云翻译项目(使用客户门户网站或内置连接器),您会惊喜地发现,字幕将自动生成,同时符合行业最佳实践。添加自定义提示,以确保主持人在视频中介绍您时,避免因口音问题导致名字拼写错误。  
 
太棒了,对吧?但还不止如此。本地化无疑也是一大挑战。或者,我应该说,本地化也曾是一大挑战! 
 
如果我们不再一小节一小节地翻译,而是直接利用字幕文件,借助 LLM 的力量进行翻译,情况会怎样呢?我们向 LLM 发送视频摘要,为它提供丰富的上下文信息,这样是不是会更高效呢?甚至还可以把术语一并发送给它,岂不是更准确吗? 
 
您可能已经猜到了——您将获得心满意足的字幕本地化成果!了解其工作原理: 
 

   
 
等一下。最后一步是“使用实时预览在 Online Editor 中检查”……您肯定早就注意到了,逃不过您的慧眼。对于网络研讨会和培训视频等,完全自动化的翻译确实已经相当出色了。但是,我的上司在读指示时总是含糊不清,我需要运用一些技巧,让他的指示听起来更加清晰明了。接下来,我们就一起来看看。 
 

屏幕截图:Online Editor 中提供上下文语境的翻译预览  
 
神奇的事情发生了,在滚动 Online Editor 文本的同时,视频和声音将同步播放。当您编辑文本时,可以看到字幕实时更改。您可以标记那些含糊不清的句段,稍后返回这里,询问上司:“您当时想说什么呢?”或者——也许我的上司 Matt 正在阅读这篇博客——我的意思是,您可以返回这里,对上司的深刻见解献上赞赏。 
 
我知道您现在在想什么;这好到难以置信!我是在做梦吗? 
 
如果您现在听到我的声音时,能看到字幕在我的脑袋下面弹出来,那么答案是……很可能是的!但如果不是这样,那我们来聊聊常规话题。  
  • 安全和隐私?好的!这个出色解决方案中使用的 LLM 托管在 RWS Language Cloud 资产中。您的数据永远不会被公开。  
  • 工作流自动化?好的!此功能将标准的 Trados Cloud 环境与项目模板、工作流模板以及任务分配等整合,您只需把视频拖放进去,然后悠闲地享受一杯咖啡,一切工作将悄然搞定。 
  • 生成报告?好的!这些项目与其他项目一样。我们将持续不断地添加新数据进行跟踪,但请放心,您将能够展现出您那令人瞩目的生产率。 
  • 太棒了!现在您可能会问:“Trados 啊 Trados,有什么是你做不了的?” 
好吧,仅仅依靠 Trados 无法完成《死侍》和《金刚狼》的字幕。我们在漫威的朋友还会采用专门的解决方案,比如我们的合作伙伴所提供的 CaptionHub。这个强大的工具不仅能够让他们调整时间戳,还能在屏幕上自由移动字幕,并以更加通俗的语言翻译《死侍》中那些有趣的口语。  
 
想要查看结果?我们的 Elevate 视频就是使用这个解决方案完成了字幕添加和本地化工作。 
 
想看应用实例吗?请联系您的客户经理安排演示……一定要带上爆米花庆祝一下,因为多媒体将成为您最喜欢的新文件类型。 
Shirley Coady
创作人员

Shirley Coady

产品管理总监

Shirley Coady 具备 20 多年的语言技术经验。她的职业生涯始于软件开发人员,随后转至一家初创公司,并在那里担任了技术支持和专业服务等多个职务。


随着公司的发展,她仍然对构建产品充满激情,并担任了产品管理职务。通过各种并购,她管理过中小型和大型公司的新产品和现有产品。 


2022 年,她受命领导 RWS 语言技术产品管理团队,带领这支才华横溢的团队为业内大型技术公司提供一系列涵盖传统和前沿技术的产品组合。 

全部来自 Shirley Coady