人工智能热潮未见减退:但可持续发展的代价又是什么?
2023年11月1日
读完需 7 分钟
“记住,记住 11 月 5 日”
作为一个在英国长大的人,每年快到这个时候,我都会想起著名童谣中的这句话,这首诗描述了几百年前盖伊·福克斯企图在伦敦实施的恐怖袭击。我想借用这个说法并稍作改动,建议大家“记住,记住 11 月 30 日”。您可能会不以为然,但请给我一点时间,听我解释一下……
在 1487 年 11 月 30 日,巴伐利亚公爵阿尔伯特四世在慕尼黑颁布了德国历史上第一部啤酒纯度法 (Reinheitsgebot),明确规定啤酒只能由三种原料酿造而成,即水、麦芽和啤酒花。
第一场国际足球协会足球赛于 1872 年在格拉斯哥举行,并以苏格兰与英格兰 0-0 战平告终。
1928 年,澳大利亚板球传奇人物唐纳德·布拉德曼爵士在布里斯班举行的首次板球测试赛中与英格兰队交锋,表现不佳,仅得到 18 分和 1 分。因此,在接下来的测试赛中,他被降级为替补队员。布拉德曼在其职业生涯中完成了 80 场测试赛,平均得分高达 99.84 分,这一成就堪称空前绝后。
现在,尽管我对啤酒、足球和板球非常感兴趣,但您可能会问,这与我们正在讨论的话题——人工智能和可持续发展有什么关系呢?
让我们回到 2022 年 11 月 30 日,那天,Open AI 向全世界发布了 ChatGPT。如果盖伊·福克斯还在世,他可能也会对我们目睹的全球大变革及其对许多人日常生活的深远影响而感到自豪。
可持续发展是近期备受关注的另一个议题。如今,我们手头的信息来源五花八门,其中有些更值得信赖。因此,我常常从天真无邪的青少年身上获得对世界不偏不倚的看法。就在不久前,我还经常提醒我的孩子,当不使用电灯和电器设备时,记得要关闭电源。然而,现在情况发生了转变,当我将垃圾放入错误的回收箱时,两个孩子会不断地提醒我!通过回收利用,我们能够减少生产和运输新货物所需的能源,从而降低二氧化碳的排放。正如我的孩子现在经常说的,每次我们记得重复使用、维修或回收利用物品时,我们都在为拯救地球而尽自己的一份微薄之力!
那么……我们还能做些什么来减少碳足迹?
如今,可持续发展政策在许多公司中变得越来越普遍。现在有大量的工具、资源和框架可供公司选择,以支持其衡量和报告环境、社会和治理 (ESG) 倡议。此外,我们还注意到一种日益增长的趋势,即越来越多的公司正在发布与可持续发展倡议相关的内容,以提高其组织的透明度,使公众更好地了解公司,并提升品牌的形象。知名科技公司 Apple 最近精心制作了一段视频,向全世界介绍其在实现环境目标方面所取得的进展。在上传后的短短一天内,该视频在“X”平台(即以前的 Twitter)上吸引了超过 50 万的观看次数。
转向可再生能源和减少使用量确实是减少碳排放的关键第一步,但要想取得成效,首先需要了解当前的使用情况,明确设定减排目标,并建立有效的衡量标准来跟踪我们的进展。就像节食一样……如果不知道开始减肥时的体重,也不知道每天消耗多少卡路里,那么您可能难以达成目标。
在最近由 ATC(翻译公司协会)主办的“道德商业峰会”上,最让我产生共鸣的是 Dallas Consulting 公司发表的专题演讲中提出的口号,“追求进步,而非追求完美”。过于追求完美可能会以失败告终,但通过实现一系列小目标和里程碑,能够共同产生重大影响。
一个可能产生重大影响的改变是,考虑将软件平台迁移到公共云,并选用注重碳中和的负责任的供应商。云服务提供商在效率方面具有先天优势。毕竟,效率直接关系到他们的盈利能力,因此,云服务提供商会投资先进的技术,并密切监控以确保硬件得到有效利用,并优化容量。据统计,20% 的机架式服务器没有得到充分利用,更有甚者根本没有使用。云环境作为一项外包支出,一直受到采购团队的关注,然而,自行托管和管理的服务器往往不被关注。
人工智能如何融入您的可持续发展计划?
说人工智能在最近几年中开始迅速发展,其实是一种保守的说法。人工智能的潜力是无限的,许多人都已经注意到了它的优势并加以利用,但在可持续发展方面,我们应该意识到一个隐藏的成本,也许这个成本并不是那么显而易见。
训练大型语言模型 (LLM) 需要庞大的计算能力。据估计,GPT-3 的训练导致排放了约 500 吨二氧化碳。用一种更直观的方式来说,这个数值相当于一辆普通的汽油乘用车行驶 140 万英里,或给 6,700 万部智能手机充电所消耗的能量。
如今,许多人都在讨论如何将人工智能和大型语言模型集成到我们常用的搜索引擎中。据估计,通过添加生成式人工智能,每次搜索所需的计算能力将增加 4-5 倍。ChatGPT 目前每天约有 1,300 万用户,而一个典型的主流搜索引擎每天处理的搜索量高达 5 亿次!
我们还需要考虑生成式人工智能模型所需的硬件设备。大多数知名的生成式人工智能模型都是由超大规模提供商处理的,需要使用数千台配备 GPU(图形处理单元)的服务器。自加密货币挖矿和机器学习兴起以来,GPU 也焕发了新的生机,在一段时间内更是供不应求。虽然 GPU 非常适合用于机器学习,因为它们能够高效地并行处理大型数据集和执行复杂的算法,但我们也必须考虑到它们所产生的能量消耗。
虽然目前数据中心产生的温室气体排放仅占全球总量的 1-3%,但据估计,由于与通用搜索引擎的集成,它们可能无法应对日益增长的生成式人工智能需求。
在建设新的数据中心方面,我们开始观察到人们思维方式的转变,并且这种转变正逐渐形成一股不断增长的动力。例如,在 ATC 道德商业峰会上,欧盟委员会翻译总局的 Christos Ellinides 提到,欧洲各地正在建立九个数据中心来托管超级计算机,这些数据中心主要使用绿色能源来运行。例如,在卢森堡建设的一个数据中心使用 100% 的绿色能源(由废木材制成)来为超级计算机进行冷却和供电。
人工智能为什么需要如此大的处理能力?
生成式人工智能模型的初始训练是整个流程中计算资源消耗最为密集的部分。训练一个大型语言模型所产生的能源消耗和碳足迹与一次跨大西洋的商业航班相当。经过训练后,这些模型就可以用来根据用户的提示生成响应,尽管每次会话所需的能量减少了,但会话的数量却在不断增加。
我们还注意到,随着各组织争相成为这一领域的领导者,基于开源代码的大型语言模型版本的数量也在急剧增加。这个开源代码领域充满了创新,提供了多种模型供受众选择,使得更广泛的群体都可以加以利用。但是,从可持续发展的角度来看,这可能会导致更多的组织努力创建或调整自己的模型,这反过来又会导致更高的能源需求。这种趋势的分散性质意味着,这一责任不仅仅由少数公司来承担。因此,必须让更多的组织能够参与采取各种减少碳足迹的行动和措施。
当前有大量研究正在进行,旨在探索在制定大型语言模型策略时,哪些是最佳的方法。我们开始思索,什么是最佳规模?我们应该从零开始创建大型语言模型,还是直接采用商业模型更好?我发现,这与多年前翻译记忆库首次出现时,语言服务行业所经历的情况有很多相似之处。当时,行业专家也都在努力寻找完善翻译记忆库策略的方法。大型语言模型的出现再次引发了这一争论,因为现在我们能够开始利用生成式人工智能的潜力来辅助、教育和强化传统的翻译资源,例如翻译记忆库、术语库以及机器翻译。
为了改善这种情况,人工智能科技公司可以采取哪些措施呢?
研究工作正在深入进行,以探索如何降低处理新数据所需的计算能力。不过,已经很清楚的一点是,对现有的大型语言模型进行微调和专业训练,相较于创建一个新的大型语言模型更为经济高效。
还有一种相反的观点,批评者认为 ESG 被过度强调。这反过来又导致了企业内部对 ESG 的过度追捧,将其视为一种美德的象征,有时甚至会牺牲业务重点和技术进步为代价。
我们必须在价值和准确性之间找到一个恰当的平衡。如果将模型的准确性提高 1-2% 的代价是数以公吨计的温室气体排放,那么我们就必须质疑这样做是否合理。在某些特定领域和内容流中,努力提高 1-2% 的准确度至关重要。但在其他情境下,这种优势可能只是表面上的,并未带来实质性的益处。
那么本地化专业人士呢?他们可以做些什么?
首先是挑选合适的提供商。尽管许多数据中心都在努力降低碳排放,但我们仍然有责任确保他们能够承担起应尽的责任。Trados Enterprise 依赖于 AWS 进行托管。AWS 正在积极努力实现在 2030 年前使用 100% 可再生能源的目标,根据目前的进展情况,有望在 2025 年之前实现这一目标。该公司还计划在 2040 年之前实现净零碳排放。
与负责任的供应商合作,可以帮助您实现自己的碳减排目标,因此将这一要素纳入您的选择标准至关重要。如果您无法迁移到公共云,那么请考虑使用负责任的数据中心,而不是自行管理的服务器。
人工智能正在重塑我们生活的世界,我并不会阻止任何人踏上这场旅程。然而,我们所能做的就是确保我们以负责任的方式使用人工智能,同时牢记我们的选择给环境所带来的影响。
充分利用人工智能的创新,但要确保它能够提供真正的价值。市场上的人工智能功能正在趋于饱和,所有这些都声称自己是最佳选择。然而,当我们见证人工智能的快速发展和强劲势头时,一个不幸且不可避免的副作用也随之而来。评估新功能时,问问自己:
- 这能帮我节省成本吗?
- 这会促进质量改进吗?
- 这会带来效率提升吗?
如果所有这些问题的答案都是“否”,那么我建议几乎可以肯定地放弃该功能,就像盖伊·福克斯密谋在 11 月 5 日实施的火药计划一样,让一切付之一炬。