可持续的人工智能实践能否解决其能耗问题?
![](https://res.cloudinary.com/uf-554930/image/upload/v1731916637/1_fzssue.jpg)
- 生成式人工智能蓬勃发展,但需要大量电力,有可能对可再生能源转型造成威胁,使其偏离发展轨道。
- 既要为净零的未来做准备,又要解决数据中心的电力需求频繁激增的问题,这让美国、英国等地的能源电网陷入困境。
- 配电网络的升级正在进行,但可能需要几十年的时间才能完成。生成式人工智能公司和超大规模的企业需加紧行动——因为技术带来的问题需要技术驱动的方案来解决。
向数字化的转变有望带来更清洁、更绿色的经济,但这种转变现在造成了能源网的紧张和数据中心的崩溃。如果不加以干预的话,人工智能和可再生能源的革新看来会产生冲突。生成式人工智能(GenAI)难以置信的强大功能给全世界惊喜,但其难以置信的能耗也让全世界措手不及。世界经济论坛的研究显示,运行人工智能任务所需的能源已不断增长,年增长率超过26%。到2028年,其消耗的电力可能比冰岛更多。
风能、太阳能和水能的电力能足够满足供应需求吗?如果不够,电力公司是否得将化石燃料作为首选?专家表示,环保型人工智能(EcoAI)是有可能的,但机器学习模型的训练方式和人工智能应用程序的编码方式需要改变才行。能源行业还需要对基础设施进行大量投资,才能做到在需要的时候和地方提供清洁的电力。
为什么生成式人工智能会消耗这么多能源?
![](https://res.cloudinary.com/uf-554930/image/upload/v1731916757/2_rbjphu.jpg)
大型语言模型(LLM)就像驱动生成式人工智能的引擎,需要源源不断地消耗能源。一项2023年底开始的同行评审研究预测,到2027年,ChatGPT等应用程序的能耗将达到85至134太瓦时(TWh)。这大致相当于荷兰和瑞典一年的用量。
斯坦福大学专门研究可持续发展的人工智能研究员Shahab Mousavi表示,最近出现的三个转变使云计算的能源需求更加密集了。“简单来说,英伟达等公司稳步改进了为高性能计算和并行处理定制的图形处理单元(GPU),为数据中心难以置信的高处理能力奠定了基础,从而能支持当今的人工智能系统。”
“从某种意义上说他们很幸运,多次抓住了对GPU需求的机遇。”Mousavi继续说。“首先是GPU应用于游戏和图形;然后是比特币出现,加密货币挖矿推动了巨大的需求增长。现在除前两种需求外,又有了人工智能,尤其是生成式人工智能产品,产生了新一波需求。这些产品执行大量相对简单的计算来训练模型,需要进行大量数据处理,而这些计算任务是可并行化的,完美地适合GPU加速处理与更传统的中央处理器(CPU)相关的过程。
超大规模的数据中心首当其冲感受到这种痛感。由于机架和机柜分布的区域面积有数十万平方米,随着人工智能服务器要处理大量提示,能耗变得越来越高。GPU会发热,需要更多的电力来进行推理运算并保持凉爽温度,这经常给当地电网的容量造成考验。
2024年3月,英国国家电网首席执行官John Pettigrew对能源行业高管演讲时表示,未来十年数据中心的电力需求将如雨后春笋般激增500%。他警告,配电网络已经过时,对电力系统造成了限制,并补充道,“随着人工智能和量子计算等基础技术未来的增长,将需要更大规模的、能源密集型的计算基础设施。目前全球已有超10,500个数据中心在运营,另有数百个正在建设,所以这个问题不可忽视。”
清洁能源面临难题
![](https://res.cloudinary.com/uf-554930/image/upload/v1731916839/3_cyyuln.jpg)
为什么人工智能不能转型为更多地使用风能、太阳能和水电呢?在过去一年里,英国生产的清洁能源已足够为每家每户供电。然而当尝试在公用事业需求中使用绿色电力,就会出现问题。在美国加利福尼亚州和德克萨斯州等地,可再生能源的发电能力快速增长,Mousavi说:“电网没有经过优化,不能将可再生能源输送到有需要的地方。在没有足够的输电能力配合可再生发电时,尤其在发电高峰时段,例如太阳能发电的中午时段,没办法,只能缩减产量——干脆将可再生能源发电设施与电网断开。”
他以加州中央山谷中太阳能发电厂的大量投资为例,“当初设计电网时没有预料到后来中央山谷,比如戴维斯和默塞德郊区的太阳能发电能力激增,没有设计为可从这里输出旧金山湾区需要的大部分电力,所以电网还需要升级才行。”他说。“所以,虽然湾区的能耗需求很大,但没有合适的电网基础设施来输送那里需要的全部可再生能源。所以在需求高峰期,他们不得不拔掉已安装好的、已可用的可再生能源,如太阳能,来维持电网的稳定,而且在需求高峰期时,不得不启用在能耗区域当地的传统发电厂,通常叫做‘调峰发电厂'。”
对基础设施进行投资会有所帮助,但建设电力系统需要数年甚至数十年的时间才能展开。现在我们能做些什么来应对突然激增的人工智能对电力的需求?一种选择是对计算设施实行定量供电,据报道在爱尔兰的 Amazon Web Services 已经被迫这样做了,或者是激励计算设施往可再生能源丰富的地区搬迁和扩展,从而减轻电网因需要匹配能源需求和可再生能源供应所受到的额外压力。另一选项则是继续燃烧化石燃料。尽管石油和天然气发电厂存在多种问题,但它们数量众多、可靠且均匀分布在主要的人口分布中心附近。
然而,这些资源用得越多,就使得新的可再生能源项目的启动越不紧迫。美国有许多清洁能源项目排着长队等待监管部门批准。但是,随着人工智能的应用从企业扩展到家庭和个人设备,新的对可再生能源发电的任何“额外需求”都有可能被推迟。
为了克服缺乏清洁能源的问题,数据中心采用了购电协议(PPA)和可再生能源证书(REC)等变通办法来抵消或注销其碳足迹。“PPA和REC成为两个促进发电量增长的驱动力,为可再生能源行业带来了福音,但肯定也不是包治百病的灵丹妙药。”Mousavi说。“它们没有通过向最终的电力消费者适当分配排放责任来改善输电或启用功能性问责机制,而且通过REC等机制来交易排放属性,就使得任何人都几乎不可能知道他们的实际排放影响。”
“有一篇论文《范围2有什么用处?》提到,如果没有范围3类别3 [S3C3],你永远不会知道确切的排放影响,而基于市场的范围2 [MBS2] 排放也不会让你知道。“他继续说。“我们必须考虑改善可再生能源生产和需求之间的平衡。多年来,清洁发电迅速增加了,但基础设施没有相应地改善来把增加的发电能力输送到有需求的地方。
改变模型
![](https://res.cloudinary.com/uf-554930/image/upload/v1731916903/4_v0nmn4.jpg)
一方面由政策制定者来制定改善配电的计划,另一方面生成式人工智能公司也可以做一些事情来减少语言学习模型的碳足迹。
微软的机器学习科学家Reshmi Ghosh表示,大语言模型可能会让位于旨在解决特定用例的较小的模型。它们的计算密集度较低,因此需要的功率也较少。“这些大型的、通用的模型在某些领域表现不佳。”她指出,生成式人工智能模型经常产生偏差,输出结果有缺陷。“我参与了一项研究,研究如何避免投资于过于庞大、但只用来从事某些专门任务的海量数据集。”
她提及微软在小型语言模型(SLM)方面的工作及其开放的人工智能就绪的数据集Phi-3 suite,其使用的参数为30-50亿个,明显比ChatGPT等大语言模型更精简小巧,ChatGPT据称使用参数为1750亿个或更多。小型语言模型需要的训练较少(例如,通过不断循环使用某些特定的操作来改进和完善),这将带来更可持续的人工智能开发实践。Ghosh表示,微软热衷于在此领域进一步探索。
“我们发现,无论模型的规模大小如何,都不需要不断重新学习数据模型中的所有内容,因为只有某些部分包含特定任务或领域所需的信息。”她说。“我们只要可以提高使用参数的效率,就可以提高人工智能的效率。”
环保的人工智能
![](https://res.cloudinary.com/uf-554930/image/upload/v1731916991/5_naxhl8.jpg)
甚至在ChatGPT问世之前,由于万物都在不断电气化,能源消耗也在稳步上升。面对当前的能源需求激增,我们需要取得适当平衡,既要向净零排放转型,又要不妨碍发挥人工智能潜力。Ghosh和Mousavi表示,要想提升能源基础设施和生成式人工智能应用程序的效率和可持续性,新的投资和方法至关重要。在开发阶段采取环保的做法也可减少其碳足迹。
“节能的编码方式、优化的代码控制、在人工智能模型整个生命周期中持续监控和优化,都应该成为标准的实践做法。”Autodesk数据科学家Pranjali Ajay Parse说。“还可以采用优化的训练时间表,在非高峰时段进行训练,利用当时成本较低的能源。”
另一种方法是分布式训练,“把工作负载分布在多台机器上,”她继续说。“这样还可以提高效率,减少瓶颈。”
机器学习本身可以用来解决这一问题。据Parse说,早在2016年,谷歌就采用DeepMind来分析并提高其数据中心的能源效率,从而将冷却能源使用量减少了40%。“微软的Project Natick把数据中心布置在水下,这样来节省冷却成本,也是个很有发展前途的方法。”她说。
生成式人工智能向社会提出了许多重大问题——有些是道德问题,有些是法律问题,有些是经济问题,有些是哲学问题。专家表示,现在是时候将可持续性考虑在内了。大语言模型有利有弊,有何利弊、孰大孰小?众人辩论不休,但如果我们失去健康的地球环境,它们就会失去存在的意义。