1. 上一篇 下一篇
  2. 第3782期   20220726
  3. 放大 缩小 默认 朗读

微软联合研发能源测量工具助力减少对气候变化的冲击

  机器学习备受瞩目的成功背后,是深度学习,如高级图像识别技术、棋盘游戏冠军AlphaGo,以及GPT-3等语言模型。但这种不可思议的性能表现是有代价的:训练深度学习模型需要大量的能量。
  如今,新的研究表明,科学家们使用云平台来训练深度学习算法可以显著地减少它们消耗的能量,从而减少这项工作产生的碳排放。其中,对云平台的简单修改是其中的关键。
  自从三年前第一篇研究这项技术对环境影响的论文发表以来,在研究人员中兴起了一场自主报告他们工作中产生的能源消耗和碳排放的运动。记录准确的数字是做出改变的重要一步,但实际上单单是收集这些数据可能都是一个挑战。
  “你无法改善你不能衡量的东西,”位于美国西雅图的艾伦人工智能研究所的研究员杰西·道奇(Jesse Dodge)说,“如果我们想在减少碳排放方面取得进展,第一步是我们必须(对这些排放)有一个好的衡量方式。”
  为此,艾伦研究所最近与微软、人工智能公司Hugging Face、以及三所大学合作创建了一个工具,能够测量在微软云服务Azure上运行的任何机器学习程序的用电情况。
  有了它,构建新模型的Azure用户可以查看图形处理单元(GPU,专门用于并行计算的电脑芯片)所消耗的总电量,包括从选择模型到训练模型并投入使用整个过程。据悉,Azure是第一个为用户提供机器学习程序对能源影响的有关信息的主要云服务提供商。
  虽然已经有一些工具,可以测量在本地服务器上运行的机器学习算法的能源消耗和碳排放,但当研究人员使用微软、亚马逊和谷歌等公司提供的云服务时,这些工具就不起作用了。
  这些服务并不能让用户直接看到他们的活动所消耗的GPU、CPU和内存资源——而现有的工具,如碳跟踪器(Carbontracker)、实验跟踪器(ExperimentTracker)、能量可视化(EnergyVis)和编码碳(CodeCarbon),需要这些数据才能给出能源消耗的准确估计。
  2021年10月,这款新的Azure工具被首次推出,目前其报告的是能源使用情况,而不是碳排放情况。因此,道奇和其他研究人员想出了如何将能源使用映射为碳排放的方法,并在6月底的大型计算机科学会议FAccT上发表了一篇关于这项工作的论文。
  研究人员使用了一种名为“瓦特时间”(Watttime)的服务,基于邮政编码来评估运行11个机器学习模型的云服务器的碳排放量。
  他们发现,如果在特定的地理位置、和一天中的特定时间使用服务器,碳排放量可以显著减少。
  如果开始模型训练时,电网上有较多的可再生电力,那么训练小型机器学习模型造成的碳排放,最高可以减少80%;而如果在可再生电力短缺时暂停训练,在可再生电力丰富时重新启动,那么训练大型模型的碳排放,可以减少20%以上。
  有能源意识的云用户,可以在国际三大云服务(微软Azure、谷歌云和亚马逊网络服务)平台上,通过偏好设置来调整这些因素,从而降低碳排放。
  但是林恩·卡克(Lynn Kaack)说,云服务提供商应该自动暂停并重启这些机器学习程序项目,以降低碳排放。卡克是气候变化人工智能组织的联合创始人,该组织主要研究机器学习对气候变化的影响。
  卡克说:“你可以安排什么时候运行算法,但这需要很多人工操作。”“你可能需要政策激励,才能真正大规模地做到这一点。”她说,碳定价等政策可以激励云服务提供商建立工作流程,以实现程序的自动暂停和重启,并允许用户进行选择。
  为了使机器学习更加环保,还需要做很多工作,特别是在大多数国家仍然依赖化石燃料的情况下。
  道奇也表示,Azure的工具只测量GPU消耗的电量。一个对机器学习能量消耗的更准确的计算方式,应当包括CPU和内存的资源消耗——更不用说构建和冷却物理服务器的能量了。
  而改变习惯可能需要时间。道奇说,自(去年)10月份能源测量工具问世以来,运行机器学习程序的Azure用户中只有13%使用过它。帮助创建碳追踪器的拉格文德拉·塞尔万(Raghavendra Selvan)说,即使是他也很难说服研究人员在他们的机器学习研究中使用该工具。
  “我认为我还不曾说服我自己的团队。”塞尔万说。
  但他很乐观。越来越多的研究人员开始养成在论文中报告能量使用的习惯,这也是受到像NeurIPS这样的大型会议的鼓励。塞尔万表示,如果有更多的人在规划未来的项目时,能将这些能源和排放成本纳入考量,就能开始减少机器学习对气候变化的冲击。 (王贝贝)