17 января 2025 г.
В серии из двух частей MIT News исследует экологические последствия генеративного ИИ. В этой статье мы рассмотрим почему эта технология требует таких больших ресурсов. Во второй части мы рассмотрим что делают эксперты для уменьшения углеродного следа и других воздействий генеративного ИИ.
Трудно игнорировать ажиотаж вокруг потенциальных преимуществ генеративного ИИ, от повышения производительности труда до продвижения научных исследований. Хотя взрывной рост этой новой технологии позволил быстро внедрить мощные модели во многих отраслях, экологические последствия этой «золотой лихорадки» генеративного ИИ по-прежнему трудно определить, не говоря уже о том, чтобы их смягчить.
Вычислительная мощность, необходимая для обучения генеративных моделей ИИ, которые часто имеют миллиарды параметров, таких как GPT-4 от OpenAI, может потребовать огромного количества электроэнергии, что приводит к увеличению выбросов углекислого газа и нагрузке на электрическую сеть.
Кроме того, внедрение этих моделей в реальные приложения, позволяющее миллионам людей использовать генеративный ИИ в повседневной жизни, а затем точная настройка моделей для улучшения их производительности требует большого количества энергии в течение длительного времени после разработки модели.
Помимо потребности в электроэнергии, для охлаждения оборудования, используемого для обучения, развертывания и настройки генеративных моделей ИИ, требуется большое количество воды, что может создавать нагрузку на муниципальные системы водоснабжения и нарушать местные экосистемы. Растущее число генеративных приложений ИИ также стимулирует спрос на высокопроизводительное вычислительное оборудование, что приводит к косвенному воздействию на окружающую среду в результате его производства и транспортировки.
«Когда мы думаем о воздействии генеративного ИИ на окружающую среду, речь идет не только об электроэнергии, которую вы потребляете, подключая компьютер к розетке. Существуют гораздо более широкие последствия, которые выходят на системный уровень и сохраняются в зависимости от наших действий», — говорит Эльза А. Оливетти, профессор кафедры материаловедения и инженерии и руководитель миссии по декарбонизации в рамках нового климатического проекта Массачусетского технологического института.
Оливетти является старшим автором статьи 2024 года «Влияние генеративного ИИ на климат и устойчивое развитие», написанной в соавторстве с коллегами из MIT в ответ на призыв института к представлению статей, исследующих трансформационный потенциал генеративного ИИ, как в положительном, так и в отрицательном направлении для общества.
Потребность центров обработки данных в электроэнергии является одним из основных факторов, влияющих на воздействие генеративного ИИ на окружающую среду, поскольку центры обработки данных используются для обучения и запуска моделей глубокого обучения, лежащих в основе таких популярных инструментов, как ChatGPT и DALL-E.
Центры обработки данных — это здания с контролируемой температурой, в которых размещается вычислительная инфраструктура, такая как серверы, накопители данных и сетевое оборудование. Например, Amazon имеет более 100 центров обработки данных по всему миру, каждый из которых насчитывает около 50 000 серверов, которые компания использует для поддержки облачных вычислительных сервисов.
Хотя центры обработки данных существуют с 1940-х годов (первый был построен в Университете Пенсильвании в 1945 году для поддержки первого универсального цифрового компьютера ENIAC), появление генеративного ИИ резко ускорило темпы строительства центров обработки данных.
«Отличительной особенностью генеративного ИИ является требуемая им плотность мощности. По сути, это просто вычисления, но кластер для обучения генеративного ИИ может потреблять в семь-восемь раз больше энергии, чем типичная вычислительная нагрузка», — говорит Номан Башир, ведущий автор статьи о воздействии, научный сотрудник по вопросам вычислений и воздействия на климат в Консорциуме по климату и устойчивому развитию Массачусетского технологического института (MCSC) и постдокторант в Лаборатории компьютерных наук и искусственного интеллекта (CSAIL).
Ученые подсчитали, что потребность в электроэнергии центров обработки данных в Северной Америке увеличилась с 2688 мегаватт в конце 2022 года до 5341 мегаватт в конце 2023 года, что отчасти обусловлено потребностями генеративного искусственного интеллекта. В глобальном масштабе потребление электроэнергии центрами обработки данных в 2022 году выросло до 460 тераватт-часов. По данным Организации экономического сотрудничества и развития, это сделало бы центры обработки данных 11-м по величине потребителем электроэнергии в мире, между Саудовской Аравией (371 тераватт-час) и Францией (463 тераватт-часа).
Ожидается, что к 2026 году потребление электроэнергии центрами обработки данных приблизится к 1050 тераватт-часам (что выведет центры обработки данных на пятое место в мировом рейтинге, между Японией и Россией).
Хотя не все вычисления в центрах обработки данных связаны с генеративным ИИ, эта технология является одним из основных факторов роста спроса на энергию.
«Спрос на новые центры обработки данных не может быть удовлетворен устойчивым образом. Темпы, с которыми компании строят новые центры обработки данных, означают, что большая часть электроэнергии для их питания должна поступать от электростанций, работающих на ископаемом топливе», — говорит Башир.
Мощность, необходимая для обучения и развертывания такой модели, как GPT-3 от OpenAI, трудно определить. В исследовательской работе 2021 года ученые из Google и Калифорнийского университета в Беркли подсчитали, что только на процесс обучения было затрачено 1287 мегаватт-часов электроэнергии (этого достаточно, чтобы обеспечить электроэнергией около 120 средних домов в США в течение года), что привело к выбросу около 552 тонн углекислого газа.
Хотя все модели машинного обучения должны проходить обучение, одной из проблем, характерных для генеративного ИИ, являются быстрые колебания энергопотребления, которые происходят на разных этапах процесса обучения, объясняет Башир.
Операторы энергосистем должны иметь возможность компенсировать эти колебания для защиты энергосистемы, и обычно для этой задачи они используют дизельные генераторы.
После обучения генеративной модели ИИ потребность в энергии не исчезает.
Каждый раз, когда модель используется, например, когда человек просит ChatGPT подготовить резюме электронного письма, вычислительное оборудование, выполняющее эти операции, потребляет энергию. Исследователи подсчитали, что запрос ChatGPT потребляет примерно в пять раз больше электроэнергии, чем простой поиск в Интернете.
«Но обычный пользователь не задумывается об этом», — говорит Башир. «Простота использования генеративных интерфейсов ИИ и отсутствие информации о воздействии моих действий на окружающую среду означают, что у меня, как у пользователя, нет особых стимулов сокращать использование генеративного ИИ».
В традиционном ИИ энергопотребление распределяется довольно равномерно между обработкой данных, обучением моделей и инференцией, то есть процессом использования обученной модели для прогнозирования новых данных. Однако Башир ожидает, что потребность в электроэнергии для инференции генеративного ИИ в конечном итоге станет доминирующей, поскольку эти модели становятся повсеместными во многих приложениях, а потребность в электроэнергии для инференции будет расти по мере того, как будущие версии моделей станут более крупными и сложными.
Кроме того, генеративные модели ИИ имеют особенно короткий срок годности, что обусловлено растущим спросом на новые приложения ИИ. Компании выпускают новые модели каждые несколько недель, поэтому энергия, затраченная на обучение предыдущих версий, идет впустую, добавляет Башир. Новые модели часто потребляют больше энергии для обучения, поскольку обычно имеют больше параметров, чем их предшественники.
Хотя в научной литературе наибольшее внимание уделяется потребности центров обработки данных в электроэнергии, количество воды, потребляемое этими объектами, также оказывает воздействие на окружающую среду.
Охлажденная вода используется для охлаждения центра обработки данных путем поглощения тепла от вычислительного оборудования. По оценкам, на каждый киловатт-час энергии, потребляемый центром обработки данных, требуется два литра воды для охлаждения, говорит Башир.
«То, что это называется «облачным вычислением», не означает, что оборудование находится в облаке. Центры обработки данных существуют в нашем физическом мире, и из-за потребления воды они оказывают прямое и косвенное влияние на биоразнообразие», — говорит он.
Вычислительное оборудование внутри центров обработки данных оказывает свое собственное, менее прямое воздействие на окружающую среду.
Хотя трудно оценить, сколько энергии требуется для производства графического процессора (GPU) — типа мощного процессора, способного обрабатывать интенсивные рабочие нагрузки генеративного искусственного интеллекта, — это будет больше, чем требуется для производства более простого центрального процессора (CPU), поскольку процесс изготовления более сложен. Углеродный след GPU усугубляется выбросами, связанными с транспортировкой материалов и продукции.
Существуют также экологические последствия добычи сырья, используемого для производства GPU, которые могут включать в себя загрязняющие окружающую среду процедуры добычи и использование токсичных химикатов для обработки.
Исследовательская компания TechInsights оценивает, что три крупнейших производителя (NVIDIA, AMD и Intel) поставили 3,85 миллиона GPU в центры обработки данных в 2023 году, по сравнению с примерно 2,67 миллионами в 2022 году. Ожидается, что в 2024 году это число увеличится еще больше.
По словам Башира, отрасль находится на неустойчивом пути, но есть способы стимулировать ответственное развитие генеративного ИИ, которое поддерживает экологические цели.
Он, Оливетти и их коллеги из MIT утверждают, что для этого потребуется всестороннее рассмотрение всех экологических и социальных издержек генеративного ИИ, а также подробная оценка ценности его предполагаемых преимуществ.
«Нам нужен более контекстуальный подход к систематическому и всестороннему пониманию последствий новых разработок в этой области. Из-за скорости, с которой происходят улучшения, у нас не было возможности догнать наши способности измерять и понимать компромиссы», — говорит Оливетти.
Источники и авторство:
Оригинал статьи: Explained: Generative AI’s environmental impact
Издание: MIT News
Автор: Adam Zewe
Дата выхода: 17 января 2025 г.
Перевод и адаптация: zxlecya
Источник


