As cargas de trabalho enormes e complexas da IA exigem a adição de muito mais unidades de processamento gráfico (GPUs), unidades de processamento de tensores (TPUs) ou aceleradores ao mix, o que é um aspecto importante do redesenho contínuo do data center.
Devido à energia que essas unidades exigem e ao calor que produzem, os projetistas tiveram que reconsiderar o que constitui um projeto de layout viável e ideal. E o custo do redesenho do data center está aumentando.
Como resultado, a Tirias Research estima que os proprietários gastarão 76 mil milhões de dólares por ano em novas infraestruturas de data center de IA até 2028.
Desafio atual do redesenho do data center: os clusters densos baseados em GPU de hoje
Anton Shilov, da Tom’s Hardware, calculou recentemente a demanda significativa de carga de trabalho de IA para GPUs:
“De acordo com a empresa de pesquisa de mercado Omdia, a Nvidia vendeu 900 toneladas de processadores H100 no segundo trimestre de 2023.”
“No segundo trimestre, a Omdia estima que a Nvidia vendeu mais de 900 toneladas (1,8 milhão de libras) de GPUs de computação H100 para aplicações de inteligência artificial (IA) e computação de alto desempenho (HPC).” De acordo com Omdia, o peso médio de uma GPU de computação Nvidia H100 com dissipador de calor é superior a 3 kg (6,6 libras), o que implica que a Nvidia vendeu mais de 300.000 H100s no segundo trimestre.
Como resultado, uma única unidade de processamento gráfico (GPU) Nvidia H100 pesa quase o mesmo que uma bola de boliche leve. O peso calculado pela Omdia acima não inclui o cabeamento associado ou refrigeração líquida.
De acordo com Steven Carlini, vice-presidente de inovação em data centers do fornecedor de equipamentos de gerenciamento de energia Schneider Electric, os racks de IA tiveram que ser reprojetados para acomodar o peso e o calor extras. Ele comparou os densos clusters de servidores de IA de hoje com as fileiras “bem espalhadas” de racks de servidores comuns que eram comuns antes do aumento da IA da geração atual, transformando as belas fileiras em clusters densos e de alta execução.
De acordo com Carlini, esses clusters de IA consomem até 100 quilowatts por rack, em comparação com até 20 kW por rack para um rack de data center convencional sem IA. Cada Nvidia H100 consome 700 watts de potência, de acordo com Victor Avelar, colega de Carlini, analista de pesquisa sênior do Centro de Pesquisa de Gerenciamento de Energia da Schneider Electric, acima dos 400 watts do antigo A100, que ainda é muito procurado. O resfriamento líquido é necessário para ambos os tipos de GPU.
A maior parte do calor é gerada pela densa área de silício de transistor de 80 bilhões em cada GPU. Oito dessas GPUs estão incluídas em um servidor de IA do tipo que empresas como Amazon e Google estão instalando. Clusters de servidores de IA projetados adequadamente estão sempre totalmente operacionais, em contraste com aplicativos sem IA que têm uma utilização de servidor muito menor.
A Golden está entre as 15 empresas brasileiras nível Google Workspace premier e apoia a implantação de Google Workspace e Appsheet em todos os níveis de complexidade de implementação! Se tiver dúvidas, só clicar no botão abaixo:
Uma perspectiva de longo prazo sobre o gerenciamento de energia de data centers
Os proprietários dos principais data centers de hoje há muito se preocupam em minimizar o impacto ambiental e tendem a ter uma visão de longo prazo quando se trata de gestão de energia. Sim, o consumo de energia é maior do que nunca, mas uma grande parte da capacidade dos centros de dados de topo é agora alimentada por energia renovável e os proprietários estão à procura de outras opções com emissões zero. A Microsoft, por exemplo, concordou em maio em comprar um mínimo de 50 megawatts de energia da startup de energia de fusão Helion a partir de 2028.
O esforço da empresa para quantificar a pegada de carbono dos data centers atuais ao longo do seu ciclo de vida e ajudar a otimizar o layout e design dos data centers futuros é liderado por Victor Avelar da Schneider. Avelar demonstrou sua calculadora gratuita de CO2e do ciclo de vida do data center, que examina tanto o carbono incorporado (como o carbono emitido durante o fornecimento, fabricação e vazamento do concreto usado na construção do data center) quanto o carbono gerado durante as operações do data center.
A Calculadora de Custos auxilia os planejadores na consideração de alternativas e na seleção dos melhores critérios de projeto. Examinamos as fontes de energia, por exemplo. Avelar comparou uma localização na Virgínia Ocidental (dominada por usinas termelétricas a carvão) com uma na França (dominada pela energia nuclear).
Quando analisamos o total anual de CO2e por escopo, percebemos que as emissões do Escopo 2 (energia adquirida de concessionárias locais) para a opção West Virginia eram uma porcentagem muito maior do total. Em contrapartida, a opção francesa tinha uma percentagem mais elevada de Escopo 3 (energia indireta, como carbono incorporado no concreto do novo data center). As emissões de escopo 1 e 2 são mais gerenciáveis pelos planejadores.
Mudanças de propriedade em data centers
Historicamente, os data centers seguiram um modelo semelhante ao de um shopping center, com locatários âncoras e boutiques, com proprietários focados exclusivamente no negócio de construção para atender à demanda local e no gerenciamento de locações de espaço, de acordo com Carlini.
No entanto, em termos da percentagem de novos centros de dados construídos, os grandes fornecedores de nuvem, meios de comunicação e SaaS tornaram-se recentemente ainda mais dominantes. Não existe um design padrão de data center para esses proprietários/operadores. “Cada data center da Microsoft é diferente”, disse Carlini. “É incrível.” O principal desafio no ambiente atual é simplesmente acompanhar todas as mudanças.