Quanta Energia a IA Consome? (Os Números Reais, Explicados)
Uma consulta típica ao ChatGPT consome cerca de 0,3 watt-hora de eletricidade — aproximadamente o que um forno consome em um segundo — segundo estimativas da OpenAI e de fontes independentes. No nível da rede elétrica, data centers dos EUA usaram cerca de 176 TWh em 2023, cerca de 4,4% da eletricidade nacional, e essa fatia está crescendo rapidamente.
Você provavelmente já ouviu que cada pergunta ao ChatGPT “gasta dez vezes mais energia que uma busca no Google”, ou que a IA vai engolir a rede elétrica. O quadro real é mais sutil: o custo por consulta é pequeno e está caindo, enquanto a demanda total dos data centers é grande e está crescendo. As duas coisas são verdadeiras ao mesmo tempo, e os números só fazem sentido com as fontes certas. Aqui estão eles — e, se você tem curiosidade sobre a outra metade do impacto da IA, fizemos o mesmo exercício para o uso de água.
Por que a IA consome energia?
A conta de eletricidade da IA vem de duas atividades distintas, e confundi-las é o que gera a maior parte da confusão.
- Treinamento é o processo único de construir um modelo. Milhares de chips especializados funcionam no máximo por semanas ou meses, por isso os custos de treinamento são citados em megawatt-hora ou gigawatt-hora.
- Inferência é o uso cotidiano — cada resposta no chat, imagem ou resumo. Cada solicitação é barata, mas modelos populares atendem bilhões delas, então a inferência hoje domina o total acumulado dos sistemas em produção.
- Overhead fica acima dos dois: resfriamento, rede e conversão de energia no data center, normalmente capturados em uma métrica chamada PUE (eficiência do uso de energia).
Quando você vê números muito diferentes para o “consumo de energia da IA”, verifique o que cada dado cobre. Uma estimativa por consulta que ignora o resfriamento, ou um total de treinamento apresentado como se ocorresse diariamente, vão te enganar em direções opostas.
Quanta energia uma consulta ao ChatGPT consome?
O número principal vem da própria OpenAI. Em junho de 2025, Sam Altman escreveu que a consulta média ao ChatGPT consome cerca de 0,34 watt-hora — “aproximadamente o que um forno consome em pouco mais de um segundo, ou uma lâmpada de alta eficiência em alguns minutos” (Data Center Dynamics, 2025).
Esse número não foi revisado por pares, e a OpenAI não publicou a metodologia. Mas ele bate com trabalhos independentes. O grupo de pesquisa Epoch AI estimou uma consulta típica ao GPT-4o em cerca de 0,3 Wh, com base em suposições realistas sobre o tamanho da resposta, chips H100 modernos e consumo real (não de pico) (Epoch AI, 2025). O Google foi além e publicou um artigo técnico: o prompt de texto mediano do Gemini usou 0,24 Wh em meados de 2025 (Google Cloud, 2025).
Duas ressalvas mantêm a honestidade:
- A antiga estimativa de “3 Wh” não era absurda — só estava desatualizada. Um cálculo muito citado de 2023 assumia respostas longas em chips A100 antigos rodando em potência máxima. A revisão da Epoch mostrou que cada suposição inflava o número, para um exagero combinado de cerca de 10x (Epoch AI, 2025; TechCrunch, 2025).
- Nem toda consulta é típica. A Epoch observa que um documento de 10.000 tokens eleva a consulta para ~2,5 Wh, uma entrada de 100.000 tokens para ~40 Wh, e modelos de raciocínio que “pensam” antes de responder geram várias vezes mais tokens por solicitação. Geração de imagem e vídeo consome ainda mais — um estudo da Hugging Face apontou a geração de imagens como a tarefa de IA comum mais intensiva em energia (MIT Technology Review, 2023).
Portanto, a resposta defensável: alguns décimos de watt-hora para uma consulta de texto normal, com tarefas pesadas chegando a 10–100x isso.
Os números em uma tabela
Aqui estão os números mais citados, com fontes e anos, para você conferir.
| O quê | Consumo estimado de energia | Fonte (ano) |
|---|---|---|
| Uma consulta “média” ao ChatGPT (OpenAI) | ~0,34 Wh | Sam Altman via DCD (2025) |
| Consulta típica ao GPT-4o (estimativa independente) | ~0,3 Wh | Epoch AI (2025) |
| Prompt de texto mediano do Gemini | ~0,24 Wh | Google (2025) |
| Estimativa antiga por consulta (já revisada) | ~3 Wh | Epoch AI / TechCrunch (2025) |
| Uma busca no Google (dado oficial antigo) | ~0,3 Wh | Google (2009) |
| Streaming de 1 hora de vídeo | ~77 Wh (0,077 kWh) | IEA (2020) |
| Treinamento do GPT-3 (único) | ~1.287 MWh | Patterson et al. (2021) |
| Treinamento de um modelo do porte do GPT-4 (único) | ~20–25 MW por ~3 meses (≈40–50 GWh) | Epoch AI (2025) |
| Data centers dos EUA, total (2023) | ~176 TWh (4,4% da eletricidade dos EUA) | LBNL / DOE (2024) |
| Data centers dos EUA, projeção (2028) | 325–580 TWh (6,7–12%) | LBNL / DOE (2024) |
| Data centers globais, total (2024) | ~415 TWh (~1,5% da eletricidade mundial) | IEA (2025) |
| Data centers globais, projeção (2030) | ~945 TWh | IEA (2025) |
Atenção aos limites: os valores por consulta cobrem apenas chat de texto, e os totais de data center incluem tudo o que esses prédios fazem — streaming, bancos, e-mails — não só IA.
Treinamento vs. inferência: qual consome mais?
O treinamento chama atenção porque o número único é grande. Pesquisadores estimam o treinamento do GPT-3 em cerca de 1.287 MWh — aproximadamente o consumo anual de eletricidade de 120 lares americanos (Patterson et al., 2021). Para um modelo de ponta do porte do GPT-4, a Epoch AI estima que o treinamento consumiu cerca de 20–25 megawatts continuamente por cerca de três meses — algo em torno de 40–50 GWh, ou a energia de cerca de 20.000 lares americanos nesse período (Epoch AI, 2025).
Mas o treinamento acontece uma vez só. A inferência acontece bilhões de vezes por dia. Na escala do ChatGPT, mesmo 0,34 Wh por consulta soma centenas de megawatt-hora diariamente, então a energia total de um modelo popular é dominada pelo uso, não pela construção. Por isso o número por consulta — pequeno como é — importa mais para o total de longo prazo do que qualquer manchete sobre treinamento.
Quanta eletricidade os data centers consomem no total?
Aqui os números ficam grandes — e aqui está a preocupação legítima.
Um relatório do Lawrence Berkeley National Laboratory, encomendado pelo Departamento de Energia dos EUA, mostrou que data centers americanos consumiram cerca de 176 TWh em 2023 — 4,4% da eletricidade nacional — e projeta 325–580 TWh até 2028, ou 6,7–12% da eletricidade dos EUA (LBNL / DOE, 2024). O crescimento acelerou de ~7% ao ano (2014–2018) para 18% ao ano (2018–2023), em grande parte por causa dos servidores de IA.
Globalmente, o relatório Energy and AI da Agência Internacional de Energia estima os data centers em cerca de 415 TWh em 2024 (~1,5% da eletricidade mundial), mais que dobrando para cerca de 945 TWh até 2030 — um pouco mais que todo o consumo do Japão hoje — com a IA como principal motor e EUA e China respondendo por quase 80% do crescimento (IEA, 2025).
Uma ressalva vale para os dois lados: são projeções, não medições, e data centers também rodam muito trabalho não relacionado à IA. Acompanhe os números atualizados em nossa página de estatísticas de IA.
Como o consumo de energia da IA se compara ao do dia a dia?
Contexto transforma watt-hora em intuição. Uma consulta típica de texto (~0,3 Wh) equivale a:
- Cerca de 1 segundo do seu forno ligado, segundo a própria OpenAI (DCD, 2025).
- Alguns minutos de uma lâmpada LED (uma lâmpada de 10 W consome 0,3 Wh em cerca de dois minutos).
- Mais ou menos igual a uma busca no Google, pelo valor antigo de ~0,3 Wh do Google em 2009 (Google, 2009). A afirmação viral de “10x uma busca no Google” dividia uma estimativa antiga e alta de IA por esse dado igualmente antigo — nenhum dos dois vale hoje.
- Cerca de 1/250 de uma hora de streaming de vídeo, que consome ~77 Wh por hora (IEA, 2020).
- Muito menos que carregar seu celular (~10–15 Wh), embora gerar uma única imagem de IA possa chegar perto disso (MIT Technology Review, 2023).
Resumindo: seu uso de chatbot é um arredondamento no seu consumo pessoal de energia. O problema não é o seu uso — é o uso de todo mundo somado, concentrado em pontos específicos da rede.
Por que a energia por consulta está caindo
Os números por consulta acima já estão desatualizados em uma direção: para baixo. O Google relatou que a energia do prompt de texto mediano do Gemini caiu 33x em um único ano, principalmente por software — arquiteturas de modelo melhores, agrupamento inteligente de solicitações e maior utilização do hardware (Google Cloud, 2025). Cada nova geração de chips também entrega mais computação por watt, e técnicas como modelos mixture-of-experts ativam só uma fração dos parâmetros por solicitação.
O porém é conhecido na economia: quando algo fica mais barato, as pessoas usam mais. A queda no custo por token é exatamente o que permite modelos de raciocínio, contextos longos e IA de vídeo — que usam muito mais tokens por tarefa. A eficiência por consulta melhora enquanto a demanda total ainda cresce. Não é contradição; é o padrão já previsto pelas projeções do LBNL e da IEA.
Então, quanto você deve se preocupar?
Resposta equilibrada: esqueça a culpa por consulta, fique de olho na tendência da rede.
Por consulta, o custo é realmente pequeno — comparável a uma busca, fração de um minuto de streaming. Deixar de usar um chatbot para “economizar energia” é como evitar um elevador para combater as mudanças climáticas.
No nível do sistema, as preocupações são reais, mas específicas. Data centers se concentram em certas regiões, onde podem pressionar redes locais, aumentar tarifas e — se a nova demanda for atendida por gás em vez de energia limpa — dificultar a redução de emissões. A IEA também aponta o lado positivo: a IA aplicada a redes, edifícios e indústria pode economizar mais energia do que os data centers consomem, embora isso não seja garantido (IEA, 2025). Energia e água andam juntas aqui: menos computação significa menos energia e menos resfriamento.
O que está sendo feito a respeito?
A pressão está gerando respostas visíveis em toda a indústria.
- Contratos de energia limpa em escala inédita. A Microsoft assinou um acordo de 20 anos para reativar um reator nuclear em Three Mile Island — 835 MW de energia livre de carbono para seus data centers, prevista para 2028 (Utility Dive, 2024). Google e Amazon fizeram compromissos semelhantes com nuclear e renováveis.
- Renováveis construídas para data centers. A IEA projeta mais de 450 TWh de nova geração renovável para atender a demanda dos data centers até 2035 (IEA, 2025).
- Eficiência como meta de produto. Chips customizados (TPUs, aceleradores de inferência), resfriamento líquido e truques no modelo como distilação e quantização reduzem o consumo por token.
- Mais transparência. O artigo do Google em 2025 foi a primeira medição detalhada publicada por um grande provedor; a OpenAI seguiu com seu próprio número. A verificação independente ainda é rara, mas a direção é positiva.
Resumindo
Quanta energia a IA consome? Cerca de 0,3 watt-hora por consulta de texto típica — trivial isoladamente — e cerca de 415 TWh por ano para os data centers do mundo, caminhando para o dobro disso até 2030. O número por uso é pequeno e está caindo; o agregado é grande e está subindo. Ambos merecem ser citados com fontes, e nenhum justifica pânico ou complacência. Se quiser entender a tecnologia por trás desses números, comece pelo nosso hub de aprendizado.
Perguntas frequentes
Quanta energia uma consulta ao ChatGPT consome? Cerca de 0,3–0,34 watt-hora para uma consulta de texto típica, segundo dados da própria OpenAI e estimativa independente da Epoch AI. Isso equivale a alguns minutos de uma lâmpada LED. Documentos longos e modelos de raciocínio podem elevar uma única solicitação para vários watt-hora ou mais.
Treinar um modelo de IA consome mais energia do que usá-lo? O treinamento é um custo único enorme — o GPT-3 consumiu cerca de 1.287 MWh, e um modelo do porte do GPT-4 cerca de 40–50 GWh, segundo estimativa da Epoch AI. Mas bilhões de consultas diárias fazem com que a inferência (uso cotidiano) já some mais energia total do que o treinamento para modelos populares.
Quanta eletricidade os data centers consomem no total? Data centers dos EUA usaram cerca de 176 TWh em 2023 — 4,4% da eletricidade nacional — segundo relatório do Lawrence Berkeley National Laboratory, com projeções de 325–580 TWh até 2028. Globalmente, a IEA estima o uso dos data centers em 2024 em cerca de 415 TWh, dobrando para ~945 TWh até 2030.
Uma consulta ao ChatGPT é pior que uma busca no Google? Hoje estão no mesmo patamar. O valor oficial do Google em 2009 para uma busca era cerca de 0,3 Wh — o mesmo das estimativas atuais do ChatGPT. A afirmação popular de ‘10x pior’ comparava uma estimativa antiga de IA (3 Wh) com esse dado antigo de busca, e ambos já mudaram.
Como o consumo de energia da IA se compara ao do streaming de vídeo? Assistir uma hora de vídeo consome cerca de 0,077 kWh (77 Wh), segundo análise da IEA — equivalente a cerca de 250 consultas típicas ao ChatGPT. Uma única consulta de IA equivale a alguns segundos de TV, não a uma maratona de Netflix.
Por que o consumo de energia por consulta da IA está caindo? Chips melhores, modelos mais inteligentes e maior utilização. O Google relatou uma queda de 33x no consumo por prompt de texto mediano do Gemini em um ano. O porém: a demanda total ainda cresce porque o uso aumenta mais rápido que a eficiência.
O consumo de energia da IA é um problema sério? Por consulta, não — é minúsculo. O problema real é o crescimento agregado: data centers podem chegar a 6,7–12% da eletricidade dos EUA até 2028, pressionando redes locais e dificultando a redução de emissões se a nova demanda for atendida por combustíveis fósseis. Vale acompanhar, não entrar em pânico.
O que as empresas de tecnologia estão fazendo sobre o consumo de energia da IA? Comprando energia limpa em grande escala — a Microsoft assinou um contrato de 20 anos para reativar um reator de Three Mile Island (835 MW), e a IEA projeta mais de 450 TWh de novas renováveis para data centers até 2035 — além de desenvolver chips, modelos e sistemas de resfriamento mais eficientes.
Quer explicações claras e com fontes como esta na sua caixa de entrada? Assine nossa curadoria semanal de IA. Para mais números, veja nossa página de estatísticas de IA e o artigo complementar sobre uso de água da IA. Para entender a tecnologia, comece pelo hub de aprendizado.
Frequently asked questions
Quanta energia uma consulta ao ChatGPT consome?
Cerca de 0,3–0,34 watt-hora para uma consulta de texto típica, segundo dados da própria OpenAI e estimativa independente da Epoch AI. Isso equivale a alguns minutos de uma lâmpada LED. Documentos longos e modelos de raciocínio podem elevar uma única solicitação para vários watt-hora ou mais.
Treinar um modelo de IA consome mais energia do que usá-lo?
O treinamento é um custo único enorme — o GPT-3 consumiu cerca de 1.287 MWh, e um modelo do porte do GPT-4 cerca de 40–50 GWh, segundo estimativa da Epoch AI. Mas bilhões de consultas diárias fazem com que a inferência (uso cotidiano) já some mais energia total do que o treinamento para modelos populares.
Quanta eletricidade os data centers consomem no total?
Data centers dos EUA usaram cerca de 176 TWh em 2023 — 4,4% da eletricidade nacional — segundo relatório do Lawrence Berkeley National Laboratory, com projeções de 325–580 TWh até 2028. Globalmente, a IEA estima o uso dos data centers em 2024 em cerca de 415 TWh, dobrando para ~945 TWh até 2030.
Uma consulta ao ChatGPT é pior que uma busca no Google?
Hoje estão no mesmo patamar. O valor oficial do Google em 2009 para uma busca era cerca de 0,3 Wh — o mesmo das estimativas atuais do ChatGPT. A afirmação popular de '10x pior' comparava uma estimativa antiga de IA (3 Wh) com esse dado antigo de busca, e ambos já mudaram.
Como o consumo de energia da IA se compara ao do streaming de vídeo?
Assistir uma hora de vídeo consome cerca de 0,077 kWh (77 Wh), segundo análise da IEA — equivalente a cerca de 250 consultas típicas ao ChatGPT. Uma única consulta de IA equivale a alguns segundos de TV, não a uma maratona de Netflix.
Por que o consumo de energia por consulta da IA está caindo?
Chips melhores, modelos mais inteligentes e maior utilização. O Google relatou uma queda de 33x no consumo por prompt de texto mediano do Gemini em um ano. O porém: a demanda total ainda cresce porque o uso aumenta mais rápido que a eficiência.
O consumo de energia da IA é um problema sério?
Por consulta, não — é minúsculo. O problema real é o crescimento agregado: data centers podem chegar a 6,7–12% da eletricidade dos EUA até 2028, pressionando redes locais e dificultando a redução de emissões se a nova demanda for atendida por combustíveis fósseis. Vale acompanhar, não entrar em pânico.
O que as empresas de tecnologia estão fazendo sobre o consumo de energia da IA?
Comprando energia limpa em grande escala — a Microsoft assinou um contrato de 20 anos para reativar um reator de Three Mile Island (835 MW), e a IEA projeta mais de 450 TWh de novas renováveis para data centers até 2035 — além de desenvolver chips, modelos e sistemas de resfriamento mais eficientes.
Fique bom em IA: um email prático por semana.
Ferramentas, casos de uso e atalhos que você pode aplicar. Sem hype.