PONTOS CHAVE

  • As discussões das empresas supostamente se concentraram em servidores que podem executar tecnologia de IA
  • O aumento na demanda por servidores de IA resultou em capacidade de nuvem limitada para os clientes
  • Uma crise global na indústria de chips também afetou a escassez de servidores

Os gigantes da tecnologia Microsoft e Oracle conversaram sobre a possibilidade de alugar servidores um do outro em meio a uma escassez global de poder de computação devido ao uso de inteligência artificial, revelou um novo relatório.

As duas empresas de tecnologia discutiram a possibilidade de compartilhar servidores caso algum deles fique sem servidores de computação em nuvem à medida que mais clientes em nuvem usam servidores de IA, disse uma pessoa com conhecimento direto das negociações ao The Information em uma história publicada na terça-feira.

A pessoa acrescentou que o presidente da Oracle, Larry Ellison, e outros executivos seniores da empresa de software de computador consideram uma estratégia de IA mais ampla, que inclui a utilização de software de IA, como o ChatGPT da OpenAI, para melhorar os principais produtos de software da Oracle.

Uma demanda crescente por servidores que executam software de IA resultou em uma escassez que forçou os provedores de servidores em nuvem, como Oracle e Microsoft, a limitar a disponibilidade de servidores com IA para os clientes, informou o The Information anteriormente.

Alguns clientes relataram esperar meses às vezes para alugar hardware que pode executar software de aprendizado de máquina, de acordo com entrevistas com provedores de nuvem e clientes.

Parece que o aumento na demanda de servidores em nuvem começou em meados de 2022.

Em julho de 2022, um porta-voz da Microsoft disse à Data Center Dynamics que a empresa viu um "crescimento sem precedentes na nuvem" globalmente. "Com esse aumento, juntamente com as macrotendências que afetam todo o setor, tomamos medidas para atender aos aumentos de capacidade dos clientes e, ao mesmo tempo, acelerar a implantação de servidores em nossos data centers", disse o porta-voz.

A declaração do porta-voz veio depois que o The Information informou que os datacenters globais do Microsoft Azure estavam operando com capacidade de servidor limitada devido a uma escassez global.

A Microsoft disse na época que a capacidade limitada de seus servidores Azure era temporária, de acordo com o outlet. Um gerente da Microsoft disse à agência que um data center do Azure no centro de Washington e alguns na Europa e na Ásia devem manter o status limitado até 2023.

Se a Oracle e a Microsoft chegarem a um acordo sobre servidores compartilhados, espera-se que os dois gigantes da computação possam atender à crescente demanda por servidores de IA.

Em fevereiro, surgiram relatórios sobre o pacote de planejamento de recursos empresariais (ERP) NetSuite da Oracle ficando offline por cerca de um dia. Reclamações postadas no Reddit revelaram que a interrupção colocou as empresas dependentes dos servidores da NetSuite em Boston paralisadas, de acordo com o The Register .

A Microsoft tem trabalhado para preencher a lacuna de escassez por meio de um novo programa chamado ND H100 v5 , que deve melhorar a velocidade para empresas que trabalham com IA generativa. O programa de aluguel de servidores foi lançado em meados de março, depois que o servidor da OpenAI foi sobrecarregado pela crescente demanda pelo grande modelo de linguagem ChatGPT.

Além da introdução do ND H100 v5, a Microsoft também está gastando bilhões para desenvolver e produzir seus próprios microchips para servidores de IA.

A Microsoft e a Oracle não são as únicas gigantes da tecnologia no setor de servidores que foram pressionadas pela escassez de capacidade.

"Há uma enorme escassez de GPUs Nvidia e equipamentos de rede da Broadcom e Nvidia devido a um grande aumento na demanda", disse Dylan Patel, analista da Semianalysis, à Fierce Electronics em março.

O Microsoft Azure está usando as GPUs H100 Tensor Core da Nvidia para seus programas de servidor.

A indústria global de chips vem sofrendo com uma crise de oferta que também afetou o setor de computação em nuvem. Patel estimou que a Nvidia pode precisar de um ano ou mais para atender à demanda por GPUs H100.

A Nvidia está dois a três meses atrasada no cumprimento de pedidos de chips para servidores em nuvem, informou a Insider Intelligence em meados de abril. Embora os chips H100 possam aliviar temporariamente a escassez global de servidores de IA, observadores argumentaram que questões de preços podem desacelerar a ascensão meteórica da indústria de IA generativa.

Além disso, alguns especialistas do setor também observaram que a incapacidade da Nvidia de atender à demanda de chips para servidores pode colocar rivais como AMD e Intel no jogo dos principais jogadores.

No ano passado, os analistas levantaram preocupações sobre a possível desaceleração do mercado de nuvem durante a era pós-pandêmica, especialmente com o crescimento mais lento nas receitas da nuvem durante o segundo trimestre de 2022. gerenciará o boom na demanda de servidores de IA.

A ilustração mostra o logotipo do serviço de nuvem do Microsoft Azure
O Azure é o braço de serviços de computação em nuvem da Microsoft. IBTimes US