Poder de computação em falta na era dos grandes modelos: como as empresas podem lidar com os altos custos de treinamento

robot
Geração do resumo em andamento

Poder de computação serviços: um novo modelo de negócio na era dos grandes modelos

Com a onda crescente de grandes modelos no campo da inteligência artificial, o poder de computação está se tornando um novo modelo de negócios. Embora a popularidade do "refinamento" de grandes modelos eventualmente diminua, os provedores de serviços de poder de computação precisam se preparar, ajustando rapidamente sua direção estratégica.

Recentemente, um jovem que se formou na Universidade Tsinghua há três anos treinou um grande modelo meteorológico Pangu com um número de parâmetros na casa das centenas de milhões. Este modelo utilizou 40 anos de dados meteorológicos globais e foi pré-treinado por cerca de dois meses usando 200 placas de GPU. De acordo com os preços atuais de mercado, o custo de treinamento deste projeto pode ultrapassar 2 milhões de RMB. E se fosse um modelo grande de uso geral, o custo poderia aumentar cem vezes.

Atualmente, a China já tem mais de cem modelos de grande escala com 10 bilhões de parâmetros. No entanto, a indústria enfrenta amplamente a escassez de GPUs de alto desempenho. O custo do poder de computação permanece elevado, e a falta de poder de computação e financiamento tornou-se um problema real para muitas empresas.

A escassez de GPUs de alta gama é um problema reconhecido na indústria. Em períodos de pico, o preço de uma Nvidia A100 foi inflacionado para duas a três dezenas de milhares de yuanes, e o aluguel mensal de um servidor A100 também disparou para 5 a 7 mil yuanes. Mesmo assim, ainda há empresas que têm dificuldade em obter os chips necessários. Um executivo de uma empresa de computação em nuvem declarou que, embora a demanda dos clientes por recursos de GPU de alta gama seja forte, a oferta atual não consegue satisfazer completamente a ampla demanda do mercado.

Diante desta situação, a indústria acredita amplamente que, à medida que a competição no mercado de grandes modelos aumenta, o mercado irá gradualmente retornar à racionalidade, e as empresas ajustarão suas estratégias e controlarão custos de acordo com as mudanças nas expectativas.

Para enfrentar a escassez de poder de computação, as empresas adotaram várias estratégias. Algumas empresas melhoraram a eficiência do treinamento usando dados de maior qualidade. Outras empresas focaram em aumentar a capacidade da infraestrutura, alcançando uma operação estável acima de mil calorias. Há também empresas que optaram por transitar de uma arquitetura de computação em nuvem para uma arquitetura de supercomputação, ou usar plataformas nacionais para treinamento e inferência de grandes modelos.

Poder de computação já se tornou um novo modelo de serviço. O serviço de poder de computação é baseado em uma diversidade de poder de computação, através de uma rede de poder de computação, com o objetivo de fornecer um novo setor industrial de poder de computação eficaz. Ele não inclui apenas o poder de computação, mas também abrange o empacotamento unificado de recursos como armazenamento e rede, concluindo a entrega de poder de computação em formas como API.

Na cadeia de indústrias de poder de computação, as empresas upstream fornecem principalmente recursos básicos de poder de computação, as empresas midstream são responsáveis pela produção e fornecimento de poder de computação, e as empresas downstream utilizam serviços de poder de computação para oferecer serviços de valor acrescentado. Atualmente, a cobrança por quantidade e a cobrança anual ou mensal são os modelos de cobrança de serviços de poder de computação mais comuns.

Com a normalização da demanda por computação de alto desempenho de grandes modelos, os serviços de poder de computação estão rapidamente formando uma cadeia industrial e um modelo de negócios únicos. Embora atualmente haja escassez de GPUs de alto desempenho e os custos de poder de computação estejam elevados, essa situação é temporária. A longo prazo, os provedores de serviços de poder de computação precisam estar sempre preparados para lidar com as mudanças do mercado e ajustar suas estratégias prontamente quando a euforia em torno dos grandes modelos voltar à racionalidade.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 6
  • Compartilhar
Comentário
0/400
Token_Sherpavip
· 07-10 00:38
lmao mineração de gpu outra vez... nunca aprendemos, pois não?
Ver originalResponder0
ZenZKPlayervip
· 07-09 11:31
Ser enganado por idiotas ainda é mais barato do que ir para a nuvem.
Ver originalResponder0
GameFiCriticvip
· 07-07 02:38
Quanto lucro vai consumir o custo de treinamento, só de olhar dá um frio na barriga.
Ver originalResponder0
GweiTooHighvip
· 07-07 02:34
O mineiro de poder de computação do cartão já está a caminho~
Ver originalResponder0
ShibaOnTheRunvip
· 07-07 02:31
Faltando tudo, não se pode faltar poder de computação.
Ver originalResponder0
SquidTeachervip
· 07-07 02:19
mais uma vez a especulação sobre os preços das GPUs
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)