Potencia computacional servicio: un nuevo modelo de negocio en la era de los grandes modelos
Con el auge de los grandes modelos en el campo de la inteligencia artificial, la Potencia computacional se está convirtiendo en un nuevo modelo de negocio. Aunque la popularidad de "refinar elixires" de los grandes modelos eventualmente disminuirá, los proveedores de servicios de Potencia computacional necesitan prepararse para el futuro y ajustar su dirección estratégica a tiempo.
Recientemente, un joven que se graduó de la Universidad de Tsinghua hace tres años ha entrenado un gran modelo meteorológico Pangu con una cantidad de parámetros que alcanza el nivel de cientos de millones. Este modelo utilizó 40 años de datos meteorológicos globales y se preentrenó durante aproximadamente dos meses utilizando 200 tarjetas GPU. Según los precios de mercado actuales, el costo de entrenamiento de este proyecto podría superar los 2 millones de yuanes. Y si se trata de entrenar un modelo grande general, el costo podría aumentar cien veces.
Actualmente, China ya cuenta con más de cien modelos de gran escala con 10 mil millones de parámetros. Sin embargo, la industria se enfrenta a la difícil situación de la escasez de GPU de alto rendimiento. Los costos de potencia computacional se mantienen altos, y la falta de potencia computacional y financiamiento se ha convertido en un problema real para muchas empresas.
La escasez de GPU de alta gama es un problema reconocido en la industria. En su punto máximo, el precio de una Nvidia A100 se disparó a entre dos y trescientos mil yuanes, y el alquiler mensual de un servidor A100 también se elevó a entre 50,000 y 70,000 yuanes. A pesar de esto, todavía hay empresas que tienen dificultades para obtener los chips necesarios. Un alto ejecutivo de la industria de la computación en la nube indicó que, aunque la demanda de recursos de GPU de alta gama por parte de los clientes es fuerte, la oferta actual no puede satisfacer completamente la amplia demanda del mercado.
Ante esta situación, en la industria se considera que, a medida que la competencia en el mercado de grandes modelos se intensifique, el mercado regresará gradualmente a la racionalidad, y las empresas ajustarán sus estrategias y controlarán costos según los cambios en las expectativas.
Para hacer frente a la escasez de potencia computacional, las empresas han adoptado diversos métodos. Algunas compañías han mejorado la eficiencia del entrenamiento utilizando datos de mayor calidad. Otras empresas se han centrado en mejorar la capacidad de infraestructura para lograr un funcionamiento estable de más de mil calorías. Además, hay empresas que han optado por hacer la transición de una arquitectura de computación en la nube a una arquitectura de supercomputación, o utilizar plataformas nacionales para el entrenamiento y la inferencia de grandes modelos.
La potencia computacional se ha convertido en un nuevo modelo de servicio. El servicio de potencia computacional se basa en una potencia computacional diversa y está diseñado para proporcionar una entrega efectiva de potencia computacional a través de una red de potencia computacional, en un campo industrial emergente. No solo incluye potencia computacional, sino que también abarca un empaquetado unificado de recursos como almacenamiento y red, completando la entrega de potencia computacional en formas como API.
En la cadena de la industria de la potencia computacional, las empresas upstream proporcionan principalmente recursos básicos de potencia computacional, las empresas midstream se encargan de la producción y el suministro de potencia computacional, y las empresas downstream utilizan los servicios de potencia computacional para ofrecer servicios de valor agregado. Actualmente, el cobro por uso y las tarifas anuales o mensuales son los modelos de facturación de servicios de potencia computacional más comunes.
Con la normalización de la demanda de computación de alto rendimiento de los grandes modelos, el servicio de potencia computacional está formando rápidamente una cadena industrial y un modelo comercial únicos. A pesar de la actual escasez de GPU de alta gama y los altos costos de potencia computacional, esta situación es temporal. A largo plazo, los proveedores de servicios de potencia computacional deben estar siempre preparados para enfrentar cambios en el mercado y ajustar sus estrategias a tiempo cuando la ola de grandes modelos regrese a la racionalidad.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
20 me gusta
Recompensa
20
6
Compartir
Comentar
0/400
Token_Sherpa
· 07-10 00:38
jajaja minería de GPU una vez más... nunca aprendemos, ¿verdad?
Ver originalesResponder0
ZenZKPlayer
· 07-09 11:31
Ser engañados o subir a la nube es más barato.
Ver originalesResponder0
GameFiCritic
· 07-07 02:38
¿Cuánto beneficio se comerá el costo de entrenamiento? Solo de verlo me da ansiedad.
Ver originalesResponder0
GweiTooHigh
· 07-07 02:34
El minero de potencia computacional de la tarjeta se encuentra en camino~
En la era de los grandes modelos con escasez de potencia computacional, ¿cómo pueden las empresas enfrentar los altos costos de entrenamiento?
Potencia computacional servicio: un nuevo modelo de negocio en la era de los grandes modelos
Con el auge de los grandes modelos en el campo de la inteligencia artificial, la Potencia computacional se está convirtiendo en un nuevo modelo de negocio. Aunque la popularidad de "refinar elixires" de los grandes modelos eventualmente disminuirá, los proveedores de servicios de Potencia computacional necesitan prepararse para el futuro y ajustar su dirección estratégica a tiempo.
Recientemente, un joven que se graduó de la Universidad de Tsinghua hace tres años ha entrenado un gran modelo meteorológico Pangu con una cantidad de parámetros que alcanza el nivel de cientos de millones. Este modelo utilizó 40 años de datos meteorológicos globales y se preentrenó durante aproximadamente dos meses utilizando 200 tarjetas GPU. Según los precios de mercado actuales, el costo de entrenamiento de este proyecto podría superar los 2 millones de yuanes. Y si se trata de entrenar un modelo grande general, el costo podría aumentar cien veces.
Actualmente, China ya cuenta con más de cien modelos de gran escala con 10 mil millones de parámetros. Sin embargo, la industria se enfrenta a la difícil situación de la escasez de GPU de alto rendimiento. Los costos de potencia computacional se mantienen altos, y la falta de potencia computacional y financiamiento se ha convertido en un problema real para muchas empresas.
La escasez de GPU de alta gama es un problema reconocido en la industria. En su punto máximo, el precio de una Nvidia A100 se disparó a entre dos y trescientos mil yuanes, y el alquiler mensual de un servidor A100 también se elevó a entre 50,000 y 70,000 yuanes. A pesar de esto, todavía hay empresas que tienen dificultades para obtener los chips necesarios. Un alto ejecutivo de la industria de la computación en la nube indicó que, aunque la demanda de recursos de GPU de alta gama por parte de los clientes es fuerte, la oferta actual no puede satisfacer completamente la amplia demanda del mercado.
Ante esta situación, en la industria se considera que, a medida que la competencia en el mercado de grandes modelos se intensifique, el mercado regresará gradualmente a la racionalidad, y las empresas ajustarán sus estrategias y controlarán costos según los cambios en las expectativas.
Para hacer frente a la escasez de potencia computacional, las empresas han adoptado diversos métodos. Algunas compañías han mejorado la eficiencia del entrenamiento utilizando datos de mayor calidad. Otras empresas se han centrado en mejorar la capacidad de infraestructura para lograr un funcionamiento estable de más de mil calorías. Además, hay empresas que han optado por hacer la transición de una arquitectura de computación en la nube a una arquitectura de supercomputación, o utilizar plataformas nacionales para el entrenamiento y la inferencia de grandes modelos.
La potencia computacional se ha convertido en un nuevo modelo de servicio. El servicio de potencia computacional se basa en una potencia computacional diversa y está diseñado para proporcionar una entrega efectiva de potencia computacional a través de una red de potencia computacional, en un campo industrial emergente. No solo incluye potencia computacional, sino que también abarca un empaquetado unificado de recursos como almacenamiento y red, completando la entrega de potencia computacional en formas como API.
En la cadena de la industria de la potencia computacional, las empresas upstream proporcionan principalmente recursos básicos de potencia computacional, las empresas midstream se encargan de la producción y el suministro de potencia computacional, y las empresas downstream utilizan los servicios de potencia computacional para ofrecer servicios de valor agregado. Actualmente, el cobro por uso y las tarifas anuales o mensuales son los modelos de facturación de servicios de potencia computacional más comunes.
Con la normalización de la demanda de computación de alto rendimiento de los grandes modelos, el servicio de potencia computacional está formando rápidamente una cadena industrial y un modelo comercial únicos. A pesar de la actual escasez de GPU de alta gama y los altos costos de potencia computacional, esta situación es temporal. A largo plazo, los proveedores de servicios de potencia computacional deben estar siempre preparados para enfrentar cambios en el mercado y ajustar sus estrategias a tiempo cuando la ola de grandes modelos regrese a la racionalidad.