В эпоху больших моделей с нехваткой вычислительной мощности, как предприятиям справляться с высокими затратами на обучение

robot
Генерация тезисов в процессе

Вычислительная мощность услуги: новая бизнес-модель в эпоху больших моделей

С ростом популярности больших моделей в области искусственного интеллекта, вычислительная мощность становится новой бизнес-моделью. Хотя интерес к «алхимии» больших моделей в конечном итоге угаснет, провайдеры вычислительных услуг должны заранее позаботиться о будущем и своевременно скорректировать стратегическое направление.

Недавно молодой человек, который выпустился из Университета Цинхуа три года назад, обучил большой метеорологический модель Паньгу с параметрами в миллиарды. Эта модель использовала 40-летние данные о погоде по всему миру и провела предобучение в течение примерно двух месяцев с использованием 200 графических процессоров. По текущим рыночным ценам, стоимость обучения этого проекта может превысить 2 миллиона юаней. А если речь идет о обучении универсальной большой модели, стоимость может увеличиться в сотни раз.

В настоящее время в Китае уже более ста моделей с масштабом в 10 миллиардов параметров. Однако отрасль в целом сталкивается с проблемой нехватки высококачественных GPU. Стоимость вычислительной мощности остается высокой, нехватка вычислительной мощности и финансирования стала реальной проблемой для многих компаний.

Недостаток высококачественных графических процессоров (GPU) является признанной проблемой в отрасли. В период пика цена на один процессор NVIDIA A100 достигала 200-300 тысяч юаней, а месячная аренда одного сервера A100 также выросла до 50-70 тысяч юаней. Тем не менее, некоторым компаниям по-прежнему трудно получить необходимые чипы. Один из руководителей в сфере облачных вычислений заявил, что, хотя спрос клиентов на ресурсы высококачественных GPU велик, текущее предложение не может полностью удовлетворить широкий рыночный спрос.

В условиях этой ситуации в отрасли в целом считают, что с intensification конкуренции на рынке больших моделей рынок постепенно вернется к рациональности, а компании будут корректировать свои стратегии и контролировать затраты в зависимости от изменений в ожиданиях.

Чтобы справиться с нехваткой вычислительной мощности, компании применили различные методы. Некоторые фирмы повысили эффективность обучения, используя данные более высокого качества. Другие предприятия сосредоточились на улучшении инфраструктурных возможностей, достигая стабильной работы выше 1000 калорий. Также некоторые компании выбрали переход с облачной архитектуры на архитектуру суперкомпьютеров или использование отечественных платформ для обучения и вывода больших моделей.

Вычислительная мощность уже стала новой моделью обслуживания. Услуги вычислительной мощности основаны на разнообразной вычислительной мощности и связаны через сеть вычислительной мощности, с целью предоставления эффективной вычислительной мощности в новой промышленной области. Это не только включает вычислительную мощность, но и охватывает единую упаковку ресурсов, таких как хранилище и сеть, для осуществления доставки вычислительной мощности в форме API и т.д.

В цепочке поставок вычислительной мощности, upstream компании в основном предоставляют базовые ресурсы вычислительной мощности, midstream компании отвечают за производство и поставку вычислительной мощности, а downstream компании используют услуги вычислительной мощности для предоставления добавленной стоимости. В настоящее время расчет по объему и подписка на год и месяц являются основными моделями расчета за услуги вычислительной мощности.

С учетом нормализации требований к высокопроизводительным вычислениям больших моделей, вычислительная мощность услуг быстро формирует уникальную отраслевую цепочку и бизнес-модель. Несмотря на текущий дефицит высококлассных графических процессоров и высокие затраты на вычислительную мощность, эта ситуация временная. В долгосрочной перспективе провайдеры вычислительных услуг должны быть готовы к изменениям на рынке и своевременно корректировать свои стратегии, когда волна интереса к большим моделям вернется к рациональности.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Поделиться
комментарий
0/400
Token_Sherpavip
· 07-10 00:38
лmao майнинг на GPU снова... мы так и не учимся, да?
Посмотреть ОригиналОтветить0
ZenZKPlayervip
· 07-09 11:31
Будут играть для лохов или на облаке дешевле?
Посмотреть ОригиналОтветить0
GameFiCriticvip
· 07-07 02:38
Сколько прибыли съедает стоимость обучения, даже смотреть страшно.
Посмотреть ОригиналОтветить0
GweiTooHighvip
· 07-07 02:34
Строящийся Майнер вычислительной мощностью уже в пути~
Посмотреть ОригиналОтветить0
ShibaOnTheRunvip
· 07-07 02:31
Нельзя недоставать вычислительной мощности.
Посмотреть ОригиналОтветить0
SquidTeachervip
· 07-07 02:19
Снова искусственно завышают цены на GPU
Посмотреть ОригиналОтветить0
  • Закрепить