Обчислювальна потужність коротка в епоху великих моделей: як підприємства можуть впоратися з високими витратами на навчання

robot
Генерація анотацій у процесі

Обчислювальна потужність послуги: нова бізнес-модель епохи великих моделей

З появою великомасштабних моделей в галузі штучного інтелекту, обчислювальна потужність стає новою комерційною моделлю. Хоча популярність "лікування" великих моделей зрештою зменшиться, постачальники послуг обчислювальної потужності повинні заздалегідь приготуватися та своєчасно коригувати стратегічний напрямок.

Нещодавно молодий випускник Туньхуа університету, який закінчив навчання три роки тому, навчив модель "Пангу" для метеорології з параметрами на рівні мільйонів. Ця модель використовує 40-річні дані про погоду з усього світу та проводила попереднє навчання протягом приблизно двох місяців за допомогою 200 графічних процесорів. За нинішніми ринковими цінами, вартість навчання цього проекту може перевищити 2 мільйони юанів. А якщо це буде навчання загальної великої моделі, витрати можуть зрости в сотні разів.

Наразі в Китаї вже є понад сотні великих моделей з розміром 10 мільярдів параметрів. Однак галузь загалом стикається з проблемою нестачі висококласних GPU. Витрати на обчислювальну потужність залишаються високими, а нестача обчислювальної потужності та фінансів стала реальною проблемою для багатьох підприємств.

Недостатня пропозиція висококласних GPU є визнаною проблемою в галузі. У пікові періоди ціна на один графічний процесор NVIDIA A100 зросла до 200-300 тисяч юанів, а місячна оренда одного сервера A100 також підскочила до 50-70 тисяч юанів. Незважаючи на це, деякі компанії все ще не можуть отримати необхідні чіпи. Один з керівників у сфері хмарних обчислень зазначив, що, хоча попит клієнтів на ресурси висококласних GPU залишається високим, нинішня пропозиція не може повністю задовольнити широкий ринковий попит.

В умовах цієї ситуації в галузі загалом вважають, що з посиленням конкуренції на ринку великих моделей ринок поступово повернеться до раціональності, а компанії будуть коригувати свої стратегії та контролювати витрати відповідно до змін у прогнозах.

Щоб вирішити проблему нестачі обчислювальної потужності, компанії застосували різні методи. Деякі компанії підвищують ефективність навчання, використовуючи дані вищої якості. Інші підприємства зосереджені на покращенні інфраструктурних можливостей, досягаючи стабільної роботи на рівні тисяч калорій. Також деякі компанії обирають перехід від хмарної архітектури до архітектури суперкомп'ютерів або використовують вітчизняні платформи для навчання та інференції великих моделей.

Обчислювальна потужність вже стала новою моделлю послуг. Послуги обчислювальної потужності базуються на різноманітній обчислювальній потужності, через мережу обчислювальної потужності, що спрямована на забезпечення ефективної обчислювальної потужності в новій промисловій сфері. Це не тільки включає обчислювальну потужність, а й охоплює єдину упаковку ресурсів, таких як зберігання, мережа тощо, з виконанням доставки обчислювальної потужності у формах, таких як API.

В індустрії обчислювальної потужності, підприємства на етапі видобутку в основному надають базові ресурси обчислювальної потужності, підприємства на середньому етапі відповідають за виробництво та постачання обчислювальної потужності, а підприємства на етапі споживання використовують послуги обчислювальної потужності для надання додаткових послуг. Наразі основними моделями оплати за послуги обчислювальної потужності є оплата за обсяг та підписка на рік або місяць.

З розвитком високопродуктивних обчислювальних потреб великих моделей, обчислювальна потужність швидко формує унікальний промисловий ланцюг і бізнес-моделі. Незважаючи на те, що наразі існує дефіцит висококласних GPU та високі витрати на обчислювальну потужність, ця ситуація є тимчасовою. У довгостроковій перспективі постачальники обчислювальної потужності повинні бути завжди готові реагувати на зміни на ринку та своєчасно коригувати стратегії, коли бум великих моделей повернеться до раціональності.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 6
  • Поділіться
Прокоментувати
0/400
Token_Sherpavip
· 07-10 00:38
лмао, майнінг на графічних процесорах знову... ми ніколи не вчимося, так?
Переглянути оригіналвідповісти на0
ZenZKPlayervip
· 07-09 11:31
Обман для дурнів чи дешевше перейти на хмару
Переглянути оригіналвідповісти на0
GameFiCriticvip
· 07-07 02:38
Скільки прибутку з'їсть вартість навчання, дивитися на це страшно.
Переглянути оригіналвідповісти на0
GweiTooHighvip
· 07-07 02:34
Будівельний картковий майнер вже в дорозі~
Переглянути оригіналвідповісти на0
ShibaOnTheRunvip
· 07-07 02:31
Чого б не бракувало, обчислювальна потужність повинна бути завжди.
Переглянути оригіналвідповісти на0
SquidTeachervip
· 07-07 02:19
Знову підвищують ціни на GPU
Переглянути оригіналвідповісти на0
  • Закріпити