Хуан Реньсюнь: обчислювальна потужність Nvidia AI була продана зі знижкою 10%

Автор | Лін Цзіцзюнь, Лі Юань

Редактор | Цзін Ю

Джерело зображення: створено Unbounded AI

Хуан Реньсюнь, одягнений у шкіряну куртку, стояв на синій дошці для серфінгу та позував у кількох позах для серфінгу.

Це не VidCon, «Інтернет-червоний фестиваль» у Сполучених Штатах, а сцена на конференції розробників Snowflake, відомої в США платформи даних.

26 червня за місцевим часом засновник Nvidia Хуан Реньсюнь і генеральний директор Snowflake Френк Слотман обговорили, «як запровадити генеративний ШІ для корпоративних користувачів». Ведучий – колишній GP Greylock, який зараз є засновником інвестиційного агентства Conviction.

На зустрічі, порівняно зі зрілим і розважливим професійним менеджером «господаря» Френком, «Хрещений батько в шкірі» як завжди був вражаючим, не лише зазначивши, що співпраця між двома сторонами «Ми коханці, а не вояки» ( Ми закохані, а не бійці) Ще більше жартівливо, що навчена модель, надана для Сніжинки, рівнозначна «знижці 10%» клієнтам.

Того ж дня Nvidia та Snowflake спільно випустили ще один великий крок: світовий виробник чіпів №1 співпрацював із найпопулярнішою платформою хмарних даних, щоб почати спільну співпрацю. **Користувачі Snowflake можуть безпосередньо використовувати попередньо навчену модель штучного інтелекту Nvidia для аналізу даних своєї компанії на хмарній платформі, не виходячи з платформи, і розробляти «додатки ШІ» для власних даних. **

«Поточні основні зміни походять від даних + алгоритму штучного інтелекту + обчислювального механізму. Завдяки нашій співпраці ми можемо об’єднати ці три моменти», – сказав Хуан Реньсюнь.

Теми для обговорення:

  • Велика мовна модель + спеціальна база даних підприємства = застосування AI для конкретних проблем;
  • Раніше це було Data going to Work, але тепер це Work going to Data, що дозволяє обчисленню працювати там, де знаходяться дані, уникаючи островів даних;
  • Модель попереднього навчання, надана Nvidia, була навчена на заводі Nvidia AI вартістю десятки мільйонів доларів, тому виклик обчислювального механізму на Snowflake вже «знижений на 0,5%»;
  • В епоху програмного забезпечення 3.0 на основі моделей і баз даних підприємства можуть створювати власні ексклюзивні програми протягом кількох днів;
  • У майбутньому підприємства зможуть виробляти багато інтелектуальних агентів і запускати їх;
  • Для підприємств справжня проблема полягає в тому, як мобілізувати змішані структуровані та неструктуровані дані. Це може призвести до оновлення бізнес-моделі.

Нижче наведено основний зміст діалогу між двома сторонами, відредагований Geek Park:

01 Розмова про співпрацю: використовуйте найкращий обчислювальний механізм для найцінніших даних

Френк:

Зараз NVIDIA відіграє важливу роль в історії. Для нас можливість передавати дані та зв’язки великим підприємствам. Нам потрібно ввімкнути цю технологію та весь стек послуг, щоб ефективно використовувати її. Я не хочу описувати це як «небесний матч», але для непрофесіонала це гарна можливість увійти в ці двері можливостей.

Хуан Реньсюнь:

Ми коханці, а не суперники. **Ми хочемо використовувати найкращий у світі обчислювальний механізм для найцінніших у світі даних. Озираючись назад, я давно працюю, але не такий вже й старий. Френк, ти старший (сміється). **

Останнім часом дані величезні, а дані є цінними з відомих причин. Воно повинно бути безпечним. Переміщувати дані важко, і серйозність даних реальна. Тож нам було набагато легше перенести наш обчислювальний механізм у Snowflake. Наше партнерство спрямоване на прискорення роботи Snowflake, а також на впровадження штучного інтелекту в Snowflake. **

**Суть полягає в поєднанні даних + алгоритму штучного інтелекту + обчислювального механізму, наше партнерство поєднує всі три речі разом. **Неймовірно цінні дані, неймовірно потужний штучний інтелект, неймовірно чудова система обчислень.

Що ми можемо зробити разом, так це допомогти клієнтам взяти їхні власні дані та використовувати їх для написання програм ШІ. Ви знаєте, великим проривом тут є те, що ви вперше можете розробити велику мовну модель. Ви розміщуєте це перед своїми даними, а потім спілкуєтеся зі своїми даними, як із людиною, і ці дані доповнюються у велику мовну модель.

Поєднання великої мовної моделі та бази знань дорівнює застосуванню ШІ. ** Цей простий, велика мовна модель перетворює будь-яку базу даних на програму. **

Подумайте про всі чудові програми, створені людьми. В її основі завжди були деякі цінні дані. Тепер у вас є загальний механізм запитів на передній панелі, він надзвичайно розумний, ви можете змусити його відповідати вам, але ви також можете підключити його до проксі, що є проривом, який приносять Langchain і векторні бази даних. Революційні речі, які накладаються на дані та великі мовні моделі, відбуваються всюди, і кожен хоче цим займатися. І ми з Френком допоможемо тобі в цьому.

02 Програмне забезпечення 3.0: створіть програму ШІ для вирішення конкретної проблеми

ведучий:

Коли інвестор дивиться на цю зміну, програмне забезпечення 1.0 — це дуже детермінований код, написаний інженерами з функціональним призначенням; програмне забезпечення 2.0 оптимізує нейронну мережу за допомогою ретельно зібраних позначених навчальних даних.

Ви, хлопці, допомагаєте людям використовувати програмне забезпечення 3.0, набір базових моделей, які самі по собі неймовірно ефективні, але їм все одно потрібно працювати з корпоративними даними та спеціальними наборами даних. Набагато дешевше просто розробити ці програми проти них.

**Одне запитання для тих, хто глибоко вивчає цю сферу, базова модель дуже загальна, чи може вона робити все? Навіщо нам потрібні спеціальні моделі та корпоративні дані? **

Френк:

Тож у нас є дуже узагальнені моделі, які можуть складати вірші, робити короткий виклад Великого Гетсбі, виконувати математичні завдання.

Але в бізнесі вони нам не потрібні. Нам потрібен Copilot, щоб отримати надзвичайну інформацію про дуже вузький, але дуже складний набір даних.

Нам потрібно розуміти бізнес-моделі та динаміку бізнесу. Це не повинно бути настільки дорогим з точки зору обчислень, тому що моделі не потрібно навчатися мільйонам речей, а лише знати дуже небагато, але глибоких тем.

наприклад. Я в правлінні Instacart і один із наших великих клієнтів, таких як DoorDash та інші компанії, які мають проблему в тому, що вони постійно збільшують свої маркетингові витрати, клієнт приходить, клієнт розміщує замовлення, а клієнт або не не повертається або повертається через 90 днів, що дуже нестабільно. Вони називають це відбійником.

Це аналіз складних питань, тому що може бути багато причин, чому клієнт не повертається. Люди хочуть знайти відповіді на ці питання, і це в даних, а не в загальному Інтернеті, і їх можна знайти за допомогою штучного інтелекту. Це приклад того, як можна створити велику цінність.

ведучий:

Як ці моделі повинні взаємодіяти з корпоративними даними?

Хуан Реньсюнь:

Наша стратегія та продукти — це найсучасніші попередньо навчені моделі всіх розмірів, і іноді вам потрібно створити дуже велику попередньо навчену модель, щоб її можна було виготовити для навчання менших моделей.

А менші моделі можуть працювати майже на будь-якому пристрої, можливо, з дуже низькою затримкою. Однак його здатність до узагальнення невисока, а здатність до нульового удару (навчання за нульовою вибіркою) може бути більш обмеженою.

Таким чином, у вас може бути кілька моделей різних типів і розмірів, але в кожному випадку вам потрібно виконувати контрольоване точне налаштування, ви повинні виконувати RLHF (навчання з підкріпленням із зворотним зв’язком людини), щоб воно відповідало вашим цілям і принципам Послідовно вам потрібно доповнити її чимось на кшталт векторної бази даних, щоб усе об’єдналося на одній платформі. У нас є навички, знання та базова платформа, щоб допомогти їм створити власний штучний інтелект, а потім підключити його до даних у Snowflake.

**Не має бути метою кожного корпоративного клієнта думати про те, як побудувати велику мовну модель, їхньою метою має бути те, як створити програму ШІ для вирішення конкретної проблеми? **Цей програмі може знадобитися 17 запитань, щоб нарешті дати правильну відповідь. І тоді ви можете сказати, що я хочу написати програму, це може бути програма SQL, це може бути програма Python, щоб я міг робити це автоматично в майбутньому.

**Ви все ще повинні керувати цим штучним інтелектом, щоб він нарешті міг дати вам правильну відповідь. **Але після цього ви можете створити програму, яка може працювати 24/7 як агент (Агент), шукати відповідні ситуації та звітувати вам заздалегідь. Отже, наша робота полягає в тому, щоб допомогти клієнтам створювати ці додатки штучного інтелекту, які є специфічними та налаштованими за допомогою захисних огорож.

Зрештою, у майбутньому ми всі станемо розумними виробниками, які, звісно, наймуть працівників, але ми збираємося створити купу агентів, які можна створити за допомогою чогось на зразок Lang Chain, підключених моделей, баз знань, інших API, розгорнуто в хмарі та підключіть його до всіх даних Snowflake.

Ви можете керувати цими штучним інтелектом у великих масштабах і постійно вдосконалювати їх. Тож кожен із нас буде створювати штучний інтелект, запускати фабрику штучного інтелекту. Ми розмістимо інфраструктуру на базі даних Snowflake, де клієнти зможуть використовувати свої дані, навчати та розробляти свої моделі, керувати своїм ШІ, тож Snowflake стане вашим сховищем даних і банком.

Маючи власну золоту жилу даних, усі запустять фабрики ШІ на Snowflake. Це мета.

03 Хоча «Ядерна бомба» коштує дорого, використання моделі безпосередньо еквівалентно «10% знижці»

Хуан Реньсюнь:

Ми створили п’ять фабрик штучного інтелекту в NVIDIA, чотири з яких входять до 500 найкращих суперкомп’ютерів у світі, а інша – на лінії. Ми використовуємо ці суперкомп’ютери для створення моделей попереднього навчання. Отже, коли ви використовуєте наш базовий сервіс Nemo AI у Snowflake, ви отримуєте передову попередньо навчену модель, яка вже коштує десятки мільйонів доларів, не кажучи вже про дослідження та розробки. Тому його попередньо готують.

Крім того, навколо нього є ціла купа інших моделей, які використовуються для тонкого налаштування, RLHF. Усі ці моделі набагато дорожчі у навчанні.

Отже, тепер ви адаптували попередньо навчену модель до ваших особливостей, до ваших огорож, оптимізовану для типу навичок або функцій, які ви хочете мати, доповнену вашими даними. Тому це буде більш економічно ефективним підходом.

Що ще важливіше, протягом кількох днів, а не місяців. У Snowflake ви можете розробляти програми AI, які підключаються до ваших даних.

У майбутньому ви зможете швидко створювати програми ШІ.

Тому що зараз ми бачимо, як це відбувається в реальному часі. Уже існують програми, які дозволяють спілкуватися в чаті з даними, наприклад ChatPDF.

ведучий:

**Так, в епоху програмного забезпечення 3.0 95% витрат на навчання вже покриваються іншими. **

Хуан Реньсюнь:

(сміється) Так, знижка 95%, я не можу уявити кращої пропозиції.

ведучий:

Це справжній мотиватор, і як інвестор я бачу дуже молоді компанії в аналітиці, автоматизації, юриспруденції тощо, чиї програми досягли реальної комерційної цінності за шість місяців або менше. Частково це полягає в тому, що вони починають із попередньо навчених моделей, що є величезною можливістю для бізнесу.

Хуан Реньсюнь:

У кожній компанії будуть сотні, можливо, навіть 1000 додатків штучного інтелекту, підключених до всіх видів даних у вашій компанії. Отже, ми всі повинні вміти будувати ці речі.

04 Раніше дані шукали бізнес, тепер бізнес шукає дані

ведучий:

Одне із запитань, яке я постійно чую від гравців великого бізнесу: нам потрібно інвестувати в штучний інтелект, чи потрібен нам новий стек? Як нам думати про підключення до нашого існуючого стеку даних?

Френк:

Я думаю, що це розвивається. Моделі поступово стають простішими, безпечнішими та кращими. Отже, ми не маємо дійсно чіткого уявлення про те, що це еталонна архітектура, яку всі будуть використовувати? Деякі матимуть налаштування для певної центральної служби. Microsoft має версію ШІ в Azure, і багато їхніх клієнтів взаємодіють із Azure.

**Але ми не знаємо, яка модель буде домінувати, ми думаємо, що ринок розбереться сам за такими речами, як простота використання та вартість. **Це лише початок, а не остаточний стан.

Також буде задіяний сектор безпеки, буде реформовано питання авторського права. Тепер, коли ми захоплюємося технологіями, реальні проблеми будуть вирішені водночас.

Хуан Реньсюнь:

Зараз ми переживаємо першу фундаментальну зміну обчислювальної платформи за 60 років. Якщо ви щойно прочитали прес-реліз IBM 360, ви чули про центральні процесори, підсистеми вводу-виводу, контролери DMA, віртуальну пам’ять, багатозадачність, масштабовані обчислення, сумісні вперед і назад, і ці концепції, насправді, це все 1964 рік, і ці концепції допомогли нам масштабувати процесори протягом останніх шести десятиліть.

Така експансія триває вже 60 років, але закінчилася. Тепер усі розуміють, що ми більше не можемо масштабувати процесор, і раптом програмне забезпечення змінюється. Спосіб написання програмного забезпечення, спосіб роботи програмного забезпечення та те, що програмне забезпечення може робити, дуже відрізняється від того, що було раніше. Ми називаємо попереднє програмне забезпечення програмним забезпеченням 2.0. Тепер це програмне забезпечення 3.0.

Правда полягає в тому, що **обчислювальна техніка докорінно змінилася. Ми бачимо, що дві фундаментальні динаміки відбуваються одночасно, тому зараз все різко хитається. **

З одного боку, ви більше не можете продовжувати купувати процесори. Якщо наступного року ви купите нову партію процесорів, ваша обчислювальна пропускна здатність не збільшиться. Тому що настав кінець масштабування ЦП. Ви заплатите цілу купу більше, і ви не отримаєте більше пропускної здатності. Отже, відповідь полягає в тому, що вам потрібно скористатися прискоренням (прискорена обчислювальна платформа Nvidia). Лауреат премії Turing Award говорив про прискорення, Nvidia стала піонером прискорення, і прискорені обчислення тепер тут.

З іншого боку, вся операційна система комп'ютера зазнала глибоких змін. У нас є рівень, який називається NVIDIA AI Enterprise, і обробка даних, навчання та розгортання в ньому вже інтегровані або інтегруються в Snowflake. Тому від початку обробки даних до остаточного розгортання великої моделі все позаду Двигун розрахунків прискорено. Ми збираємося підвищити потужність Snowflake, де ви зможете зробити більше, і ви зможете зробити більше з меншими витратами.

Якщо ви зайдете до будь-якої хмари, ви побачите, що графічні процесори NVIDIA є найдорожчими обчислювальними об’єктами. Але якщо ви навантажите це, ви побачите, що ми робимо це дуже швидко. Ви ніби отримуєте знижку 95%. Ми найдорожча обчислювальна компанія, але ми є найрентабельнішим TCO.

Отже, якщо ваша робота полягає в виконанні робочого навантаження, можливо, навчання великої мовної моделі, можливо, тонке налаштування великої мовної моделі, якщо ви хочете зробити це, обов’язково прискоріть це.

** Прискорюйте кожне робоче навантаження, це переформатування всього стека. **Процесори змінюються через це, операційні системи змінюються через це, великі мовні моделі відрізняються, спосіб написання програм штучного інтелекту відрізняється.

Надалі ми всі будемо писати заяви. Ми всі маємо з’єднати наш контекст за допомогою кількох команд Python із великою мовною моделлю та нашою власною базою даних або базою даних компанії та розробляти власні програми. Кожен буде розробником додатків.

ведучий:

Але те ж саме, що це все одно ваші дані. Вам ще потрібно його налаштувати.

Френк:

Виявляється, всі ми вважаємо, що швидше завжди дорожче. Насправді раптом швидше означає дешевше, що є дещо суперечливим. Тож іноді люди хочуть зменшити пропозицію, думаючи, що так дешевше, а виходить дорожче.

Ще одне протиріччя з попереднім полягає в тому, що ** раніше означало дані, які будуть працювати (дані будуть працювати), але тепер бізнес шукає дані (робота, що йде до даних). ** Протягом останніх шістдесяти або більше років ми використовували дані для бізнесу, що призвело до великого розселення інформації. І якщо ви хочете мати фабрику штучного інтелекту, вам буде дуже важко використовувати попередній метод. Ми повинні перенести обчислення туди, де є дані. Я вважаю, що ми зараз робимо правильний шлях.

05 Як підприємства можуть отримати найшвидшу та найбільшу цінність

Френк:

Бути найшвидшим і отримати найбільшу цінність – це насправді дві дуже різні проблеми.

Якщо він найшвидший, **невдовзі ви побачите, що метод пошуку з підтримкою штучного інтелекту доступний всюди в базі даних, тому що це найпростіша для додавання функція. **Це неймовірно, що зараз навіть неписьменна людина може отримати цінну інформацію з даних, остаточна демократизація взаємодії. Функцію пошуку значно вдосконалено, ви просто задаєте запитання головному інтерфейсу, і вони можуть переносити ці запитання до даних для власного запиту. Це найпростіший плід, який низько висить, ми вважаємо, що це перша стадія.

Далі ми починаємо справді зосереджуватися на реальній проблемі, яка полягає в корпоративних даних підприємства, змішаних структурованих, неструктурованих, усіх цих даних. Як ми мобілізуємо ці дані? **

Я вже згадував про рівень відтоку та проблеми з управлінням ланцюгом поставок, з якими стикаються компанії C. Коли ланцюжок поставок є особливо складним, якщо трапиться подія, як ми переналаштуємо ланцюг поставок, щоб він працював? що мені тепер робити Ланцюг постачання складається з багатьох різних організацій, а не з одного підприємства. Історично це проблема, яка ніколи не була вирішена обчислювальним шляхом. Управління ланцюгом постачання ніколи не було платформою, це майже електронна пошта, електронна таблиця, за кількома незначними винятками. Тож це надзвичайно захоплююче.

Або ми можемо перерахувати інвестиції у великі колл-центри та оптимізувати роздрібні ціни.Як я вже сказав, це реальний потенціал переосмислення бізнес-моделі, на який з нетерпінням чекали керівники великих компаній. **

06 Пропозиції для підприємств:

Хуан Реньсюнь:

**Я б запитав себе, по-перше, яка моя найцінніша база даних? По-друге, я б запитав себе: якби у мене була супер, супер, супер розумна людина, і всі дані на підприємстві проходили через цей суперінтелект, що б я запитав у цієї людини? **

Це залежить від компанії кожної людини. База даних клієнтів компанії Френка дуже важлива, оскільки у нього багато клієнтів. У моєї власної компанії у мене не так багато клієнтів, але для моєї компанії мій ланцюжок поставок надзвичайно складний, а моя база даних дизайну надзвичайно складна.

**Для NVIDIA ми не можемо створити GPU без штучного інтелекту. Тому що жоден із наших інженерів не може зробити багато ітерацій і досліджень за нас, як ШІ. ** Тому, коли ми запропонували штучний інтелект, перше застосування було в нашій власній компанії. Крім того, Hopper (суперкомп’ютерний продукт NVIDIA) неможливо створити без штучного інтелекту.

Ми також застосуємо власний ШІ до власних даних. Наша база даних помилок є ідеальним випадком для цього. Якщо ви подивіться на кількість коду в NVIDIA AI, у нас є сотні пакетів програмного забезпечення, які разом забезпечують запуск програми. Деякі речі, над якими ми зараз працюємо, це те, як використовувати штучний інтелект, щоб з’ясувати, як виправити безпеку, як найкраще її підтримувати, щоб нам не довелося втручатися в роботу всього верхнього рівня додатків, залишаючись при цьому зворотно сумісними .

Ось на що ШІ може дати вам відповіді. Ми можемо використовувати велику мовну модель, щоб відповісти на ці запитання, знайти відповідь для нас або розкрити нам щось, а потім інженери можуть це виправити. Або ШІ може порекомендувати метод ремонту, а інженери-людини можуть підтвердити, чи це хороший метод ремонту.

Я не думаю, що всі усвідомлюють, скільки розуму, проникливості та впливу приховано в даних, які вони обробляють щодня. **Ось чому ми всі повинні долучитися та допомогти створити це майбутнє.

Тепер вперше дані, які ви зберігаєте в сховищі даних, можна підключити до фабрики штучного інтелекту. **Ви зможете виробляти інформаційну розвідку, найцінніший товар у світі. Ви сидите на золотому руднику природних ресурсів – конфіденційних даних вашої компанії, і зараз ми підключаємо їх до механізму штучного інтелекту, а інший кінець генерує інформаційну інформацію безпосередньо щодня, надаючи неймовірну кількість інтелекту. з іншого кінця, навіть коли ви спите, він продовжує виходити. Це найкраща річ.

Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити