Хуан Ренсюнь в кожаной куртке встал на синюю доску для серфинга и принял несколько поз для серфинга.
Это не VidCon, «Internet Red Festival» в США, а сцена на конференции разработчиков Snowflake, известной платформы данных в США.
26 июня по местному времени основатель Nvidia Хуан Ренсюнь и генеральный директор Snowflake Фрэнк Слутман обсудили, «как сделать генеративный ИИ корпоративным пользователям». Ведущий — бывший терапевт Greylock GP, а ныне основатель инвестиционного агентства Conviction.
На встрече, по сравнению со зрелым и расчетливым профессиональным менеджером «хозяина» Фрэнка, «Крестный отец в коже» как всегда удивил, мало того, что сказал, что сотрудничество между двумя сторонами — это «Мы любовники, а не бойцы» ( Мы Любовники, а не Бойцы) Еще шутливее, что предоставленная для Снежинки обученная модель равносильна "скидке 10%" покупателям.
В тот же день Nvidia и Snowflake совместно выпустили еще один важный шаг: компания-производитель чипов № 1 в мире сотрудничала с самой популярной платформой облачных данных, чтобы начать совместное сотрудничество. **Пользователи Snowflake могут напрямую использовать предварительно обученную модель искусственного интеллекта Nvidia для анализа данных своей компании на облачной платформе, не покидая платформу, и разрабатывать «приложения искусственного интеллекта» для своих собственных данных. **
"Текущие основные изменения исходят от данных + алгоритма искусственного интеллекта + вычислительного движка. Благодаря нашему сотрудничеству мы можем объединить эти три пункта", — сказал Хуан Ренсюнь.
Темы для обсуждения:
Большая языковая модель + корпоративная база данных = приложение ИИ для конкретных задач;
Раньше это было «Данные, идущие на работу», но теперь это «Работа, идущая к данным», позволяющая вычислениям идти туда, где находятся данные, избегая островков данных;
Предварительная обучающая модель, предоставленная Nvidia, была обучена на фабрике Nvidia AI стоимостью в десятки миллионов долларов, поэтому вызов вычислительного движка на Snowflake уже «со скидкой 0,5%»;
В эпоху программного обеспечения 3.0, основанного на моделях и базах данных, предприятия могут создавать свои собственные эксклюзивные приложения в течение нескольких дней;
В будущем предприятия смогут производить множество интеллектуальных агентов и запускать их;
Для предприятий реальная проблема заключается в том, как мобилизовать смешанные структурированные и неструктурированные данные. Это может привести к обновлению бизнес-модели.
Ниже приводится основное содержание диалога между двумя сторонами под редакцией Geek Park:
01 Расскажите о сотрудничестве: используйте лучший вычислительный движок для самых ценных данных
Откровенный:
В настоящее время NVIDIA играет важную роль в истории. Для нас это возможность предоставлять данные и связи крупным предприятиям. Нам нужно задействовать эту технологию и весь стек сервисов, чтобы использовать ее эффективно. Я не хочу описывать это как «брак, заключенный на небесах», но для непрофессионала это хорошая возможность войти в эту дверь возможностей.
Хуан Ренсюнь:
Мы любовники, а не соперники. ** Мы хотим использовать лучший в мире вычислительный движок для самых ценных данных в мире. Оглядываясь назад, я работаю уже давно, но я не настолько стар. Фрэнк, ты старше (смеется). **
В последнее время данные огромны, а данные ценны по хорошо известным причинам. Это должно быть безопасно. Перемещать данные сложно, и гравитация данных реальна. Так что нам было намного проще перенести наш вычислительный движок в Snowflake. Наше партнерство направлено на ускорение Snowflake, а также на внедрение ИИ в Snowflake. **
**Ядром является комбинация данных + алгоритм искусственного интеллекта + вычислительный движок, наше партнерство объединяет все три вещи вместе. ** Невероятно ценные данные, невероятно мощный искусственный интеллект, невероятно мощный вычислительный механизм.
Что мы можем сделать вместе, так это помочь клиентам взять свои проприетарные данные и использовать их для написания приложений ИИ. Вы знаете, большой прорыв в том, что вы впервые можете разработать большую языковую модель. Вы помещаете его перед своими данными, а затем разговариваете с ними, как с человеком, и эти данные дополняются до большой языковой модели.
Сочетание большой языковой модели и базы знаний составляет приложение ИИ. ** Это просто, большая языковая модель превращает любую базу данных в приложение. **
Подумайте обо всех замечательных приложениях, которые написали люди. В его основе всегда были какие-то ценные данные. Теперь у вас есть общий механизм запросов на переднем плане, он очень умный, вы можете заставить его отвечать вам, но вы также можете подключить его к прокси-серверу, что является прорывом, достигнутым Langchain и векторными базами данных. Прорывные вещи, которые накладываются на данные и большие языковые модели, происходят повсюду, и все хотят это сделать. И мы с Фрэнком поможем тебе в этом.
02 Программное обеспечение 3.0: создайте приложение ИИ для решения конкретной проблемы
хозяин:
Когда инвестор смотрит на это изменение, программное обеспечение 1.0 представляет собой очень детерминированный код, написанный инженерами функционально; программное обеспечение 2.0 оптимизирует нейронную сеть с помощью тщательно собранных размеченных обучающих данных.
Вы, ребята, помогаете людям использовать Software 3.0, набор базовых моделей, которые невероятно эффективны сами по себе, но им все еще необходимо работать с корпоративными данными и пользовательскими наборами данных. Гораздо дешевле просто разработать эти приложения против них.
** Один вопрос для тех, кто глубоко изучает эту область, базовая модель очень общая, может ли она делать все? Зачем нам нужны пользовательские модели и корпоративные данные? **
Откровенный:
Итак, у нас есть очень обобщенные модели, которые могут сочинять стихи, составлять резюме «Великого Гэтсби», решать математические задачи.
Но в бизнесе нам это не нужно.Нам нужен второй пилот, чтобы получить экстраординарное понимание очень узкого, но очень сложного набора данных.
Нам необходимо понимать бизнес-модели и динамику бизнеса. Это не должно быть слишком затратным с вычислительной точки зрения, потому что модель не нужно обучать миллиону вещей, а нужно лишь знать очень немногое, но глубокие темы.
например. Я состою в совете директоров Instacart и являюсь одним из наших крупных клиентов, таких как DoorDash и все другие компании, у которых есть проблема, заключающаяся в том, что они продолжают наращивать свои расходы на маркетинг, клиент приходит, клиент размещает заказ, а клиент либо не не вернется или вернется через 90 дней, что очень нестабильно. Они называют это оттоком.
Это анализ сложных вопросов, потому что причин, по которым клиент не возвращается, может быть много. Люди хотят найти ответы на эти вопросы, и это в данных, а не в общем интернете, и это можно найти с помощью искусственного интеллекта. Это пример того, где можно создать большую ценность.
хозяин:
Как эти модели должны взаимодействовать с корпоративными данными?
Хуан Ренсюнь:
Наша стратегия и продукты представляют собой современные предварительно обученные модели всех размеров, и иногда вам нужно создать очень большую предварительно обученную модель, чтобы ее можно было использовать для обучения меньших моделей.
А меньшие модели могут работать практически на любом устройстве, возможно, с очень низкой задержкой. Однако его способность к обобщению невысока, а способность к нулевому выстрелу (обучению с нулевой выборкой) может быть более ограниченной.
Таким образом, у вас может быть несколько моделей разных типов и размеров, но в каждом случае вы должны выполнять точную настройку под наблюдением, вы должны делать RLHF (обучение с подкреплением с обратной связью от человека), чтобы оно соответствовало вашим целям и принципам. чтобы дополнить его чем-то вроде векторной базы данных, чтобы все это объединилось на одной платформе. У нас есть навыки, знания и базовая платформа, чтобы помочь им создать собственный ИИ, а затем подключить его к данным в Snowflake.
Теперь ** не должно быть целью каждого корпоративного клиента подумать о том, как мне создать большую языковую модель, их цель должна заключаться в том, как мне создать приложение ИИ для решения конкретной проблемы? **Этому приложению может потребоваться 17 вопросов, чтобы, наконец, найти правильный ответ. И тогда вы можете сказать: я хочу написать программу, это может быть программа SQL, это может быть программа Python, чтобы я мог делать это автоматически в будущем.
** Вам все еще нужно направлять этот искусственный интеллект, чтобы он, наконец, мог дать вам правильный ответ. **Но после этого вы можете создать приложение, которое может работать 24/7 в качестве агента (Агента), ища соответствующие ситуации и заранее сообщая вам. Поэтому наша работа заключается в том, чтобы помочь клиентам создавать эти приложения искусственного интеллекта, которые являются специфическими и настроенными с учетом мер безопасности.
В конечном счете, в будущем мы все станем умными производителями, нанимая сотрудников, конечно, но мы собираемся создать группу агентов, которые можно создать с помощью чего-то вроде Lang Chain, подключенных моделей, баз знаний, других API, развернутый в облаке, и подключите его ко всем данным Snowflake.
Вы можете масштабировать эти ИИ и постоянно улучшать их. Так что каждый из нас будет делать ИИ, управлять фабрикой ИИ. Мы поместим инфраструктуру в базу данных Snowflake, где клиенты смогут использовать свои данные, обучать и разрабатывать свои модели, управлять своим ИИ, поэтому Snowflake станет вашим хранилищем данных и банком.
Имея собственную золотую жилу данных, все они будут запускать ИИ-фабрики на Snowflake. Это цель.
03 Хотя «Ядерная бомба» стоит дорого, прямое использование модели эквивалентно «скидке 10%»
Хуан Ренсюнь:
Мы создали пять ИИ-фабрик в NVIDIA, четыре из которых входят в число 500 лучших суперкомпьютеров мира, а еще одна находится в стадии разработки. Мы используем эти суперкомпьютеры для предварительного обучения моделей. Поэтому, когда вы используете наш базовый сервис Nemo AI в Snowflake, вы получаете современную предварительно обученную модель, которая уже стоит десятки миллионов долларов, не говоря уже о НИОКР. Так что это предварительно обучено.
Кроме того, вокруг него есть целая куча других моделей, которые используются для тонкой настройки, RLHF. Все эти модели намного дороже в обучении.
Итак, теперь вы адаптировали предварительно обученную модель к своим функциям, к своим ограничениям, оптимизировали для тех навыков или функций, которые вы хотите, чтобы она имела, дополненная вашими данными. Следовательно, это будет более экономичный подход.
Что еще более важно, в течение нескольких дней, а не месяцев. Вы можете разрабатывать приложения ИИ, которые подключаются к вашим данным в Snowflake.
В будущем вы сможете быстро создавать приложения ИИ.
Потому что сейчас мы видим, как это происходит в режиме реального времени. Уже существуют приложения, которые позволяют вам общаться с данными, например ChatPDF.
хозяин:
**Да, в эпоху программного обеспечения 3.0 95% расходов на обучение уже покрываются другими. **
Хуан Ренсюнь:
(смеется) Да, скидка 95%, лучшего предложения и представить нельзя.
хозяин:
Это настоящий мотиватор, и как инвестор я видел очень молодые компании в области аналитики, автоматизации, юриспруденции и т. д., чьи приложения достигли реальной ценности для бизнеса за шесть месяцев или меньше. Частью этого является то, что они начинают с этих предварительно обученных моделей, что является огромной возможностью для бизнеса.
Хуан Ренсюнь:
В каждой компании будут сотни, может быть, даже 1000 приложений ИИ, просто подключенных ко всем видам данных в вашей компании. Таким образом, все мы должны быть хороши в создании этих вещей.
04 Раньше данные искали для бизнеса, теперь бизнес ищет данные
хозяин:
Один из вопросов, который я постоянно слышу от крупных игроков, заключается в том, что мы должны инвестировать в ИИ, нужен ли нам новый стек? Как мы должны думать о соединении с нашим существующим стеком данных?
Откровенный:
Я думаю, что это развивается. Модели постепенно становятся проще, безопаснее и лучше управляемыми. Итак, у нас нет четкого представления о том, что это эталонная архитектура, которую все будут использовать? У некоторых будут настройки для какой-то центральной службы. У Microsoft есть версия ИИ в Azure, и многие их клиенты взаимодействуют с Azure.
**Но мы не знаем, какая модель будет доминировать, мы думаем, что рынок определится с такими вещами, как простота использования и стоимость. **Это только начало, а не конечное состояние.
Также будет задействован сектор безопасности, и вопрос авторского права будет реформирован. Теперь, когда мы увлечены технологиями, мы будем решать настоящие проблемы одновременно.
Хуан Ренсюнь:
Сейчас мы переживаем первое фундаментальное изменение вычислительной платформы за 60 лет. Если вы только что прочитали пресс-релиз IBM 360, вы слышали о центральных процессорах, подсистемах ввода-вывода, контроллерах прямого доступа к памяти, виртуальной памяти, многозадачности, масштабируемых вычислениях с прямой и обратной совместимостью и этих концепциях, на самом деле это все 1964 год, и эти концепции помогли нам масштабировать ЦП в течение последних шести десятилетий.
Такая экспансия продолжалась 60 лет, но подошла к концу. Теперь все понимают, что мы больше не можем масштабировать ЦП, и вдруг программное обеспечение меняется. То, как пишется программное обеспечение, как оно работает и что оно может делать, сильно отличается от того, что было раньше. Мы называем предыдущее программное обеспечение программным обеспечением 2.0. Теперь это программное обеспечение 3.0.
Правда в том, что **вычисления коренным образом изменились. Мы видим две фундаментальные динамики, происходящие одновременно, поэтому сейчас все сильно трясется. **
Во-первых, вы больше не можете продолжать покупать процессоры. Если вы купите еще несколько процессоров в следующем году, ваша вычислительная мощность не увеличится. Потому что пришел конец масштабированию процессора. Вы заплатите намного больше, и вы не получите больше пропускной способности. Итак, ответ заключается в том, что вы должны использовать ускорение (ускоренная вычислительная платформа Nvidia). Лауреат премии Тьюринга говорил об ускорении, Nvidia стала пионером в ускорении, и теперь ускоренные вычисления уже здесь.
С другой стороны, вся операционная система компьютера претерпела глубокие изменения. У нас есть слой под названием NVIDIA AI Enterprise, и развертывание обработки данных, обучения и рассуждений в нем сейчас интегрировано или интегрируется в Snowflake, Таким образом, от начала обработки данных до окончательного развертывания большой модели, все, что позади Ускорена вычислительная машина. Мы собираемся усилить Snowflake, чтобы вы могли делать больше и делать больше с меньшими затратами.
Если вы зайдете в любое облако, то увидите, что графические процессоры NVIDIA — это самые дорогие вычислительные объекты. Но если вы нагрузите его работой, вы увидите, что мы делаем это очень быстро. Как будто вы получаете скидку 95%. Мы самая дорогая вычислительная организация, но мы самая рентабельная совокупная стоимость владения.
Итак, если ваша работа заключается в выполнении рабочей нагрузки, возможно, обучении большой языковой модели, возможно, тонкой настройке большой языковой модели, если вы хотите это сделать, определенно ускорьте ее.
** Ускорение каждой рабочей нагрузки, это изменение всего стека. ** Из-за этого меняются процессоры, из-за этого меняются операционные системы, другие модели больших языков, другие способы написания приложений ИИ.
В будущем мы все будем писать приложения. Нам всем приходится подключать наш и наш контекст с помощью нескольких команд Python к большой языковой модели и нашей собственной базе данных или базе данных компании, а также разрабатывать собственные приложения. Все будут разработчиками приложений.
хозяин:
Но то же самое, это все еще ваши данные. Вам еще нужно его доработать.
Откровенный:
Оказывается, все мы чувствуем, что быстрее всегда дороже. На самом деле внезапно, чем быстрее, тем дешевле, что довольно нелогично. Поэтому иногда люди хотят сократить предложение, думая, что это дешевле, а получается дороже.
Еще одно противоречие с предыдущим состоит в том, что раньше ** означало, что данные будут работать (данные будут работать), а теперь бизнес ищет данные (работа будет работать с данными). ** В течение последних шестидесяти или более лет мы позволяли данным работать в бизнесе, что привело к крупномасштабным информационным хранилищам. И если вы хотите иметь фабрику ИИ, использовать предыдущий метод будет очень сложно. Мы должны перенести вычисления туда, где есть данные. Я думаю, то, что мы сейчас делаем, правильно.
05 Как предприятия могут получить максимальную выгоду
Откровенный:
Быть самым быстрым и получать максимальную отдачу — две совершенно разные проблемы.
Если это самый быстрый, ** вы скоро увидите, что метод поиска с улучшенным ИИ доступен везде в базе данных, потому что это самая простая функция для добавления. **Невероятно, что даже неграмотный человек может получить ценную информацию из данных сейчас, предельная демократизация взаимодействия. Функция поиска значительно расширена, вы просто задаете вопрос основному интерфейсу, и они могут привести эти вопросы к данным для своего собственного запроса. Это низко висящий плод, самый простой, мы думаем, что это первая стадия.
Затем мы начинаем действительно сосредотачиваться на реальной проблеме, а именно на закрытых корпоративных данных, смешанных структурированных, неструктурированных и т. д. Как мы можем мобилизовать эти данные? **
Я уже упоминал о проблемах с оттоком клиентов и управлении цепочками поставок, с которыми сталкиваются компании C. Когда цепочка поставок особенно сложна, если происходит событие, как мы можем перенастроить цепочку поставок, чтобы она работала? Что мне теперь делать Цепочка поставок состоит из множества различных объектов, а не из одного предприятия. Исторически сложилось так, что эта проблема никогда не решалась вычислительным путем. Управление цепочками поставок никогда не было платформой, это в значительной степени электронная почта, электронная таблица, за некоторыми небольшими исключениями. Так что это очень интересно.
Или мы можем пересчитать инвестиции в крупные колл-центры и оптимизировать розничное ценообразование.Как я уже сказал, это реальный потенциал переопределения бизнес-модели, которого с нетерпением ждали руководители крупных компаний. **
06 Предложения для предприятий:
Хуан Ренсюнь:
** Я бы спросил себя, во-первых, какая у меня самая ценная база данных? Во-вторых, я спрашивал себя, если бы у меня был супер, супер, супер умный человек, и все данные на предприятии проходили бы через этот суперинтеллект, что бы я спросил у этого человека? **
Это отличается в зависимости от компании каждого человека. База данных клиентов компании Фрэнка очень важна, потому что у него много клиентов. И моя собственная компания, у меня не так много клиентов, но для моей компании моя цепочка поставок очень сложна, и моя база данных проектов очень сложна.
**Для NVIDIA мы не можем построить GPU без искусственного интеллекта. Потому что ни один из наших инженеров не может сделать для нас много итераций и исследований, как ИИ. ** Поэтому, когда мы предложили искусственный интеллект, первое применение было в нашей собственной компании. Более того, невозможно разработать Hopper (суперкомпьютерный продукт NVIDIA) без искусственного интеллекта.
Мы также будем применять наш собственный ИИ к нашим собственным данным. Наша база данных ошибок — идеальный вариант для этого. Если вы посмотрите на количество кода в NVIDIA AI, у нас есть сотни программных пакетов, которые в совокупности позволяют запускать приложения. Некоторые из вещей, над которыми мы работаем прямо сейчас, — это то, как использовать ИИ, чтобы выяснить, как исправить его безопасность, как лучше всего поддерживать его, чтобы нам не приходилось мешать всему верхнему уровню приложений, сохраняя при этом обратную совместимость. .
Вот на что ИИ может дать вам ответы. Мы можем использовать большую языковую модель, чтобы ответить на эти вопросы, найти ответ или открыть нам что-то, а затем инженеры смогут это исправить. Или ИИ может порекомендовать метод ремонта, а инженеры-люди могут подтвердить, что это хороший метод ремонта.
Я не думаю, что все осознают, сколько интеллекта, проницательности и влияния скрыто в данных, которые они обрабатывают каждый день. **Вот почему мы все должны принять участие и помочь построить это будущее.
Теперь впервые данные, которые вы храните в хранилище данных, можно подключить к фабрике искусственного интеллекта. **Вы сможете производить информационную разведку, самый ценный товар в мире. Вы сидите на золотом руднике природных ресурсов — частных данных вашей компании, и сейчас мы подключаем их к механизму искусственного интеллекта, а другой конец генерирует информационную разведку каждый день, с невероятным количеством интеллектуальных данных. с другого конца, даже когда вы спите, он продолжает выходить. Это лучшее, что когда-либо было.
Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
Хуан Ренсюнь: вычислительная мощность Nvidia с искусственным интеллектом была продана со скидкой 10%
Автор | Лин Цзыцзюнь, Ли Юань
Редактор | Цзин Юй
Хуан Ренсюнь в кожаной куртке встал на синюю доску для серфинга и принял несколько поз для серфинга.
Это не VidCon, «Internet Red Festival» в США, а сцена на конференции разработчиков Snowflake, известной платформы данных в США.
26 июня по местному времени основатель Nvidia Хуан Ренсюнь и генеральный директор Snowflake Фрэнк Слутман обсудили, «как сделать генеративный ИИ корпоративным пользователям». Ведущий — бывший терапевт Greylock GP, а ныне основатель инвестиционного агентства Conviction.
На встрече, по сравнению со зрелым и расчетливым профессиональным менеджером «хозяина» Фрэнка, «Крестный отец в коже» как всегда удивил, мало того, что сказал, что сотрудничество между двумя сторонами — это «Мы любовники, а не бойцы» ( Мы Любовники, а не Бойцы) Еще шутливее, что предоставленная для Снежинки обученная модель равносильна "скидке 10%" покупателям.
В тот же день Nvidia и Snowflake совместно выпустили еще один важный шаг: компания-производитель чипов № 1 в мире сотрудничала с самой популярной платформой облачных данных, чтобы начать совместное сотрудничество. **Пользователи Snowflake могут напрямую использовать предварительно обученную модель искусственного интеллекта Nvidia для анализа данных своей компании на облачной платформе, не покидая платформу, и разрабатывать «приложения искусственного интеллекта» для своих собственных данных. **
"Текущие основные изменения исходят от данных + алгоритма искусственного интеллекта + вычислительного движка. Благодаря нашему сотрудничеству мы можем объединить эти три пункта", — сказал Хуан Ренсюнь.
Темы для обсуждения:
Ниже приводится основное содержание диалога между двумя сторонами под редакцией Geek Park:
01 Расскажите о сотрудничестве: используйте лучший вычислительный движок для самых ценных данных
Откровенный:
В настоящее время NVIDIA играет важную роль в истории. Для нас это возможность предоставлять данные и связи крупным предприятиям. Нам нужно задействовать эту технологию и весь стек сервисов, чтобы использовать ее эффективно. Я не хочу описывать это как «брак, заключенный на небесах», но для непрофессионала это хорошая возможность войти в эту дверь возможностей.
Хуан Ренсюнь:
Мы любовники, а не соперники. ** Мы хотим использовать лучший в мире вычислительный движок для самых ценных данных в мире. Оглядываясь назад, я работаю уже давно, но я не настолько стар. Фрэнк, ты старше (смеется). **
В последнее время данные огромны, а данные ценны по хорошо известным причинам. Это должно быть безопасно. Перемещать данные сложно, и гравитация данных реальна. Так что нам было намного проще перенести наш вычислительный движок в Snowflake. Наше партнерство направлено на ускорение Snowflake, а также на внедрение ИИ в Snowflake. **
**Ядром является комбинация данных + алгоритм искусственного интеллекта + вычислительный движок, наше партнерство объединяет все три вещи вместе. ** Невероятно ценные данные, невероятно мощный искусственный интеллект, невероятно мощный вычислительный механизм.
Что мы можем сделать вместе, так это помочь клиентам взять свои проприетарные данные и использовать их для написания приложений ИИ. Вы знаете, большой прорыв в том, что вы впервые можете разработать большую языковую модель. Вы помещаете его перед своими данными, а затем разговариваете с ними, как с человеком, и эти данные дополняются до большой языковой модели.
Сочетание большой языковой модели и базы знаний составляет приложение ИИ. ** Это просто, большая языковая модель превращает любую базу данных в приложение. **
Подумайте обо всех замечательных приложениях, которые написали люди. В его основе всегда были какие-то ценные данные. Теперь у вас есть общий механизм запросов на переднем плане, он очень умный, вы можете заставить его отвечать вам, но вы также можете подключить его к прокси-серверу, что является прорывом, достигнутым Langchain и векторными базами данных. Прорывные вещи, которые накладываются на данные и большие языковые модели, происходят повсюду, и все хотят это сделать. И мы с Фрэнком поможем тебе в этом.
02 Программное обеспечение 3.0: создайте приложение ИИ для решения конкретной проблемы
хозяин:
Когда инвестор смотрит на это изменение, программное обеспечение 1.0 представляет собой очень детерминированный код, написанный инженерами функционально; программное обеспечение 2.0 оптимизирует нейронную сеть с помощью тщательно собранных размеченных обучающих данных.
Вы, ребята, помогаете людям использовать Software 3.0, набор базовых моделей, которые невероятно эффективны сами по себе, но им все еще необходимо работать с корпоративными данными и пользовательскими наборами данных. Гораздо дешевле просто разработать эти приложения против них.
** Один вопрос для тех, кто глубоко изучает эту область, базовая модель очень общая, может ли она делать все? Зачем нам нужны пользовательские модели и корпоративные данные? **
Откровенный:
Итак, у нас есть очень обобщенные модели, которые могут сочинять стихи, составлять резюме «Великого Гэтсби», решать математические задачи.
Но в бизнесе нам это не нужно.Нам нужен второй пилот, чтобы получить экстраординарное понимание очень узкого, но очень сложного набора данных.
Нам необходимо понимать бизнес-модели и динамику бизнеса. Это не должно быть слишком затратным с вычислительной точки зрения, потому что модель не нужно обучать миллиону вещей, а нужно лишь знать очень немногое, но глубокие темы.
например. Я состою в совете директоров Instacart и являюсь одним из наших крупных клиентов, таких как DoorDash и все другие компании, у которых есть проблема, заключающаяся в том, что они продолжают наращивать свои расходы на маркетинг, клиент приходит, клиент размещает заказ, а клиент либо не не вернется или вернется через 90 дней, что очень нестабильно. Они называют это оттоком.
Это анализ сложных вопросов, потому что причин, по которым клиент не возвращается, может быть много. Люди хотят найти ответы на эти вопросы, и это в данных, а не в общем интернете, и это можно найти с помощью искусственного интеллекта. Это пример того, где можно создать большую ценность.
хозяин:
Как эти модели должны взаимодействовать с корпоративными данными?
Хуан Ренсюнь:
Наша стратегия и продукты представляют собой современные предварительно обученные модели всех размеров, и иногда вам нужно создать очень большую предварительно обученную модель, чтобы ее можно было использовать для обучения меньших моделей.
А меньшие модели могут работать практически на любом устройстве, возможно, с очень низкой задержкой. Однако его способность к обобщению невысока, а способность к нулевому выстрелу (обучению с нулевой выборкой) может быть более ограниченной.
Таким образом, у вас может быть несколько моделей разных типов и размеров, но в каждом случае вы должны выполнять точную настройку под наблюдением, вы должны делать RLHF (обучение с подкреплением с обратной связью от человека), чтобы оно соответствовало вашим целям и принципам. чтобы дополнить его чем-то вроде векторной базы данных, чтобы все это объединилось на одной платформе. У нас есть навыки, знания и базовая платформа, чтобы помочь им создать собственный ИИ, а затем подключить его к данным в Snowflake.
Теперь ** не должно быть целью каждого корпоративного клиента подумать о том, как мне создать большую языковую модель, их цель должна заключаться в том, как мне создать приложение ИИ для решения конкретной проблемы? **Этому приложению может потребоваться 17 вопросов, чтобы, наконец, найти правильный ответ. И тогда вы можете сказать: я хочу написать программу, это может быть программа SQL, это может быть программа Python, чтобы я мог делать это автоматически в будущем.
** Вам все еще нужно направлять этот искусственный интеллект, чтобы он, наконец, мог дать вам правильный ответ. **Но после этого вы можете создать приложение, которое может работать 24/7 в качестве агента (Агента), ища соответствующие ситуации и заранее сообщая вам. Поэтому наша работа заключается в том, чтобы помочь клиентам создавать эти приложения искусственного интеллекта, которые являются специфическими и настроенными с учетом мер безопасности.
В конечном счете, в будущем мы все станем умными производителями, нанимая сотрудников, конечно, но мы собираемся создать группу агентов, которые можно создать с помощью чего-то вроде Lang Chain, подключенных моделей, баз знаний, других API, развернутый в облаке, и подключите его ко всем данным Snowflake.
Вы можете масштабировать эти ИИ и постоянно улучшать их. Так что каждый из нас будет делать ИИ, управлять фабрикой ИИ. Мы поместим инфраструктуру в базу данных Snowflake, где клиенты смогут использовать свои данные, обучать и разрабатывать свои модели, управлять своим ИИ, поэтому Snowflake станет вашим хранилищем данных и банком.
Имея собственную золотую жилу данных, все они будут запускать ИИ-фабрики на Snowflake. Это цель.
03 Хотя «Ядерная бомба» стоит дорого, прямое использование модели эквивалентно «скидке 10%»
Хуан Ренсюнь:
Мы создали пять ИИ-фабрик в NVIDIA, четыре из которых входят в число 500 лучших суперкомпьютеров мира, а еще одна находится в стадии разработки. Мы используем эти суперкомпьютеры для предварительного обучения моделей. Поэтому, когда вы используете наш базовый сервис Nemo AI в Snowflake, вы получаете современную предварительно обученную модель, которая уже стоит десятки миллионов долларов, не говоря уже о НИОКР. Так что это предварительно обучено.
Кроме того, вокруг него есть целая куча других моделей, которые используются для тонкой настройки, RLHF. Все эти модели намного дороже в обучении.
Итак, теперь вы адаптировали предварительно обученную модель к своим функциям, к своим ограничениям, оптимизировали для тех навыков или функций, которые вы хотите, чтобы она имела, дополненная вашими данными. Следовательно, это будет более экономичный подход.
Что еще более важно, в течение нескольких дней, а не месяцев. Вы можете разрабатывать приложения ИИ, которые подключаются к вашим данным в Snowflake.
В будущем вы сможете быстро создавать приложения ИИ.
Потому что сейчас мы видим, как это происходит в режиме реального времени. Уже существуют приложения, которые позволяют вам общаться с данными, например ChatPDF.
хозяин:
**Да, в эпоху программного обеспечения 3.0 95% расходов на обучение уже покрываются другими. **
Хуан Ренсюнь:
(смеется) Да, скидка 95%, лучшего предложения и представить нельзя.
хозяин:
Это настоящий мотиватор, и как инвестор я видел очень молодые компании в области аналитики, автоматизации, юриспруденции и т. д., чьи приложения достигли реальной ценности для бизнеса за шесть месяцев или меньше. Частью этого является то, что они начинают с этих предварительно обученных моделей, что является огромной возможностью для бизнеса.
Хуан Ренсюнь:
В каждой компании будут сотни, может быть, даже 1000 приложений ИИ, просто подключенных ко всем видам данных в вашей компании. Таким образом, все мы должны быть хороши в создании этих вещей.
04 Раньше данные искали для бизнеса, теперь бизнес ищет данные
хозяин:
Один из вопросов, который я постоянно слышу от крупных игроков, заключается в том, что мы должны инвестировать в ИИ, нужен ли нам новый стек? Как мы должны думать о соединении с нашим существующим стеком данных?
Откровенный:
Я думаю, что это развивается. Модели постепенно становятся проще, безопаснее и лучше управляемыми. Итак, у нас нет четкого представления о том, что это эталонная архитектура, которую все будут использовать? У некоторых будут настройки для какой-то центральной службы. У Microsoft есть версия ИИ в Azure, и многие их клиенты взаимодействуют с Azure.
**Но мы не знаем, какая модель будет доминировать, мы думаем, что рынок определится с такими вещами, как простота использования и стоимость. **Это только начало, а не конечное состояние.
Также будет задействован сектор безопасности, и вопрос авторского права будет реформирован. Теперь, когда мы увлечены технологиями, мы будем решать настоящие проблемы одновременно.
Хуан Ренсюнь:
Сейчас мы переживаем первое фундаментальное изменение вычислительной платформы за 60 лет. Если вы только что прочитали пресс-релиз IBM 360, вы слышали о центральных процессорах, подсистемах ввода-вывода, контроллерах прямого доступа к памяти, виртуальной памяти, многозадачности, масштабируемых вычислениях с прямой и обратной совместимостью и этих концепциях, на самом деле это все 1964 год, и эти концепции помогли нам масштабировать ЦП в течение последних шести десятилетий.
Такая экспансия продолжалась 60 лет, но подошла к концу. Теперь все понимают, что мы больше не можем масштабировать ЦП, и вдруг программное обеспечение меняется. То, как пишется программное обеспечение, как оно работает и что оно может делать, сильно отличается от того, что было раньше. Мы называем предыдущее программное обеспечение программным обеспечением 2.0. Теперь это программное обеспечение 3.0.
Правда в том, что **вычисления коренным образом изменились. Мы видим две фундаментальные динамики, происходящие одновременно, поэтому сейчас все сильно трясется. **
Во-первых, вы больше не можете продолжать покупать процессоры. Если вы купите еще несколько процессоров в следующем году, ваша вычислительная мощность не увеличится. Потому что пришел конец масштабированию процессора. Вы заплатите намного больше, и вы не получите больше пропускной способности. Итак, ответ заключается в том, что вы должны использовать ускорение (ускоренная вычислительная платформа Nvidia). Лауреат премии Тьюринга говорил об ускорении, Nvidia стала пионером в ускорении, и теперь ускоренные вычисления уже здесь.
С другой стороны, вся операционная система компьютера претерпела глубокие изменения. У нас есть слой под названием NVIDIA AI Enterprise, и развертывание обработки данных, обучения и рассуждений в нем сейчас интегрировано или интегрируется в Snowflake, Таким образом, от начала обработки данных до окончательного развертывания большой модели, все, что позади Ускорена вычислительная машина. Мы собираемся усилить Snowflake, чтобы вы могли делать больше и делать больше с меньшими затратами.
Если вы зайдете в любое облако, то увидите, что графические процессоры NVIDIA — это самые дорогие вычислительные объекты. Но если вы нагрузите его работой, вы увидите, что мы делаем это очень быстро. Как будто вы получаете скидку 95%. Мы самая дорогая вычислительная организация, но мы самая рентабельная совокупная стоимость владения.
Итак, если ваша работа заключается в выполнении рабочей нагрузки, возможно, обучении большой языковой модели, возможно, тонкой настройке большой языковой модели, если вы хотите это сделать, определенно ускорьте ее.
** Ускорение каждой рабочей нагрузки, это изменение всего стека. ** Из-за этого меняются процессоры, из-за этого меняются операционные системы, другие модели больших языков, другие способы написания приложений ИИ.
В будущем мы все будем писать приложения. Нам всем приходится подключать наш и наш контекст с помощью нескольких команд Python к большой языковой модели и нашей собственной базе данных или базе данных компании, а также разрабатывать собственные приложения. Все будут разработчиками приложений.
хозяин:
Но то же самое, это все еще ваши данные. Вам еще нужно его доработать.
Откровенный:
Оказывается, все мы чувствуем, что быстрее всегда дороже. На самом деле внезапно, чем быстрее, тем дешевле, что довольно нелогично. Поэтому иногда люди хотят сократить предложение, думая, что это дешевле, а получается дороже.
Еще одно противоречие с предыдущим состоит в том, что раньше ** означало, что данные будут работать (данные будут работать), а теперь бизнес ищет данные (работа будет работать с данными). ** В течение последних шестидесяти или более лет мы позволяли данным работать в бизнесе, что привело к крупномасштабным информационным хранилищам. И если вы хотите иметь фабрику ИИ, использовать предыдущий метод будет очень сложно. Мы должны перенести вычисления туда, где есть данные. Я думаю, то, что мы сейчас делаем, правильно.
05 Как предприятия могут получить максимальную выгоду
Откровенный:
Быть самым быстрым и получать максимальную отдачу — две совершенно разные проблемы.
Если это самый быстрый, ** вы скоро увидите, что метод поиска с улучшенным ИИ доступен везде в базе данных, потому что это самая простая функция для добавления. **Невероятно, что даже неграмотный человек может получить ценную информацию из данных сейчас, предельная демократизация взаимодействия. Функция поиска значительно расширена, вы просто задаете вопрос основному интерфейсу, и они могут привести эти вопросы к данным для своего собственного запроса. Это низко висящий плод, самый простой, мы думаем, что это первая стадия.
Затем мы начинаем действительно сосредотачиваться на реальной проблеме, а именно на закрытых корпоративных данных, смешанных структурированных, неструктурированных и т. д. Как мы можем мобилизовать эти данные? **
Я уже упоминал о проблемах с оттоком клиентов и управлении цепочками поставок, с которыми сталкиваются компании C. Когда цепочка поставок особенно сложна, если происходит событие, как мы можем перенастроить цепочку поставок, чтобы она работала? Что мне теперь делать Цепочка поставок состоит из множества различных объектов, а не из одного предприятия. Исторически сложилось так, что эта проблема никогда не решалась вычислительным путем. Управление цепочками поставок никогда не было платформой, это в значительной степени электронная почта, электронная таблица, за некоторыми небольшими исключениями. Так что это очень интересно.
Или мы можем пересчитать инвестиции в крупные колл-центры и оптимизировать розничное ценообразование.Как я уже сказал, это реальный потенциал переопределения бизнес-модели, которого с нетерпением ждали руководители крупных компаний. **
06 Предложения для предприятий:
Хуан Ренсюнь:
** Я бы спросил себя, во-первых, какая у меня самая ценная база данных? Во-вторых, я спрашивал себя, если бы у меня был супер, супер, супер умный человек, и все данные на предприятии проходили бы через этот суперинтеллект, что бы я спросил у этого человека? **
Это отличается в зависимости от компании каждого человека. База данных клиентов компании Фрэнка очень важна, потому что у него много клиентов. И моя собственная компания, у меня не так много клиентов, но для моей компании моя цепочка поставок очень сложна, и моя база данных проектов очень сложна.
**Для NVIDIA мы не можем построить GPU без искусственного интеллекта. Потому что ни один из наших инженеров не может сделать для нас много итераций и исследований, как ИИ. ** Поэтому, когда мы предложили искусственный интеллект, первое применение было в нашей собственной компании. Более того, невозможно разработать Hopper (суперкомпьютерный продукт NVIDIA) без искусственного интеллекта.
Мы также будем применять наш собственный ИИ к нашим собственным данным. Наша база данных ошибок — идеальный вариант для этого. Если вы посмотрите на количество кода в NVIDIA AI, у нас есть сотни программных пакетов, которые в совокупности позволяют запускать приложения. Некоторые из вещей, над которыми мы работаем прямо сейчас, — это то, как использовать ИИ, чтобы выяснить, как исправить его безопасность, как лучше всего поддерживать его, чтобы нам не приходилось мешать всему верхнему уровню приложений, сохраняя при этом обратную совместимость. .
Вот на что ИИ может дать вам ответы. Мы можем использовать большую языковую модель, чтобы ответить на эти вопросы, найти ответ или открыть нам что-то, а затем инженеры смогут это исправить. Или ИИ может порекомендовать метод ремонта, а инженеры-люди могут подтвердить, что это хороший метод ремонта.
Я не думаю, что все осознают, сколько интеллекта, проницательности и влияния скрыто в данных, которые они обрабатывают каждый день. **Вот почему мы все должны принять участие и помочь построить это будущее.
Теперь впервые данные, которые вы храните в хранилище данных, можно подключить к фабрике искусственного интеллекта. **Вы сможете производить информационную разведку, самый ценный товар в мире. Вы сидите на золотом руднике природных ресурсов — частных данных вашей компании, и сейчас мы подключаем их к механизму искусственного интеллекта, а другой конец генерирует информационную разведку каждый день, с невероятным количеством интеллектуальных данных. с другого конца, даже когда вы спите, он продолжает выходить. Это лучшее, что когда-либо было.