会議では、「ホスト」フランクの成熟した賢明なプロのマネージャーと比較して、「革を着たゴッドファーザー」は、両者の協力は「私たちは恋人であり、戦闘員ではない」と述べただけでなく、いつものように驚くべきものでした( We are Lovers, not Fighters)、Snowflake に提供されるトレーニング済みモデルが顧客に対する「10% 割引」に相当するというのはさらに冗談です。
私たちが一緒にできることは、顧客が独自のデータを取得し、それを使用して AI アプリケーションを作成できるよう支援することです。ご存知のとおり、ここでの大きな進歩は、初めて大規模な言語モデルを開発できることです。これをデータの前に置き、人間と話すようにデータと会話すると、そのデータは大規模な言語モデルに拡張されます。
大規模な言語モデルとナレッジ ベースを組み合わせたものが AI アプリケーションとなります。 ** これは単純で、大規模な言語モデルがあらゆるデータ知識ベースをアプリケーションに変えます。 **
最終的には、将来的には私たち全員がスマート メーカーになり、もちろん従業員を雇用しますが、Lang Chain、接続されたモデル、ナレッジ ベース、その他の API などを使用して作成できるエージェントを大量に作成することになります。クラウドにデプロイし、すべての Snowflake データに接続します。
これらの AI を大規模に運用し、継続的に AI を改善できます。したがって、私たち一人ひとりが AI を作り、AI 工場を運営することになります。当社はインフラストラクチャを Snowflake のデータベースに配置し、顧客がデータを使用し、モデルをトレーニングおよび開発し、AI を操作できるようにします。そのため、Snowflake はデータ リポジトリおよび銀行になります。
独自のデータの宝庫を持って、全員が Snowflake 上で AI 工場を実行します。これが目標です。
03 「核爆弾」は高価ですが、モデルを直接使用すると「10% オフ」に相当します
黄仁勲:
NVIDIA には 5 つの AI 工場が設立されており、そのうち 4 つは世界トップ 500 のスーパーコンピューターであり、もう 1 つは稼働中です。私たちはこれらのスーパーコンピューターを使用してモデルの事前トレーニングを行います。したがって、Snowflake で当社の Nemo AI ベース サービスを使用すると、研究開発は言うまでもなく、すでに数千万ドルの費用がかかる最先端の事前トレーニング済みモデルが得られます。したがって、事前にトレーニングされています。
進化していると思います。モデルは徐々にシンプルかつ安全になり、より適切に管理できるようになってきています。では、これが誰もが使用するリファレンス アーキテクチャであるという明確な見解はありません。一部には、中央サービスの設定があるものもあります。 Microsoft は Azure に AI を搭載しており、多くの顧客が Azure とやり取りしています。
C 企業が直面する解約率とサプライチェーン管理の問題についてはすでに述べました。サプライチェーンが特に複雑な場合、イベントが発生した場合、機能するようにサプライチェーンをどのように再調整すればよいでしょうか?私は今どうすればいいサプライチェーンは単一の企業ではなく、さまざまなエンティティで構成されています。歴史的に、これは計算的に解決されたことのない問題です。サプライ チェーン管理はプラットフォームではなく、いくつかの小さな例外を除けば、ほとんど電子メールやスプレッドシートです。ですから、これは非常にエキサイティングなことです。
あるいは、大規模コールセンターへの投資を再計算し、小売価格を最適化することもできます。先ほども述べたように、これこそが大企業の CEO が待ち望んでいたビジネス モデルを再定義する本当の可能性です。 **
Huang Renxun: Nvidia の AI コンピューティング能力は 10% 割引で販売されています
著者 | 林子軍、李源
編集者 | ジン・ユー
革のジャケットを着た黄仁訓さんは青いサーフボードの上に立ち、サーフィンのポーズをいくつか取った。
これは米国の「Internet Red Festival」であるVidConではなく、米国の著名なデータプラットフォームであるSnowflakeの開発者カンファレンスのワンシーンだ。
現地時間6月26日、Nvidia創業者のHuang Renxun氏とSnowflakeのCEO、Frank Slootman氏が「生成AIを企業ユーザーに提供する方法」について話し合った。司会者は元グレイロックGPで、現在は投資会社コンヴィクションの創設者。
会議では、「ホスト」フランクの成熟した賢明なプロのマネージャーと比較して、「革を着たゴッドファーザー」は、両者の協力は「私たちは恋人であり、戦闘員ではない」と述べただけでなく、いつものように驚くべきものでした( We are Lovers, not Fighters)、Snowflake に提供されるトレーニング済みモデルが顧客に対する「10% 割引」に相当するというのはさらに冗談です。
同じ日に、Nvidia と Snowflake は共同で別の大きな動きを発表しました。それは、世界ナンバー 1 のチップ企業が最も人気のあるクラウド データ プラットフォームと協力して共同協力を開始するというものです。 **Snowflake ユーザーは、Nvidia の事前トレーニング済み AI モデルを直接使用して、プラットフォームを離れることなくクラウド プラットフォーム上の自社のデータを分析し、自社のデータ用の「AI アプリケーション」を開発できます。 **
「現在の大きな変化は、データ + AI アルゴリズム + コンピューティング エンジンから来ています。私たちの協力を通じて、これら 3 つの点を統合することができます。」と黄仁勲氏は述べました。
話のポイント:
以下は、Geek Park が編集した両者の対話の主な内容です。
01 協力について話す: 最も貴重なデータに最高のコンピューティング エンジンを導入する
フランク:
NVIDIA は現在、歴史の中で重要な役割を果たしています。私たちにとって、データと関係を大企業にもたらすことができることです。このテクノロジーとサービス スタック全体がそれを効果的に使用できるようにする必要があります。 「天国のような試合」とは言いたくないが、素人にとっては、この機会の扉に入る良い機会だ。
黄仁勲:
私たちは恋人であり、ライバルではありません。 **私たちは、世界最高のコンピューティング エンジンを世界で最も価値のあるデータに提供したいと考えています。思い返してみると、私も長く仕事をしてきましたが、そんなに古いわけではありません。フランクさん、年上ですね(笑)。 **
最近、データが膨大になり、データが貴重になっている理由はよく知られています。安全でなければなりません。データの移動は困難ですが、データの重要性は現実のものです。そのため、コンピューティング エンジンを Snowflake に導入するのがはるかに簡単になりました。私たちのパートナーシップは、Snowflake を加速することを目的としていますが、Snowflake に AI を導入することも目的としています。 **
**コアはデータ + 人工知能アルゴリズム + コンピューティング エンジンの組み合わせであり、私たちのパートナーシップはこれら 3 つすべてを組み合わせたものです。 **信じられないほど貴重なデータ、信じられないほど優れた人工知能、信じられないほど優れた計算エンジン。
私たちが一緒にできることは、顧客が独自のデータを取得し、それを使用して AI アプリケーションを作成できるよう支援することです。ご存知のとおり、ここでの大きな進歩は、初めて大規模な言語モデルを開発できることです。これをデータの前に置き、人間と話すようにデータと会話すると、そのデータは大規模な言語モデルに拡張されます。
大規模な言語モデルとナレッジ ベースを組み合わせたものが AI アプリケーションとなります。 ** これは単純で、大規模な言語モデルがあらゆるデータ知識ベースをアプリケーションに変えます。 **
人々が書いた素晴らしいアプリのことを考えてみてください。その中心には常に貴重なデータがあります。これで、クエリ エンジンの一般的なクエリ エンジンがフロントにあり、非常にスマートで、応答させることができますが、プロキシに接続することもできます。これは、Langchain とベクター データベースがもたらす画期的な点です。データと大きな言語モデルをオーバーレイする画期的なことがどこでも起こっており、誰もがそれをやりたがっています。フランクと私はそれをお手伝いします。
02 ソフトウェア 3.0: 特定の問題を解決する AI アプリケーションを構築する
ホスト:
投資家がこの変化に注目すると、ソフトウェア 1.0 はエンジニアによって機能的に書かれた非常に決定論的なコードであり、ソフトウェア 2.0 は慎重に収集されたラベル付きトレーニング データを使用してニューラル ネットワークを最適化しています。
皆さんは、人々がソフトウェア 3.0 を活用できるよう支援しています。ソフトウェア 3.0 は、それ自体で非常に優れた機能を備えた一連の基礎モデルですが、それでもエンタープライズ データやカスタム データセットを操作する必要があります。それらに対してそれらのアプリを開発するだけの方がはるかに安価です。
**この分野を深く研究している方への質問ですが、基礎となるモデルは非常に一般的ですが、それで何でもできるのでしょうか?カスタム モデルとエンタープライズ データが必要なのはなぜですか? **
フランク:
したがって、詩を作成したり、華麗なるギャツビーの要約を作成したり、数学の問題を作成したりできる、非常に一般化されたモデルができました。
しかし、ビジネスでは、これらは必要ありません。必要なのは、非常に狭いながらも非常に複雑なデータセットに関して並外れた洞察を得るコパイロットです。
ビジネスモデルとビジネスダイナミクスを理解する必要があります。モデルは何百万もの事柄についてトレーニングする必要はなく、ごく少数の、しかし深いトピックだけを知っていればよいため、これはそれほど計算コストがかかる必要はありません。
例えば。私は Instacart の取締役を務めており、DoorDash や他のすべての企業のような大口顧客の 1 つが、マーケティング支出を増やし続け、顧客が来店し、顧客が注文を出し、顧客が注文を受け付けないという問題を抱えています。戻ってこない、または 90 日以内に戻ってくる、非常に不安定です。彼らはこれをチャーンと呼びます。
顧客が戻ってこない理由は数多く考えられるため、これは複雑な問題の分析です。人々はこれらの質問に対する答えを見つけたいと思っていますが、それは一般的なインターネットではなくデータの中にあり、人工知能を通じて見つけることができます。これは、大きな価値が生み出される可能性がある例です。
ホスト:
これらのモデルは企業データとどのようにやり取りすべきでしょうか?
黄仁勲:
私たちの戦略と製品は、あらゆるサイズの最先端の事前トレーニング済みモデルですが、場合によっては、より小さなモデルを教えるために作成できるように、非常に大規模な事前トレーニング済みモデルを作成する必要があります。
また、より小さいモデルは、ほぼすべてのデバイスで実行でき、おそらく非常に低い遅延で実行できます。ただし、汎化能力は高くなく、ゼロショット(ゼロサンプル学習)能力はさらに限定される可能性があります。
したがって、異なるタイプやサイズのモデルがいくつかある可能性がありますが、それぞれの場合において、教師あり微調整を行う必要があり、目標と原則に沿うように RLHF (人間のフィードバックによる強化学習) を行う必要があります。ベクトル データベースのようなもので強化して、すべてを 1 つのプラットフォームにまとめます。私たちは、彼らが独自の AI を作成し、それを Snowflake のデータに接続するのを支援するスキル、知識、基盤となるプラットフォームを持っています。
さて、**すべての企業顧客の目標は、大規模な言語モデルを構築する方法を考えることではなく、特定の問題を解決する AI アプリケーションをどのように構築するかということであるべきです。 **そのアプリでは、最終的に正しい答えを見つけるまでに 17 の質問が必要になる場合があります。そして、あなたは、将来これを自動的に実行できるように、SQL プログラムでも Python プログラムでもよいプログラムを書きたいと言うかもしれません。
**最終的に正しい答えを与えることができるように、あなたはこの人工知能を導く必要があります。 **ただし、その後は、エージェント (エージェント) として 24 時間 365 日実行できるアプリケーションを作成し、関連する状況を探して事前に報告することができます。したがって、私たちの仕事は、お客様がこれらの人工知能アプリケーションを構築できるように支援することです。このアプリケーションは、安全ガードレールを使用してカスタマイズされています。
最終的には、将来的には私たち全員がスマート メーカーになり、もちろん従業員を雇用しますが、Lang Chain、接続されたモデル、ナレッジ ベース、その他の API などを使用して作成できるエージェントを大量に作成することになります。クラウドにデプロイし、すべての Snowflake データに接続します。
これらの AI を大規模に運用し、継続的に AI を改善できます。したがって、私たち一人ひとりが AI を作り、AI 工場を運営することになります。当社はインフラストラクチャを Snowflake のデータベースに配置し、顧客がデータを使用し、モデルをトレーニングおよび開発し、AI を操作できるようにします。そのため、Snowflake はデータ リポジトリおよび銀行になります。
独自のデータの宝庫を持って、全員が Snowflake 上で AI 工場を実行します。これが目標です。
03 「核爆弾」は高価ですが、モデルを直接使用すると「10% オフ」に相当します
黄仁勲:
NVIDIA には 5 つの AI 工場が設立されており、そのうち 4 つは世界トップ 500 のスーパーコンピューターであり、もう 1 つは稼働中です。私たちはこれらのスーパーコンピューターを使用してモデルの事前トレーニングを行います。したがって、Snowflake で当社の Nemo AI ベース サービスを使用すると、研究開発は言うまでもなく、すでに数千万ドルの費用がかかる最先端の事前トレーニング済みモデルが得られます。したがって、事前にトレーニングされています。
そして、その周りには微調整に使用される他のモデルがたくさんあります、RLHF。これらのモデルはすべて、トレーニングにはるかにコストがかかります。
これで、事前トレーニングされたモデルを機能やガードレールに適合させ、必要なスキルや機能のタイプに合わせて最適化し、データで強化しました。したがって、これはよりコスト効率の高いアプローチとなります。
さらに重要なのは、数か月ではなく数日以内です。 Snowflake では、データに接続する AI アプリケーションを開発できます。
将来的には、AI アプリケーションを迅速に構築できるようになるはずです。
なぜなら、私たちはそれがリアルタイムで起こっているのを今見ているからです。 ChatPDF など、データを使ってチャットできるアプリはすでにあります。
ホスト:
**はい、ソフトウェア 3.0 時代には、トレーニング コストの 95% はすでに他人が負担しています。 **
黄仁勲:
(笑) はい、95% オフです。これ以上の割引は考えられません。
ホスト:
それが本当の動機であり、投資家として、私は分析、自動化、法務などの分野で、アプリケーションが 6 か月以内に本当のビジネス価値を達成した非常に若い企業を見てきました。その一部は、企業がこれらの事前トレーニングされたモデルから始めていることであり、これは企業にとって大きなチャンスです。
黄仁勲:
どの企業にも数百、場合によっては 1,000 の AI アプリケーションがあり、社内のあらゆる種類のデータに接続されています。したがって、私たち全員がこれらのものを構築するのが得意でなければなりません。
04 以前はビジネスを求めるデータでしたが、今はビジネスがデータを探しています
ホスト:
大企業からよく聞かれる質問の 1 つは、AI に投資しなければならないのですが、新しいスタックが必要ですか?というものです。既存のデータスタックとの接続についてはどのように考えるべきでしょうか?
フランク:
進化していると思います。モデルは徐々にシンプルかつ安全になり、より適切に管理できるようになってきています。では、これが誰もが使用するリファレンス アーキテクチャであるという明確な見解はありません。一部には、中央サービスの設定があるものもあります。 Microsoft は Azure に AI を搭載しており、多くの顧客が Azure とやり取りしています。
**しかし、どのモデルが主流になるかはわかりません。市場は使いやすさやコストなどの点で自動的に分類されると考えています。 **これは単なる始まりであり、最終的な状態ではありません。
安全保障分野も関与し、著作権問題も改革されるだろう。私たちがテクノロジーに魅了されている今、同時に現実の問題にも対処することになるでしょう。
黄仁勲:
私たちは現在、60 年ぶりの根本的なコンピューティング プラットフォームの変化を経験しています。 IBM 360 のプレス リリースを読んだばかりであれば、中央処理装置、IO サブシステム、DMA コントローラー、仮想メモリ、マルチタスク、前方および後方互換性のあるスケーラブル コンピューティング、およびこれらの概念について聞いたことがあるでしょう。実際、これらはすべて 1964 年のことです。この概念は、過去 60 年間にわたって CPU の拡張に役立ってきました。
このような拡大は60年間続いてきましたが、終わりを迎えました。今では、CPU を拡張することができなくなり、突然ソフトウェアが変更されることを誰もが理解しています。ソフトウェアの書き方、ソフトウェアの動作方法、ソフトウェアでできることは、以前のものとは大きく異なります。以前のソフトウェアをソフトウェア 2.0 と呼びます。現在はソフトウェア 3.0 です。
真実は、**コンピューティングは根本的に変わりました。私たちは 2 つの基本的な力学が同時に起こっているのを見て、それが今物事が激しく揺れている理由です。 **
まず、CPU を買い続けることができなくなりました。来年さらに CPU を購入しても、コンピューティングのスループットは向上しません。 CPU スケーリングの終わりが来たからです。多額の料金を支払うことになりますが、それ以上のスループットは得られません。したがって、答えは、加速する必要があるということです (Nvidia Accelerated Computing Platform)。チューリング賞受賞者はアクセラレーションについて語り、Nvidia はアクセラレーションの先駆者となり、アクセラレーテッド コンピューティングは今ここにあります。
一方で、コンピュータのオペレーティング システム全体は大幅に変化しました。 NVIDIA AI Enterprise と呼ばれるレイヤーがあり、その中のデータ処理、トレーニング、および推論のデプロイメントは現在、Snowflake に統合されているか、統合されつつあります。そのため、データ処理の開始から最終的な大規模モデルのデプロイメントまで、全体が背後にあります。計算エンジンが高速化されました。私たちは Snowflake を強化し、より少ないリソースでより多くのことを実行できるようにします。
どのクラウドに行っても、NVIDIA GPU がその中で最も高価なコンピューティング エンティティであることがわかります。しかし、ワークロードをかけてみると、非常に高速に処理していることがわかります。 95%割引になるみたいです。当社は最も高価なコンピューティング企業ですが、最も費用対効果の高い TCO です。
したがって、あなたの仕事がワークロードを実行することである場合、おそらく大規模な言語モデルをトレーニングしたり、大規模な言語モデルを微調整したりする必要がある場合は、間違いなくそれを高速化する必要があります。
** あらゆるワークロードを高速化します。これはスタック全体の再構築です。 **それによってプロセッサーが変わり、それによってオペレーティング システムが変わり、大きな言語モデルが異なり、AI アプリケーションの作成方法も異なります。
将来的には、全員がアプリケーションを作成することになります。私たちは皆、いくつかの Python コマンドを使用して、自分自身とコンテキストを大規模な言語モデルと自分自身のデータベースまたは会社のデータベースに接続し、独自のアプリケーションを開発する必要があります。誰もがアプリ開発者になります。
ホスト:
しかし、同じことは、それは依然としてあなたのデータであるということです。まだ微調整する必要があります。
フランク:
結局のところ、速いほど常にコストがかかると誰もが感じているようです。実際、突然、速いほど安くなるというのは、直感に反することです。そのため、安いと思って供給量を減らしたが、実際は高かったことが判明することがあります。
前のものとのもう 1 つの矛盾は、** は以前はデータが機能する (データが機能する) ことを意味していましたが、現在、ビジネスはデータを探している (データが機能する) ことです。 ** 過去 60 年以上にわたり、私たちはデータをビジネスに活用してきました。その結果、大規模な情報のサイロ化が生じてきました。そして、もしAI工場を持ちたいと思ったら、これまでの方法を使うのは非常に難しいでしょう。データのある場所にコンピューティングを導入する必要があります。私たちが今やっていることは正しい方法だと思います。
05 企業が最速かつ最大の価値を得る方法
フランク:
最速であることと最大の価値を得るということは、実際には 2 つのまったく異なる問題です。
これが最速の場合、**これは追加するのが最も簡単な関数であるため、AI 拡張検索メソッドがデータベース内のあらゆる場所でオンラインになっていることがすぐにわかります。 **文盲の人でもデータから貴重な情報を得ることができるのは驚くべきことであり、インタラクションの究極の民主化が実現しています。検索機能が大幅に強化されており、メイン インターフェイスに質問するだけで、その質問を独自のクエリのデータに取り込むことができます。これは簡単な成果であり、最も簡単であり、それが第 1 段階であると考えています。
次に、私たちは本当の問題に本格的に取り組み始めます。それは、独自の企業データ、構造化されたデータ、構造化されていないデータが混在しており、これらすべてをどのように活用するかということです。 **
C 企業が直面する解約率とサプライチェーン管理の問題についてはすでに述べました。サプライチェーンが特に複雑な場合、イベントが発生した場合、機能するようにサプライチェーンをどのように再調整すればよいでしょうか?私は今どうすればいいサプライチェーンは単一の企業ではなく、さまざまなエンティティで構成されています。歴史的に、これは計算的に解決されたことのない問題です。サプライ チェーン管理はプラットフォームではなく、いくつかの小さな例外を除けば、ほとんど電子メールやスプレッドシートです。ですから、これは非常にエキサイティングなことです。
あるいは、大規模コールセンターへの投資を再計算し、小売価格を最適化することもできます。先ほども述べたように、これこそが大企業の CEO が待ち望んでいたビジネス モデルを再定義する本当の可能性です。 **
06 企業への提案:
黄仁勲:
** まず第一に、私にとって最も価値のあるデータベースは何でしょうか? 2 番目に、私は自分自身に問います。もし私に超、超、超賢い人がいて、企業内のすべてのデータがその超知性を経由しているとしたら、私はその人に何を尋ねますか? **
これは各人の会社によって異なります。フランクには多くの顧客がいるため、会社の顧客データベースは非常に重要です。私の会社にはそれほど多くの顧客はいませんが、私の会社のサプライ チェーンは非常に複雑で、設計データベースも非常に複雑です。
**NVIDIA の場合、人工知能なしでは GPU を構築できません。なぜなら、当社のエンジニアは AI のように多くの反復と探索を行うことができないからです。 ** したがって、私たちが人工知能を提案したとき、最初に応用されたのは自社でした。さらに、Hopper (NVIDIA スーパーコンピューティング製品) は人工知能なしでは設計できません。
独自のAIを自社のデータにも適用していきます。私たちのバグ データベースは、これに最適な使用例です。 NVIDIA AI のコード量を見ると、アプリケーションの実行を可能にするソフトウェア パッケージが何百もあります。私たちが現在取り組んでいることのいくつかは、下位互換性を保ちながら上位アプリケーション層全体に干渉する必要がないように、AI を使用してセキュリティにパッチを適用する方法と、それを維持する最適な方法を見つける方法です。 。
これがAIが答えを提供してくれることです。私たちは大きな言語モデルを使用してこれらの質問に答えたり、答えを見つけたり、何かを明らかにしたりすることができ、その後エンジニアがそれを修正することができます。あるいは、AIが修理方法を推奨し、それが良い修理方法であるかどうかを人間の技術者が確認することもできます。
毎日処理するデータの中に、どれほどのインテリジェンス、洞察、影響力が隠されているか、誰もが気づいているわけではないと思います。 **だからこそ、私たち全員が参加し、この未来の実現に協力する必要があるのです。
今回初めて、データ ウェアハウスに保存したデータを人工知能ファクトリーに接続できるようになりました。 **世界で最も価値のある商品である情報インテリジェンスを生み出すことができるようになります。あなたは天然資源の宝庫、つまりあなたの会社の専有データに座っています。そして私たちはそれを人工知能エンジンに接続しており、もう一方の端では信じられないほどの量のインテリジェンスが注がれて情報インテリジェンスを毎日直接生成しています。反対側から入ってきて、寝ている間も出続けます。これまでで最高です。