另一方面是,計算機的整個操作系統發生了深刻的改變。我們有一個叫NVIDIA AI Enterprise 的層,而其中的數據處理、訓練、推理部署,整個現在已經整合到或正在整合到Snowflake 中,因此,從開始數據處理,一直到最後的大模型部署,整個背後的計算引擎都被加速了。我們將賦能Snowflake,在這裡你將能夠做得更多,而且你將能夠用更少的資源做到更多。
另一個與之前矛盾的是,**原來都是數據去找業務(data going to work),而現在,業務去找數據(work going to data)。 **過去的六十年,或者更多年,我們一直在讓數據去找業務,這導致了大規模的信息孤島。而如果你想擁有一個AI 工廠,用之前的做法將是非常困難的。我們必須把計算帶到數據所在的地方。我認為我們現在正在做的就是正確的方式。
我前面已經提到了to C 企業面臨的流失率問題,供應鏈管理方面的問題。當供應鏈特別複雜的時候,如果有一個事件發生了,我們如何重新調整一個供應鏈,使其運轉?我現在該怎麼做?供應鍊是由很多不同的實體組成的,不是單一的企業。歷史上,這是一個從未被計算解決過的問題。供應鏈管理從來沒有形成過一個平台,它幾乎是一個電子郵件,電子表格形成的體系,除了一些小的例外。因此,這是極其令人興奮的。
我們也會將我們自己的AI 應用於我們自己的數據中。我們的錯誤數據庫就是一個完美的應用場景。如果你看一下NVIDIA AI 的代碼量,我們有幾百個軟件包,結合在一起,支持一個應用程序能夠跑起來。我們現在正在努力的一些事情,就是如何使用AI 去弄清楚如何給它打安全補丁,如何最好地維護它,這樣我們就可以不必干擾整個上層應用層的同時,能夠向後端兼容。
黃仁勳:英偉達的AI 算力,已經1 折出售
作者| 凌梓郡、Li Yuan
編輯| 靖宇
身穿皮夾克的黃仁勳,站在藍色衝浪板上,擺了幾個衝浪的姿勢。
這不是美國「網紅節」VidCon,而是美國知名數據平台Snowflake 的開發者大會上的一景。
當地時間6 月26 日,英偉達創始人黃仁勳和Snowflake 公司CEO Frank Slootman 就「如何把生成式AI 帶給企業用戶」展開探討。主持人則是前Greylock 的GP,現在是投資機構Conviction 的創始人。
在會上,相較於「東道主」Frank 職業經理人式的老成持重,「皮衣教父」一如既往地語出驚人,不僅稱雙方的合作是「要相愛,不要戰鬥」(We are Lovers,not Fighters),更開玩笑說,為Snowflake 提供的經過訓練的模型,相當於給客戶「打了1 折」。
當天,英偉達與Snowflake 又共同放出大招:世界第一芯片公司與風頭最勁的雲數據平台合作,推出共同合作。 **Snowflake 的用戶可以在數據不離開平台的前提下,直接利用英偉達的預訓練AI 模型,在雲平台上對自己公司的數據進行分析,開發針對自己數據的「AI 應用」。 **
「目前的重大變革來自數據+AI 算法+計算引擎。通過我們的合作,我們的能夠將這三點帶到一起。」黃仁勳講道。
談話要點:
以下為雙方對話主要內容,經極客公園整理編輯:
01 談合作:把最好的計算引擎,帶給最有價值的數據
坦率:
NVIDIA 目前在歷史上發揮著重要的作用。對於我們來說,能夠帶來數據和大型企業的關係。我們需要啟用這項技術,以及讓整個服務堆棧來有效地使用它。我不想使用「天作之合」來形容,但是對於一個門外漢,是一個很好的機會,進入到這扇機會的大門裡。
黃仁勳:
我們是lovers,而不是對手。 **我們要把世界上最好的計算引擎帶到世界上最有價值的數據。回想過去,我已經工作了很長時間,但是還沒有那麼老。 Frank,你更老一些(笑)。 **
最近,由於眾所周知的原因,數據是巨大的,數據是寶貴的。它必須是安全的。移動數據很困難,數據的引力真實存在。因此,對我們來說,**把我們的計算引擎帶到Snowflake 上要容易得多。我們的伙伴關係是加速Snowflake,但它也是關於將人工智能帶到Snowflake。 **
**最核心的是,數據+人工智能算法+計算引擎的組合,我們的伙伴關係將所有這三件事結合在一起。 **令人難以置信的有價值的數據,令人難以置信的偉大的人工智能,令人難以置信的偉大的計算引擎。
我們可以一起做的事情,是幫助客戶使用他們的專有數據,並用它來編寫AI 應用程序。你知道,這裡的重大突破是,你第一次可以開發一個大型語言模型。你把它放在你的數據前面,然後你與你的數據交談,就像你與一個人交談一樣,而這些數據將被增強到一個大型語言模型中。
大型語言模型加知識庫的組合等於一個人工智能應用。 **這一點很簡單,一個大型的語言模型將任何數據知識庫變成一個應用程序。 **
想想人們所寫的一切驚人的應用程序。它的核心始終是一些有價值的數據。現在你有一個查詢引擎通用查詢引擎在前面,它超級智能,你可以讓它回應你,但你也可以把它連接到一個代理,這是Langchain 和向量數據庫帶來的突破。將數據和大語言模型疊加的突破性的東西正在到處發生,每個人都想做。而Frank 和我將幫助大家做到這一點。
02 軟件3.0:建立AI 應用,解決一個特定問題
主持人:
作為投資者來看這種變化,軟件1.0 是非常確定的代碼,由工程師按照功能寫出來;軟件2.0 是用仔細收集的標記的訓練數據優化一個神經網絡。
你們在幫助人們撬動軟件3.0,這套基礎模型本身有令人難以置信的能力,但它們仍然需要與企業數據和自定義數據集合作。只是針對它們去開發那些應用程序要便宜得多。
**對於那些深入關注這個領域的人來說有一個問題,基礎模型是非常泛化,它可以做所有事情嗎?為什麼我們需要自定義模型和企業數據呢? **
坦率:
所以我們有非常泛化的模型,可以做詩,處理《了不起的蓋茨比》的做摘要,做數學問題。
但是在商業中,我們不需要這些,我們需要的是一個Copilot,在一個非常狹窄,但是非常複雜的數據集上獲得非凡的洞見。
我們需要了解商業模式和商業動態。這樣的計算上不需要那麼昂貴,因為一個模型並不需要在一百萬件事情上接受訓練,只需要知道非常少的、但很深入的主題。
舉個例子。我是Instacart 的董事會成員,我們一個大客戶,像DoorDash 和所有其他企業常面臨的問題是,他們不斷增加營銷費用,來了一個客戶,客戶下了一個訂單,客戶要么不回來,要么90 天后回來,這非常不穩定。他們把這稱為流失客戶。
這是複雜問題的分析,因為客戶不回來的原因可能有很多。人們想找到這些問題的答案,它在數據中,不在一般的互聯網中,而且可以通過人工智能找出來。這就是可能產生巨大價值的例子。
主持人:
這些模型應該如何與企業數據互動?
黃仁勳:
我們的戰略和產品是各種尺寸、最先進的預訓練模型,有時你需要創建一個非常大的預訓練模型,以便它可以產生,來教更小的模型。
而較小的模型幾乎可以在任何設備運行,也許延遲非常低。然而它的泛化能力並不高,zero shot(零樣本學習)能力可能更有限。
因此,你可能有幾種不同類型不同大小的模型,但在每一種情況下,你必須做監督的微調,你必須做RLHF(人類反饋的強化學習),以便它與你的目標和原則保持一致,你需要用矢量數據庫之類的東西來增強它,所以所有這些都匯集在一個平台上。我們有技能、知識和基本平台,幫助他們創建自己的人工智能,然後將其與Snowflake 中的數據連接起來。
現在,**每個企業客戶的目標不應該是思考我如何建立一個大型的語言模型,他們的目標應該是,我如何建立一個人工智能應用程序來解決特定的問題? **那個應用可能需要17 個問題來做,最終得出正確的答案。然後你可能會說,我想寫一個程序,它可能是一個SQL 程序,可能是一個Python 程序,這樣我就可以在未來自動做這個。
**你還是要引導這個人工智能,讓他最終能給你正確的答案。 **但在那之後,你可以創建一個應用程序,可以作為一個代理(Agent)24/7 不間斷地運行,尋找相關情況,並提前向你匯報。所以我們的工作就是幫助客戶建立這些人工智能的應用,這些應用是有安全護欄的、具體的、定制的。
最終,我們在未來都將成為智能製造商,當然僱用員工,但我們將創建一大堆代理,它們可以用Lang Chain 類似的東西來創建,連接模型、知識庫、其他API,在雲中部署,並將其連接到所有的Snowflake 數據。
你可以規模化地操作這些AI,並不斷地完善這些AI。因此,我們每個人都將製造AI、運行AI 工廠。我們將把基礎設施放在Snowflake 的數據庫,客戶可以在那裡使用他們的數據,訓練和開發他們的模型,操作他們的AI,因此,Snowflake 將是你的數據存儲庫和銀行。
有了自己的數據金礦,所有人都將在Snowflake 上運行AI 工廠。這是目標。
03「核彈」雖貴,直接用模型相當於「打1 折」
黃仁勳:
我們在NVIDIA 建立了有五個AI 工廠,其中四個是世界前500 名的超級計算機,另一個正在上線。我們使用這些超級計算機來做預訓練模型。因此,當你在Snowflake 中使用我們的Nemo AI 基礎服務時,你將得到一個最先進的預訓練模型,已經有幾千萬美元的費用投入其中,更不用說研發投入了。所以它是預先訓練好的。
然後有一大堆其他的模型圍繞著它,這些模型用於微調、RLHF。所有這些模型的訓練成本都要高得多。
因此,現在你已經將預訓練模型適應於你的功能,適應於你的護欄,優化你希望它具有的技能或功能類型,用你的數據增強。因此,這將是一個更具成本效益的方法。
更重要的是,在幾天內,而不是幾個月。你可以在Snowflake 開發與你的數據連接的人工智能應用程序。
你應該能夠在未來快速建立人工智能應用程序。
因為我們現在看到它正在實時發生。已經有一些應用能夠讓你和數據聊天,比如ChatPDF。
主持人:
**是的,在軟件3.0 時代,95% 的培訓費用已經由別人承擔了。 **
黃仁勳:
(笑)是的,95% 的折扣,我無法想像一個更好的交易。
主持人:
這是真正的動力,作為投資人,我看到在分析、自動化、法律等領域的非常年輕的公司,他們的應用已經在六個月或更短的時間內實現了真正的商業價值。其中一部分原因是他們從這些預先訓練好的模型開始,這對企業來說是一個巨大的機會。
黃仁勳:
每家公司都會有數百個,甚至1000 個人工智能應用程序,只是與你公司的各種數據相連。所以,我們所有人都必須善於構建這些東西。
04 原來是數據找業務,現在是業務找數據
主持人:
我一直從大企業參與者聽到的一個問題是,我們必須去投資人工智能,我們需要一個新的堆棧(Stack)嗎?應該如何考慮與我們現有的數據堆棧相連?
坦率:
我認為它在不斷發展。模型們正逐漸變得更簡潔、安全、更好地被管理。所以,我們沒有一個真正明確的觀點,這就是每個人都會使用的參考架構?有些人將有一些中央服務的設置。微軟有Azure 中的人工智能版本,它們的很多客戶正在與Azure 進行互動。
**但我們不清楚什麼模型將主導,我們認為市場將在使用難易、成本這些事上進行自我排序。 **現在僅僅是開始,不是最終的狀態。
安全部門也會參與進來,關於版權的問題會被革新。現在我們對技術很著迷,現實中的問題也會被同時處理。
黃仁勳:
我們現在正經歷60 年來第一次根本性的計算平台變革。如果你剛剛讀了IBM 360 的新聞稿,你會聽到關於中央處理單元、IO 子系統、DMA 控制器、虛擬內存、多任務、可擴展計算向前和向後端兼容,而這些概念,實際都是1964 年的東西,而這些概念幫助我們在過去六十年來,不斷進行CPU 擴展。
這樣的擴展已經進行了60 年了,但這已經走到了盡頭。現在大家都明白,我們無法再擴展CPU 了,突然之間,軟件變化了。軟件的編寫方式,軟件的操作方式,以及軟件能做的事情都與以前有很大的不同。我們稱之前的軟件為軟件2.0。現在是軟件3.0。
事實就是,**計算已經從根本上改變了。我們看到兩個基本的動力在同時發生,這也是為什麼現在事情正在發生劇烈震盪。 **
一方面,你不能再不斷地購買CPU。如果你明年再買一大堆CPU,你的計算吞吐量將不會增加。因為CPU 擴展的終點已經到來了。你會多花一大堆錢,你不會得到更多的吞吐量。因此,答案是你必須去加速(英偉達加速計算平台)。圖靈獎獲得者談到了加速,英偉達開創了加速,加速計算現在已經到來。
另一方面是,計算機的整個操作系統發生了深刻的改變。我們有一個叫NVIDIA AI Enterprise 的層,而其中的數據處理、訓練、推理部署,整個現在已經整合到或正在整合到Snowflake 中,因此,從開始數據處理,一直到最後的大模型部署,整個背後的計算引擎都被加速了。我們將賦能Snowflake,在這裡你將能夠做得更多,而且你將能夠用更少的資源做到更多。
如果你去任何一個雲,你會看到NVIDIA GPU 是其中最昂貴的計算實體。但是,如果你把一個工作負載放在上面,你會發現我們做得非常快。就好像你得到了一個95% 的折扣。我們是最昂貴的計算實體,但我們是最具成本效益的TCO。
所以,如果你的工作是運行工作負載,可能是訓練大型語言模型,可能是微調大型語言模型,如果你想這樣做,一定要進行加速。
**加速每一個工作負載,這就是整個棧的重塑。 **處理器因此發生變化,操作系統因此不同,大的語言模型是不同的,你寫AI 應用程序的方式是不同的。
未來,我們都要寫應用。我們都要把我們的和我們的上下文,和少數幾個Python 命令連接起來,連接到大語言模型和自己的數據庫或者公司的數據庫中,開發自己的應用程序。每個人都將成為一個應用程序的開發者。
主持人:
但不變的是,它仍然是你的數據。你仍然需要對它進行微調。
坦率:
原來我們都覺得更快的總是更貴的。實際上突然之間,更快的是更便宜的,這是一種反直覺的東西。因此,有時人們想減少供應,以為這樣更便宜,結果卻更貴。
另一個與之前矛盾的是,**原來都是數據去找業務(data going to work),而現在,業務去找數據(work going to data)。 **過去的六十年,或者更多年,我們一直在讓數據去找業務,這導致了大規模的信息孤島。而如果你想擁有一個AI 工廠,用之前的做法將是非常困難的。我們必須把計算帶到數據所在的地方。我認為我們現在正在做的就是正確的方式。
05 企業如何獲得最快和最大的價值
坦率:
最快和獲得最大價值其實是兩個很不一樣的問題。
最快的話,**你很快能夠看到,數據庫各處都上線了人工智能增強的搜索方式,因為這是最容易增加的功能。 **現在,甚至一個文盲都能從數據中獲取有價值的信息,這真非常不可思議,這是終極的交互民主化。搜索功能極大增強,你就向主界面提一個問題,它們可以把這些問題帶到數據自己進行查詢。這是掛在低處的果實,最容易的,我們認為這是階段一。
接下來,我們就開始真正關注**真正的難題,就是專有的企業數據,混合結構化的、非結構化的,所有這些,我們如何調動這些數據? **
我前面已經提到了to C 企業面臨的流失率問題,供應鏈管理方面的問題。當供應鏈特別複雜的時候,如果有一個事件發生了,我們如何重新調整一個供應鏈,使其運轉?我現在該怎麼做?供應鍊是由很多不同的實體組成的,不是單一的企業。歷史上,這是一個從未被計算解決過的問題。供應鏈管理從來沒有形成過一個平台,它幾乎是一個電子郵件,電子表格形成的體系,除了一些小的例外。因此,這是極其令人興奮的。
或者我們可以重新計算大型的呼叫中心的投資,優化零售的定價,像我說的,這是一個大企業的CEO 們一直期待的**重新定義商業模式,是真正的潛力。 **
06 對企業的建議:
黃仁勳:
**我會問自己,第一,什麼是我唯一最有價值的數據庫?第二件事,我會問自己,如果我有一個超級、超級、超級聰明的人,而企業的一切數據都經過那個超級智能,我會問那個人甚麼? **
根據每個人的公司,這是不同的。 Frank 的公司客戶數據庫非常重要,因為他有很多客戶。而我自己的公司,沒有那麼多客戶,但對我的公司而言,我的供應鏈超級複雜,而且我的設計數據庫也超級複雜。
**對NVIDIA 來說,沒有人工智能我們已經無法建造出GPU。因為我們的工程師都不可能像AI那樣,為我們進行大量的迭代和探索。 **因此,當我們提出人工智能的時候,第一個應用在我們自己的公司。而且,所以Hopper(英偉達超算產品)不可能沒有人工智能的設計。
我們也會將我們自己的AI 應用於我們自己的數據中。我們的錯誤數據庫就是一個完美的應用場景。如果你看一下NVIDIA AI 的代碼量,我們有幾百個軟件包,結合在一起,支持一個應用程序能夠跑起來。我們現在正在努力的一些事情,就是如何使用AI 去弄清楚如何給它打安全補丁,如何最好地維護它,這樣我們就可以不必干擾整個上層應用層的同時,能夠向後端兼容。
這都是AI 能夠為你提供答案的。我們可以用一個大語言模型去回答這些問題,為我們找到答案,或者向我們揭示一些問題,然後工程師就可以再將其修好。或者AI 可以推荐一個修復方法,人類工程師再去確認這是不是一個好的修復方法。
我覺得**不是所有人都認識到了他們每天都在處理的數據裡面,其實蘊含著多少智能、洞見和影響力沒有被發掘。 **這就是為什麼我們所有人都要參與進來,幫助帶來這樣的未來。
現在,**你儲存在數據倉庫的數據,第一次可以被連接進人工智能工廠。 **你將能夠生產信息情報,這是世界上最有價值的商品。你坐在一個自然資源的金礦上——你公司的專有數據,而我們現在把它連接到一個人工智能引擎上,另一端每天直接產生信息情報,以難以置信的情報量從另一端湧出,甚至在你睡覺時也在源源不斷地產出。這是有史以來最好的事情。