虛擬貨幣熄火,元宇宙風(fēng)停,自動(dòng)駕駛還待爆發(fā),AI大模型又如狂風(fēng)驟雨一般襲來。而任憑風(fēng)雨驟變,作為算力供應(yīng)商,英偉達(dá)始終是那個(gè)“受益者”。
在這場(chǎng)AI大模型的戰(zhàn)局里,參戰(zhàn)者眾,海外有OpenAI、微軟、谷歌,國內(nèi)百度、阿里、華為、商湯等也紛紛加入。而藏在戰(zhàn)局里的GPU巨頭英偉達(dá),掌握著“算力”命門,成為了“戰(zhàn)爭(zhēng)”中的*受益者。
英偉達(dá)A100、H100,是當(dāng)前為AI大模型提供算力的“主力”。
在當(dāng)前,幾乎所有AI企業(yè)都在求購相關(guān)的GPU。甚至企業(yè)所擁有的A100、H100數(shù)量,已經(jīng)成為了行業(yè)判斷企業(yè)大模型能力的重要指標(biāo)之一。
而A100與H100的價(jià)格也水漲船高。據(jù)中國企業(yè)家報(bào)道,從去年年底到現(xiàn)在,A100的單價(jià)漲超50%,從之前約5萬元漲到了近10萬元。另據(jù)著名游戲開發(fā)者約翰·卡馬克在推特上透露,H100的價(jià)格漲到了超過4萬美金。*中國內(nèi)地的A800,當(dāng)前也處在國內(nèi)廠商排隊(duì)拿貨,而常常無貨的狀態(tài)。
在過去三十年間,英偉達(dá)繞開了“摩爾定律”,并以比“摩爾定律”快3倍的“黃氏定律”,在GPU領(lǐng)域率先站穩(wěn)腳跟。又將GPU從圖形專用計(jì)算芯片,用在了其他通用計(jì)算方面。
待英特爾、AMD等老牌芯片商家反應(yīng)過來時(shí),英偉達(dá)已經(jīng)幾乎“統(tǒng)治”了高端顯卡領(lǐng)域。而憑借著算力優(yōu)勢(shì),英偉達(dá)趕上了自動(dòng)駕駛、虛擬貨幣、元宇宙等多個(gè)風(fēng)口,如今,也成為AI大模型風(fēng)口中至關(guān)重要的參與者。
截至當(dāng)前,英偉達(dá)的市值約6870億美元,已遠(yuǎn)超英特爾、AMD,成為了僅次于蘋果、微軟、谷歌和亞馬遜的美國科技公司市值TOP5。
而在未來很長一段時(shí)間里,AI算力或許還會(huì)是英偉達(dá)的天下。
1
被英偉達(dá)“壟斷”算力的AI時(shí)代
A100是什么?為什么它成為了國內(nèi)外科技、互聯(lián)網(wǎng)廠商布局AI大模型“軍備”競(jìng)爭(zhēng)中的重要一環(huán)?這還得從AI大模型的“地基”談起。
訓(xùn)練AI大模型的核心有三塊:算法、算力、數(shù)據(jù)。
其中,算力就像基礎(chǔ)設(shè)施。如支撐起電器運(yùn)轉(zhuǎn)的電力,當(dāng)冰箱、空調(diào)、烤箱等多個(gè)電器一起使用,家庭用電、工業(yè)用電、農(nóng)業(yè)用電一同加碼,也需要提高電力負(fù)荷,否則難以支撐起用電量。算力之于AI大模型的原理也是如此。
以O(shè)penAI研發(fā)的GPT大語言模型為例,它需要大量的計(jì)算能力,GPU是主要的算力產(chǎn)出工具。而英偉達(dá)推出的A100芯片則是支撐起GPT的“主力”GPU。公開數(shù)據(jù)顯示,GPT-3具有1750億個(gè)參數(shù),45TB的訓(xùn)練數(shù)據(jù),并由上萬枚A100芯片支撐。
與OpenAI團(tuán)隊(duì)有過接觸的氪信科技創(chuàng)始人兼CEO朱明杰曾告訴全天候科技:“OpenAI的突破,本質(zhì)上是*次用了上萬張A100的卡,并搭載巨大數(shù)據(jù)量?!倍绻狈Ω咝阅艿男酒?,AI大模型的訓(xùn)練效率也將大大降低。
GPT-3已經(jīng)證明了A100在AI大模型訓(xùn)練中的作用,它能夠同時(shí)執(zhí)行許多簡單的計(jì)算,這對(duì)于AI的訓(xùn)練和使用神經(jīng)網(wǎng)絡(luò)模型十分重要。在當(dāng)前,企業(yè)所擁有的A100數(shù)量,已經(jīng)成為了行業(yè)判斷企業(yè)大模型能力的重要指標(biāo)之一。
AIGC風(fēng)口之下,新老玩家紛紛布局AI大模型,企業(yè)對(duì)GPU需求量劇增。
目前,OpenAI并沒有公布GPT-4的參數(shù)規(guī)模,不過有推測(cè)認(rèn)為,GPT-4的參數(shù)量是GPT-3的10倍以上。那么,GPT-4的算力需求也呈指數(shù)級(jí)上升,所需要的GPU數(shù)量也將超過此前。
有消息稱,當(dāng)前微軟GPU數(shù)量告急,需要用GPU的團(tuán)隊(duì)被告知,必須經(jīng)過特殊渠道申請(qǐng),因?yàn)椤肮镜拇罅縂PU需要用于支持Bing的最新AI功能和GPT的模型訓(xùn)練”。
在去年3月,英偉達(dá)又發(fā)布了Hopper H100,相比于A100,H100的理論性能提升了6倍。H100直到近期才開始大規(guī)模量產(chǎn),而微軟、谷歌、甲骨文等云計(jì)算服務(wù)已開始批量部署。最近幾個(gè)季度中,微軟、甲骨文為其人工智能和云服務(wù)購買了數(shù)萬個(gè)英偉達(dá)的A100和H100 GPU。
作為OpenAI最初的創(chuàng)始人之一,馬斯克作在2018年從該公司的董事會(huì)卸任。在今年,馬斯克一面與一眾AI專家、行業(yè)高管呼吁暫停訓(xùn)練比GPT-4模型更強(qiáng)大的人工智能系統(tǒng),一面“口嫌體正直”,計(jì)劃成立AI公司與OpenAI抗衡。
一份報(bào)告顯示,Twitter已經(jīng)采購了大約1萬張GPU。馬斯克承認(rèn)這一點(diǎn),“在這一點(diǎn)上,似乎所有人和他們的狗都在購買GPU。”馬斯克說,“Twitter和特斯拉肯定在購買GPU。”
而巨大的需求量也使得A100、H100的價(jià)格猛漲。
著名游戲開發(fā)者約翰·卡馬克上周在推特上稱,上周五至少有8枚H100芯片在eBay上售賣,價(jià)格從39995美元到46000美元不等。而A100,據(jù)中國企業(yè)家報(bào)道,從去年年底到現(xiàn)在,在國內(nèi)其單價(jià)漲了超過50%,從之前約5萬元漲到了近10萬元。
A100、H100均面向企業(yè)用戶,較少在公開市場(chǎng)零售,也因此存在一定炒作空間。
事實(shí)上,要訓(xùn)練AI大模型,搭建算力的資金成本也成為了巨大的門檻。行業(yè)專家曾推測(cè),國內(nèi)如果要訓(xùn)練一個(gè)GPT-3級(jí)別的大模型,僅僅芯片一項(xiàng),最小投入就得近10億元人民幣。
而無論如何,英偉達(dá)都是那個(gè)*贏家。據(jù)New Street Research的數(shù)據(jù),英偉達(dá)占據(jù)了可用于機(jī)器學(xué)習(xí)的圖形處理器市場(chǎng)的95%份額。

今年以來英偉達(dá)在二級(jí)市場(chǎng)上的表現(xiàn)
今年以來,英偉達(dá)的股價(jià)、市值翻了近一倍。股價(jià)從年初的140美元/股左右,漲到了當(dāng)前的276.67美元/股(截至4月18日美股收盤)。市值達(dá)到了6870億美元,躋身美國科技公司市值TOP5,僅次于蘋果、微軟、谷歌和亞馬遜。
相較于其競(jìng)爭(zhēng)對(duì)手英特爾(市值1328億美元)、AMD(市值1445億美元),英偉達(dá)的市值也高出了一大截。
2
為什么是英偉達(dá)?
追溯這場(chǎng)由OpenAI掀起的AI大模型之爭(zhēng)的開端,或許要從2016年,英偉達(dá)創(chuàng)始人兼CEO黃仁勛向OpenAI捐贈(zèng)了一臺(tái)AI超算電腦說起。
那是一臺(tái)裝載了8塊P100(英偉達(dá)上一代GPU)芯片的超級(jí)計(jì)算機(jī)DGX-1。彼時(shí),這臺(tái)DGX-1價(jià)值超過百萬,它的算力已經(jīng)可以把OpenAI一年的訓(xùn)練時(shí)間,壓縮到一個(gè)月。
在它的機(jī)箱上,黃仁勛寫下了這樣一句話:“為了計(jì)算和人類的未來,我捐出世界上*臺(tái)DGX-1?!?/p>
這場(chǎng)AI革命,似乎從那時(shí)開始,就已經(jīng)注定。
在過去的半個(gè)多世紀(jì)中,英特爾聯(lián)合創(chuàng)始人戈登·摩爾提出的“摩爾定律”主導(dǎo)著半導(dǎo)體行業(yè)發(fā)展,即:“當(dāng)價(jià)格不變時(shí),集成電路上可容納的晶體管數(shù)目約每隔18-24個(gè)月便會(huì)增加一倍,性能也將提升一倍”。
1993年,30歲的黃仁勛創(chuàng)立英偉達(dá),彼時(shí)行業(yè)里龍頭林立,新生的英偉達(dá)并沒有任何優(yōu)勢(shì)。黃仁勛想到的破局點(diǎn)之一便是:“解決那些摩爾定律無法解決的,或者說在摩爾定律時(shí)代不可能被解決的問題。”
這便是尋求加速計(jì)算,即用特制的設(shè)備來為CPU的運(yùn)算工作減負(fù)提速,具體落地便是堆算力、造顯卡處理圖像,也就是做GPU。
CPU與GPU是兩個(gè)不同的方向。CPU負(fù)責(zé)的是整個(gè)電腦主板的序時(shí)性復(fù)雜運(yùn)算,單個(gè)CPU就包含了控制元件、基礎(chǔ)運(yùn)算單元(ALU)、緩存(Cache)等等。
而GPU在成為通用類芯片前,只需負(fù)責(zé)圖像處理的并時(shí)性簡單運(yùn)算。這也使得GPU提高性能的速度可以做到比CPU更快。
黃仁勛隨之提出了“黃氏定律”,即:GPU每6個(gè)月性能提升一倍。相比摩爾定律的每18個(gè)月性能提升一倍,快了3倍。

圖片來源:網(wǎng)絡(luò)
在過去數(shù)年中,隨著芯片制程工藝逐漸觸達(dá)天花板,“摩爾定律”似乎也在逐步失效。黃仁勛多次喊出,“摩爾定律”的時(shí)代已經(jīng)結(jié)束了,而屬于加速計(jì)算和AI的時(shí)代到來了。
在上個(gè)90年代的顯卡之爭(zhēng)中,英偉達(dá)率先活了下來。彼時(shí),全球還有數(shù)十家大公司在顯卡市場(chǎng)上競(jìng)爭(zhēng),而到了90年末,只剩下三家——英偉達(dá)、ATI(被AMD收購),以及英特爾。
英特爾長久以來都是芯片領(lǐng)域的龍頭,但憑借其全球PC主板市場(chǎng)的壟斷地位,英特爾的注意力一直放在CPU而非GPU。GPU的競(jìng)爭(zhēng),實(shí)際上是英偉達(dá)和AMD的競(jìng)爭(zhēng)。
在游戲顯卡領(lǐng)域,英偉達(dá)與AMD交戰(zhàn)多年,產(chǎn)品各有優(yōu)劣。英偉達(dá)通過與臺(tái)積電的深度合作,逐步成為顯卡業(yè)的世界*。但真正讓英偉達(dá)脫穎而出的,還是其將GPU用在了通用計(jì)算上。
在2006年,英偉達(dá)推出CUDA開發(fā)平臺(tái)(通用并行計(jì)算架構(gòu))。搭載GPU的工具集,通過CUDA編程,能夠讓多個(gè)GPU并行運(yùn)算,從而大幅提升計(jì)算性能。
在早期, GPU 的作用只是為了加速圖形渲染,時(shí)常用于游戲領(lǐng)域。而在CUDA的加持之下,GPU脫離了圖像處理的單一用途,開始真正具備通用計(jì)算的能力,并逐步被用到了AI的深度學(xué)習(xí)之中。
在過去,行業(yè)內(nèi)外都無法理解為什么英偉達(dá)要做CUDA,在推出CUDA的十年間,整個(gè)華爾街一直在質(zhì)疑英偉達(dá),“為什么你們做了這項(xiàng)投入,卻沒有人使用它?”“它的估值為零”。
如今,行業(yè)早已認(rèn)識(shí)到了CUDA的價(jià)值。而擁有CUDA支持的英偉達(dá)的GPU,也成為了AI訓(xùn)練的*。
目前,英偉達(dá)已經(jīng)是無可爭(zhēng)議的AI芯片市場(chǎng)*。據(jù)Omdia估計(jì),截至2020年,它在此類AI處理器中的份額約為80%。AMD是GPU行業(yè)的第二大玩家,市場(chǎng)份額約為20%。而英特爾的占比僅有不到1%的份額。
英偉達(dá)的野心還不止如此,它似乎還想“贏家通吃”。
在上個(gè)月的GTC大會(huì)上,英偉達(dá)又推出了一項(xiàng)新的AI超級(jí)計(jì)算服務(wù)——DGX Cloud云服務(wù)。它可以讓企業(yè)快速訪問為生成式人工智能和其他開創(chuàng)性應(yīng)用訓(xùn)練高級(jí)模型所需的基礎(chǔ)設(shè)施和軟件。
簡單理解,就是通過這個(gè)云平臺(tái),用戶可以直接調(diào)用英偉達(dá)的超級(jí)計(jì)算機(jī)DGX的AI算力,而不是去“堆”A100、H100。
目前,英偉達(dá)與微軟Azure、谷歌OCP、Oracle OCI等其他云廠商一起托管DGX Cloud基礎(chǔ)設(shè)施。黃仁勛還表示,未來中國也可以采用這項(xiàng)服務(wù),中國創(chuàng)業(yè)公司可以期待阿里、百度、騰訊提供的底層算力服務(wù)。
3
誰能打敗英偉達(dá)?
事實(shí)上,不僅是在今年這場(chǎng)AI大模型的狂風(fēng)驟雨中出盡了風(fēng)頭,英偉達(dá)憑借著對(duì)AI算力的“壟斷”,也成為了許多行業(yè)風(fēng)口背后的算力“供應(yīng)商”。
在虛擬貨幣爆火的那幾年中,“挖礦”成為了一個(gè)熱鬧的灰色產(chǎn)業(yè),英偉達(dá)的RTX 3070顯卡一度是“挖礦”的主力。彼時(shí),市場(chǎng)對(duì)顯卡的需求不斷提升,也曾帶動(dòng)英偉達(dá)相關(guān)芯片的銷售。
不過現(xiàn)在這早已是過去式。英偉達(dá)首席技術(shù)官M(fèi)ichael Kagan在近日表示,加密貨幣礦工購買了大量的英偉達(dá)硬件,但“除了投機(jī)之外,加密行業(yè)還沒有任何真實(shí)世界可用的實(shí)例?!?/p>
在元宇宙火起來之時(shí),英偉達(dá)也高調(diào)地站了出來。
黃仁勛曾多次公開表示:“人工智能和計(jì)算機(jī)圖形學(xué)的結(jié)合將為元宇宙提供動(dòng)力,即互聯(lián)網(wǎng)的下一次演變?!?/p>
而無論是構(gòu)建元宇宙的虛實(shí)場(chǎng)景,還是通過AI技術(shù)維持元宇宙自主運(yùn)轉(zhuǎn),都需要3D圖形處理管線、AI計(jì)算等能力的支持。并且,英偉達(dá)的Omniverse平臺(tái),也能夠協(xié)助用戶在虛擬世界中進(jìn)行協(xié)同工作,建造數(shù)字孿生世界,比如進(jìn)行汽車、建筑的設(shè)計(jì)制造等。
還有自動(dòng)駕駛,早在2015年,英偉達(dá)便推出了汽車業(yè)務(wù),研發(fā)并交付自動(dòng)駕駛芯片。
在2019年,英偉達(dá)推出了大算力芯片Orin系列。目前,Orin芯片也已成了很多主機(jī)廠的*,前三十家新能源車企的二十家、以及越來越多自動(dòng)駕駛初創(chuàng)公司宣布搭載Orin平臺(tái)。在過去幾年的GTC大會(huì)上,英偉達(dá)都會(huì)把汽車業(yè)務(wù)進(jìn)展情況作為重點(diǎn)去介紹。
不過,英偉達(dá)在自動(dòng)駕駛領(lǐng)域正在受到挑戰(zhàn)。在當(dāng)前,越來越多的車企為了實(shí)現(xiàn)更好的性能優(yōu)化,將一體化自研作為攻克的方向。如特斯拉,在2019年便自研了FSD芯片,“蔚小理”們同樣在加緊自研進(jìn)程。
虛擬貨幣熄火,元宇宙風(fēng)停,自動(dòng)駕駛還待爆發(fā),AI大模型又如狂風(fēng)驟雨一般襲來。行業(yè)潮起潮落,云卷云舒,但英偉達(dá)無疑都是“受益者”。英偉達(dá)吃飽了AI算力的紅利。
近年來,越來越多的芯片巨頭們也反應(yīng)了過來,紛紛加碼支持AI的專業(yè)芯片。

圖片來源:半導(dǎo)體行業(yè)觀察
有消息稱,在去年12月,英特爾將圖形芯片部門一分為二:一個(gè)專注于個(gè)人電腦,另一個(gè)專注于數(shù)據(jù)中心和人工智能。在今年,英特爾CEO基辛格也時(shí)常談?wù)撈餉I,他表示,英特爾擁有一套廣泛的芯片解決方案來應(yīng)對(duì)生成式AI的機(jī)會(huì)。
AMD也在為AI量身定制CPU、圖形芯片和其他硬件,同時(shí)押注于大型云計(jì)算公司對(duì)這些硬件的需求。
谷歌的布局更早,在2016年時(shí),谷歌宣布為AI研究開發(fā)了機(jī)器學(xué)習(xí)的專屬芯片TPU。今年的MLPerf基準(zhǔn)測(cè)試中,谷歌的TPUv4贏了英偉達(dá)的A100芯片,成為業(yè)界大新聞。
近日,據(jù)The Information報(bào)道,微軟已經(jīng)計(jì)劃推出自己的人工智能芯片。據(jù)悉,這些芯片是為訓(xùn)練大語言模型等軟件而設(shè)計(jì)。微軟希望這款芯片的性能比其斥資數(shù)億美元從其他供應(yīng)商側(cè)購置的芯片性能更優(yōu),這樣就可以為價(jià)值高昂的人工智能工作節(jié)省成本。至于推出時(shí)間,尚未有明確說法。
不過,英偉達(dá)已經(jīng)占據(jù)著*的統(tǒng)治地位。美國銀行分析師Vivek Arya表示,到2027年,生成式AI每年可為整個(gè)人工智能芯片市場(chǎng)增加200億美元,而英偉達(dá)應(yīng)該能夠保持至少 65% 的AI芯片市場(chǎng)份額。
隨著AI大模型的快速成長,這對(duì)于其他芯片企業(yè)來說,無疑也是巨大的機(jī)會(huì)。
便如30年前英偉達(dá)選擇了加速計(jì)算,繞開了與英特爾等芯片巨頭正面硬剛,最終實(shí)現(xiàn)彎道超車。
誰也無法預(yù)測(cè),是否也有人另尋他途,最終超越英偉達(dá)。


166404/20








