-
潘攻愚:“即使我們對手的產(chǎn)品免費,我們還是比他們便宜”
【文/觀察者網(wǎng)專欄作者 潘攻愚】
“即使我們競爭對手的產(chǎn)品免費給到客戶,我們還是比他們要便宜。”
在2024年3月份SIEPR 經(jīng)濟峰會的主題演講中,英偉達(dá)CEO黃仁勛這樣回答斯坦福大學(xué)查爾斯·R·施瓦布經(jīng)濟學(xué)名譽教授約翰·肖文 (John Shoven)的提問。
這一席話當(dāng)時在半導(dǎo)體圈引起了軒然大波。競爭對手的產(chǎn)品免費送,居然還比英偉達(dá)的GPU貴?那豈不是對手們要大肆賠錢才能和英偉達(dá)競爭?
黃仁勛在公眾場合一貫謙遜節(jié)制,但也偶露崢嶸,那一次,他可能實在是忍受不了發(fā)問人對英偉達(dá)競爭態(tài)勢的質(zhì)疑,語調(diào)有些“浪”了。他口中所謂的競爭對手,乍一看上去說的是AMD或者英特爾,但仔細(xì)品味,是說給另一個領(lǐng)域的競爭對手聽的,即ASIC(專用芯片)的戰(zhàn)場。
須知,英偉達(dá)在高性能GPU(HPC和AI加速器領(lǐng)域)就在全球吃掉了接近450億美元的盤子,而ASIC市場2023年滿打滿算也只有200億美元,前者的高壟斷性看起來暫時不用擔(dān)心以博通、Marvell為代表定制化芯片對其市場份額的侵蝕。
但你要說黃仁勛不著急那肯定是假的。AI大潮的推動下,比如TPU在Google Cloud上的應(yīng)用,或者亞馬遜AWS的Trainium/Inferentia讓不少公司在考慮ASIC方案。2023年就有風(fēng)傳英偉達(dá)也想進(jìn)入ASIC這個領(lǐng)域,為美國諸多CSP(云服務(wù)商)提供定制化服務(wù)。
OpenAI也在“背刺”英偉達(dá)?
據(jù)路透社近日報道,OpenAI正在通過開發(fā)其首款自家人工智能芯片,以減少其對英偉達(dá)芯片的需求。路透社還聲稱OpenAI將在近幾個月內(nèi)確定其芯片的最終設(shè)計,并將方案交由臺積電進(jìn)行流片測試。
多年以來,OpenAI一直是英偉達(dá)的大主顧之一。他們考慮非通用性GPU方案,無異于是對英偉達(dá)的一種背刺。
OpenAI的訓(xùn)練和推理任務(wù)高度依賴英偉達(dá)的高性能GPU(如 A100、H100)。OpenAI在2020年的論文中曾提到,GPT-3的訓(xùn)練使用了約1萬塊V100 GPU。不過,OpenAI并未公開披露其從英偉達(dá)采購的GPU具體數(shù)量,這類信息通常被視為商業(yè)機密或涉及合作伙伴協(xié)議,因此外界難以獲得準(zhǔn)確數(shù)據(jù)。
除了采購GPU,他們之間的合作模式還有兩點需要指出:OpenAI 深度依賴英偉達(dá)的CUDA并行計算平臺和cuDNN加速庫,以最大化GPU在深度學(xué)習(xí)任務(wù)中的性能;英偉達(dá)OpenAI還有間接合作,通過合作伙伴(如微軟Azure、亞馬遜AWS)為OpenAI提供云GPU資源,支持其彈性計算需求。
英偉達(dá)首個DGX H200給到OpenAI
OpenAI在思考用更專用硬件ASIC的可能,步微軟Maia AI芯片和谷歌TPU的后塵,主要也是苦英偉達(dá)久矣。
英偉達(dá)通用高端GPU不僅價格昂貴,而且功耗極高,且有很強的定價權(quán),損傷了OpenAI的“自尊心”和財務(wù)毛利率,而且某種程度上削弱了其振臂一呼搞“星際之門”的話語權(quán)和領(lǐng)導(dǎo)權(quán)。
OpenAI敢邁出這一步,也是看到了商用實地落地的可能性——踩著谷歌TPU的轅輻前進(jìn)。
TPU是谷歌專門為機器學(xué)習(xí)(尤其是神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理)而設(shè)計的ASIC,從硬件到軟件全棧優(yōu)化,避免了GPU的通用計算冗余。
谷歌單芯片TPU v4的FP16性能約275 TFLOPS,而英偉達(dá)H100的FP16算力為400 TFLOPS,看起來差距巨大,但TPU v4可以用“打群架”的方式避免單打獨斗的劣勢,而且,TPU的專用推理硬件在低延遲場景中表現(xiàn)更優(yōu)。
雖然英偉達(dá)高端GPU也需要HBM,但TPU采用的HBM高帶寬內(nèi)存與計算單元緊密耦合,減少數(shù)據(jù)搬運開銷,英偉達(dá)GPU需通過顯存管理優(yōu)化才能避免瓶頸。
另外還有很重要的一點,就呼應(yīng)到了本文開頭的話題:成本。
在谷歌云平臺,TPU的按需計費成本可能低于同等算力的GPU實例,尤其對長期訓(xùn)練任務(wù)或批量推理更具性價比。TPU作為托管服務(wù),用戶無需關(guān)注底層硬件運維,而自建GPU集群需投入更多運維資源。
這一切,加速了OpenAI與英偉達(dá)軟脫鉤的念想,雙方有了某種程度上的離心力。
盡管如此,采用ASIC方案的局限性依然十分明顯,TPU綁定了特定框架(TensorFlow/JAX),而GPU支持更廣泛的開源工具和私有化部署,而且,ASIC一旦流片無法修改,而GPU可通過架構(gòu)升級和軟件優(yōu)化適應(yīng)新需求。
英偉達(dá)GPU的“專用特性”
黃仁勛在業(yè)界以危機感嗅覺著稱,他的名言“要時刻為企業(yè)一個月內(nèi)破產(chǎn)做好準(zhǔn)備”享譽全球,他不斷督促自己洞察一切可能的挑戰(zhàn)和危機。
ASIC的沖擊,他也洞若觀火。
在最近這兩代(Grace Hopper和Blackwell)的AI加速器中,他其實已經(jīng)用了“通用+專用”的混合架構(gòu)。他明白,AI訓(xùn)練/推理、科學(xué)計算等場景對算力需求爆炸式增長,通用架構(gòu)難以滿足能效和性能要求。專用硬件可顯著降低大模型訓(xùn)練成本(如Blackwell的FP4/FP6支持稀疏計算)。
國內(nèi)某知名GPU圖形渲染供應(yīng)商市場主管告訴心智觀察所,通用芯片性能提升趨緩,通過領(lǐng)域?qū)S眉軜?gòu)(DSA)實現(xiàn)差異化會成為必然選擇。
Grace Hopper和Blackwell正在不斷增加專用硬件單元,比如針對深度學(xué)習(xí)矩陣運算優(yōu)化(FP16/FP8精度、稀疏計算)的Tensor Core專用于光線追蹤的硬件加速的RT Core,針對大規(guī)模AI集群做了通信優(yōu)化(如Grace Hopper的芯片間互連),Blackwell架構(gòu)還直接面向大語言模型(LLM)做了硬件加速Transformer引擎。
這一切的一切都說明英偉達(dá)看到了谷歌TPU、亞馬遜Trainium等專用AI芯片的威脅,迫使英偉達(dá)通過專用化鞏固技術(shù)壁壘。
仍然需要指出的是,英偉達(dá)的高端GPU確實在向領(lǐng)域?qū)S眉軜?gòu)(DSA)演進(jìn),但其本質(zhì)仍是以通用性為基礎(chǔ)、通過專用模塊提升關(guān)鍵場景效率的混合模式,與ASIC的完全固化設(shè)計有本質(zhì)區(qū)別。
標(biāo)簽 心智觀察所- 原標(biāo)題:“即使我們對手的產(chǎn)品免費,我們還是比他們便宜” 本文僅代表作者個人觀點。
- 責(zé)任編輯: 李昊 
-
中國“祝融號”有新發(fā)現(xiàn)
2025-02-28 10:52 航空航天 -
3800億AI基建狂飆,改寫中概股敘事?
2025-02-27 08:30 心智觀察所 -
“極低溫 超高壓 強磁場 超快光場”合體!
2025-02-26 19:29 -
李強赴三大電信運營商所屬企業(yè)調(diào)研
2025-02-26 10:10 -
蔡司光學(xué)發(fā)布重磅新品,守護(hù)你的“睛”彩世界
2025-02-26 10:06 -
獨家對話| 誰真正低估了Deepseek?
2025-02-24 08:36 心智觀察所 -
韓國報告:韓半導(dǎo)體關(guān)鍵技術(shù)兩年內(nèi)全面落后中國
2025-02-23 21:49 三八線之南 -
沖上熱搜!湖南官方:嚴(yán)禁用AI生成處方
2025-02-23 12:13 -
我國最新成果!量子直接通信有望進(jìn)入實際應(yīng)用
2025-02-22 22:04 科技前沿 -
我國成功發(fā)射中星10R衛(wèi)星
2025-02-22 21:19 航空航天 -
“中美同日宣布新突破,高下立判”
2025-02-21 22:45 觀察者頭條 -
日本喊疼:很難遵守中方出口管制,這不止針對美國啊…
2025-02-21 17:37 日本 -
我國自主研制AS700D載人飛艇完成首次科研試飛
2025-02-21 13:21 科技前沿 -
填補關(guān)鍵技術(shù)空白!我國量子科技研究迎突破性進(jìn)展
2025-02-20 13:30 科技前沿 -
多地政務(wù)服務(wù)系統(tǒng)接入DeepSeek大模型
2025-02-20 06:46 -
虞仁榮的亮相,窺見中國經(jīng)濟更深處的變革
2025-02-19 17:37 心智觀察所 -
“搞一堆新名詞,十有八九是騙子”,項目能不能落地,問三個問題
2025-02-18 22:42 -
國際首個!我國腦機接口取得新突破
2025-02-18 10:03 科技前沿 -
事關(guān)高溫超導(dǎo),中國科學(xué)家有突破性發(fā)現(xiàn)!
2025-02-18 09:46 科技前沿 -
百度搜索:將全面接入DeepSeek及文心大模型深度搜索功能
2025-02-16 21:42 大公司
相關(guān)推薦 -
“如果處理不當(dāng),還有比美國衰退更可怕的事情” 評論 104美業(yè)界“喊疼”:請中方“收回成命” 評論 343朝令夕改!“沒人知道特朗普五天后的規(guī)定是啥樣” 評論 242最新聞 Hot
-
“不能太依賴美國,歐洲得買點俄氣”
-
“僅靠美國?休想”
-
“拋售美債是對美國經(jīng)濟政策喪失信心”
-
“如果處理不當(dāng),還有比美國衰退更可怕的事情”
-
“哈馬斯愿釋放所有以色列人質(zhì),但有個前提”
-
“印度這行業(yè)要玩完了”
-
回過味了?“不該抗中,是時候‘去美國風(fēng)險’”
-
“豁免是對中國實力的認(rèn)可,不豁免更是機會”
-
“離了中國貨,清涼一夏都難…”
-
“還跟我提投資?等美國穩(wěn)定了再說吧”
-
俄副外長:中國需要多少石油,俄羅斯就準(zhǔn)備供應(yīng)多少
-
英國反華議員赴香港探親被拒入境
-
石破茂對美發(fā)出“迄今最強烈警告”
-
美業(yè)界“喊疼”:請中方“收回成命”
-
關(guān)稅成本暴漲40多倍,美企CEO叫苦:這是末日
-
朝令夕改!“沒人知道特朗普五天后的規(guī)定是啥樣”
-