AI如何重塑存儲(chǔ)業(yè)態(tài)?

AI如何重塑存儲(chǔ)業(yè)態(tài)?
2024年04月11日 04:00 第一財(cái)經(jīng)

  作者: 鄭栩彤

  存儲(chǔ)“卡住”GPU(圖形處理單元)的脖子,這并不夸張。

  過(guò)去一年間,大模型帶來(lái)的算力需求爆發(fā),使英偉達(dá)GPU愈加依賴HBM(高帶寬存儲(chǔ)器)的高帶寬。這顆由多個(gè)DRAM(動(dòng)態(tài)隨機(jī)存儲(chǔ)器)堆疊而成的芯片,旨在解決傳統(tǒng)馮·諾依曼架構(gòu)中處理器與內(nèi)存之間的數(shù)據(jù)傳輸問(wèn)題,在大算力場(chǎng)景幾乎無(wú)可替代。

  這也意味著,AI需求也在帶動(dòng)存儲(chǔ)芯片行情回暖。經(jīng)歷疫情擾動(dòng)下長(zhǎng)達(dá)兩年的下行周期,DRAM被HBM率先帶動(dòng)復(fù)蘇,DRAM“三巨頭”SK海力士、三星、美光進(jìn)入新一輪HBM競(jìng)賽。

  第一財(cái)經(jīng)記者了解到,AI對(duì)存儲(chǔ)芯片市場(chǎng)的影響不止于此。DRAM解決的主要是計(jì)算時(shí)數(shù)據(jù)傳輸?shù)膯?wèn)題,巨量數(shù)據(jù)保存則需依靠NAND Flash(一種非易失性存儲(chǔ)介質(zhì))制成的SSD(固態(tài)硬盤)、嵌入式存儲(chǔ)等。兩種存儲(chǔ)介質(zhì)共同占據(jù)90%以上存儲(chǔ)芯片市場(chǎng),NAND Flash近期也聞風(fēng)而動(dòng)。

  “數(shù)據(jù)集巨量增長(zhǎng),呈指數(shù)級(jí)態(tài)勢(shì),GPT-4上萬(wàn)億參數(shù),大模型使用的很多還是爬蟲數(shù)據(jù)庫(kù),這種語(yǔ)料庫(kù)三四個(gè)星期更新一次?!苯臻W存市場(chǎng)峰會(huì)上,SSD廠商Solidigm亞太區(qū)銷售副總裁倪錦峰提及數(shù)據(jù)存儲(chǔ)對(duì)AI的重要性時(shí)表示。一些原廠前期鎖住產(chǎn)能的情況下,大為創(chuàng)芯銷售總監(jiān)徐志文向第一財(cái)經(jīng)記者表示,他對(duì)AI伺服器和AI相關(guān)的內(nèi)存條、企業(yè)級(jí)SSD需求較為看好,現(xiàn)在整個(gè)市場(chǎng)有些產(chǎn)品已經(jīng)供不應(yīng)求。

  記者從多名存儲(chǔ)業(yè)內(nèi)人士處了解到,NAND Flash適配AI需求的方式,包括增大容量和降低功耗。業(yè)內(nèi)普遍認(rèn)為AI還會(huì)繼續(xù)提拉DRAM和NAND Flash的需求,但AI還在走向普惠的過(guò)程,業(yè)內(nèi)對(duì)AI的提拉速度和力度有不同看法。

  此外,針對(duì)AI大模型訓(xùn)練推理的需求,云廠商近期也在云存儲(chǔ)產(chǎn)品層面著力。

  AI催化?

  在最新發(fā)布的Blackwell芯片上,英偉達(dá)便采用HBM方案,其HBM3e芯片由SK海力士提供。HBM是多顆DRAM 3D堆疊并與GPU一起封裝的存儲(chǔ)芯片,主要用于緩解處理器和主存間的通信瓶頸,應(yīng)對(duì)大算力場(chǎng)景下的“內(nèi)存墻”問(wèn)題。雖然業(yè)內(nèi)早已有廠商探索HBM,但直到AI需求爆發(fā),HBM才成為備受矚目的技術(shù)。

  近期美光透露,今年其HBM產(chǎn)能銷售一空,明年絕大多數(shù)產(chǎn)能已被預(yù)訂,SK海力士也透露,2024年其HBM生產(chǎn)配額已經(jīng)售罄。

  據(jù)市場(chǎng)調(diào)查機(jī)構(gòu)Yole數(shù)據(jù),HBM今年以來(lái)平均售價(jià)是普通DRAM的5倍。此前有GPU業(yè)內(nèi)人士向媒體介紹HBM成本“差不多1GB要20美元”。若以1GB HBM 20美元計(jì)算,參考美國(guó)金融機(jī)構(gòu)Raymond James去年預(yù)估的英偉達(dá)H100成本3320美元,H100的80GB HBM大約需要1600美元,占該AI芯片成本近半。

  AI對(duì)HBM的需求,正在改變存儲(chǔ)芯片產(chǎn)業(yè)結(jié)構(gòu)。據(jù)市場(chǎng)調(diào)研機(jī)構(gòu)集邦咨詢統(tǒng)計(jì),去年HBM占DRAM產(chǎn)業(yè)營(yíng)收的8.4%,今年將達(dá)20.1%。

  為搶占這一增量市場(chǎng),三大DRAM廠商SK海力士、三星、美光開啟了技術(shù)競(jìng)賽。據(jù)集邦咨詢分析,三家目前僅SK海力士有HBM3e產(chǎn)品量產(chǎn),預(yù)計(jì)三星HBM3e今年第二季度正式出貨,三星正逐步擠進(jìn)英偉達(dá)供應(yīng)鏈,預(yù)計(jì)今年SK海力士和三星的HBM市占率均為47%~49%,美光則是3%~5%。價(jià)格方面,AI需求帶動(dòng)下,今年第一季度DRAM合約價(jià)季增約20%。

  “HBM占據(jù)極大利潤(rùn)空間,也是原廠必爭(zhēng)之地,據(jù)各原廠規(guī)劃,今年將正式進(jìn)入HBM3e量產(chǎn)?!?深圳市閃存市場(chǎng)資訊有限公司總經(jīng)理邰煒表示,AI服務(wù)器中搭載高容量HBM,對(duì)DDR5容量需求也達(dá)普通服務(wù)器的2~4倍。今年DRAM預(yù)計(jì)達(dá)2370億GB單量,同比增長(zhǎng)15%,未來(lái)5年AI服務(wù)器預(yù)計(jì)驅(qū)動(dòng)DRAM需求大增。

  近日第一財(cái)經(jīng)記者與多名存儲(chǔ)芯片行業(yè)人士交流了解到,即便不是HBM,業(yè)界預(yù)判其他DRAM產(chǎn)品也有望受益于AI對(duì)其容量要求提升。徐志文向記者表示,PC內(nèi)置生成式AI要求運(yùn)算速度快,使AI PC對(duì)內(nèi)存和固態(tài)硬盤的容量要求提升,后續(xù)AI PC內(nèi)存條容量將在6GB甚至32GB以上,高容量顆粒后續(xù)將成為主流。邰煒則預(yù)計(jì),生成式AI帶動(dòng)下今年手機(jī)平均容量將超200G,DRAM則超7G,16G DRAM將是AI手機(jī)最低標(biāo)配。

  此外,多名業(yè)界人士認(rèn)為AI也將影響NAND Flash需求,原因是AI訓(xùn)練和推理需要大量數(shù)據(jù),這些數(shù)據(jù)需存在NAND Flash制成的SSD或嵌入式存儲(chǔ)里。相比DRAM與AI算力相關(guān),NAND Flash更與AI所需數(shù)據(jù)的存力相關(guān)。

  “AI相關(guān)服務(wù)器中,NAND和DRAM共同被使用,因GPU高速運(yùn)算對(duì)應(yīng)的數(shù)據(jù)高速傳輸主要是DRAM在支撐,DRAM更矚目。但從整體市場(chǎng)看,AI對(duì)IT行業(yè)形成推動(dòng),相關(guān)的不同應(yīng)用需求會(huì)進(jìn)一步增加,也會(huì)帶動(dòng)NAND需求?!?NAND Flash廠商鎧俠相關(guān)負(fù)責(zé)人告訴記者,企業(yè)級(jí)市場(chǎng)及數(shù)據(jù)中心服務(wù)器需求預(yù)計(jì)2024年下半年市場(chǎng)有回暖跡象。從終端銷售量看,數(shù)碼產(chǎn)品或數(shù)字電子消費(fèi)品沒(méi)有特別大的成長(zhǎng),但單機(jī)搭載存儲(chǔ)容量有明顯增長(zhǎng),對(duì)鎧俠這樣的NAND廠商而言是成長(zhǎng)機(jī)會(huì)。

  邰煒也預(yù)計(jì),今年NAND Flash總產(chǎn)量將超8000億GB單量,同比提升20%。

  復(fù)蘇將至?

  雖然AI今年有望助力DRAM和NAND Flash總產(chǎn)量提升,但經(jīng)歷了前一輪疫情擾動(dòng)下的半導(dǎo)體下行周期,如今存儲(chǔ)芯片價(jià)格從谷底回升的力度是否強(qiáng)勁,業(yè)內(nèi)看法不一,一些從業(yè)者認(rèn)為AI催化下存儲(chǔ)芯片行情復(fù)蘇將是漸進(jìn)的。

  集邦咨詢近日表示,雖然DRAM供應(yīng)商庫(kù)存已降低,但尚未回到健康水位,DRAM第二季度合約價(jià)漲幅將收斂至3%~8%。前期減產(chǎn)控價(jià)背景下,第一季度NAND Flash原廠除鎧俠和西部數(shù)據(jù),其他供應(yīng)商大致維持低投產(chǎn)策略,NAND Flash合約價(jià)季增漲幅將從第一季度的23%~28%收斂至第二季度的13%~18%。

  “生成式AI需求一定會(huì)增長(zhǎng),但現(xiàn)今問(wèn)題是不僅生成式AI在預(yù)訓(xùn)練的AI模型運(yùn)算算力成本很高,落地應(yīng)用的AI模型運(yùn)算成本也不低,很多公司、組織機(jī)構(gòu)、教學(xué)單位想要導(dǎo)入生成式AI助理,但苦于無(wú)合適的解決方案。除非有足夠平民化的GenAI運(yùn)算方案出現(xiàn)才會(huì)快速提拉需求。”群聯(lián)電子執(zhí)行長(zhǎng)潘健告訴記者。

  綜合NAND整體市場(chǎng)需求,潘健認(rèn)為NAND Flash價(jià)格若一直上漲將會(huì)出現(xiàn)泡沫,預(yù)計(jì)價(jià)格不會(huì)持續(xù)漲到明年。

  對(duì)于存儲(chǔ)芯片行情回升的動(dòng)能,一名做DRAM和NAND Flash產(chǎn)品的廠商技術(shù)負(fù)責(zé)人則向第一財(cái)經(jīng)記者表示,如果沒(méi)有如今AI帶來(lái)的新應(yīng)用和內(nèi)存容量增高趨勢(shì),今年存儲(chǔ)行情估計(jì)起不來(lái)。

  也有SSD廠商負(fù)責(zé)人告訴記者,AI服務(wù)器的建設(shè)對(duì)GPU投入非常大,但SSD相較整個(gè)服務(wù)器整體價(jià)值而言并不高,他認(rèn)為AI為SSD帶來(lái)的機(jī)遇相對(duì)還不夠清晰。

  存儲(chǔ)如何適應(yīng)AI?

  算力和存力緊密相關(guān),特別是在數(shù)據(jù)、算力、算法驅(qū)動(dòng)的大模型訓(xùn)練過(guò)程中。這一輪AI算力需求提升也在改變存儲(chǔ)產(chǎn)品形態(tài):除了DRAM廠商開啟HBM競(jìng)賽外,NAND Flash或SSD廠商也開始在容量和功耗上適應(yīng)AI訓(xùn)練和推理的需求。

  “現(xiàn)在GPU很貴,要怎么通過(guò)數(shù)據(jù)存儲(chǔ)層面(做優(yōu)化)來(lái)提高GPU利用率,變得越來(lái)越重要。有時(shí)候花了錢也得不到更好的GPU,所以不希望因數(shù)據(jù)等待存儲(chǔ)響應(yīng),導(dǎo)致GPU出現(xiàn)問(wèn)題?!蹦咤\峰表示,服務(wù)器中的存儲(chǔ)占到功耗的35%左右,需要采用高密度存儲(chǔ)或其他方案降低存儲(chǔ)功耗。據(jù)他介紹,近段時(shí)間,北美客戶在關(guān)注32TB、64TB乃至128TB SSD需求時(shí),已表現(xiàn)出了功耗等方面的擔(dān)憂。

  “我們要不斷擴(kuò)展存儲(chǔ)吞吐量和容量,以跟上不斷增加的數(shù)據(jù)數(shù)量,此外,需要有效擴(kuò)展容量和吞吐量,最大限度去提升GPU的利用率,減少計(jì)算成本開支。SSD可以幫助AI集群在訓(xùn)練中保持GPU高速運(yùn)轉(zhuǎn)?!?倪錦峰表示。

  鎧俠相關(guān)負(fù)責(zé)人告訴記者,AI應(yīng)用最大功耗還是來(lái)自GPU、CPU和HBM三大件,它們也是產(chǎn)生熱量的地方,作為SSD,長(zhǎng)期而言鎧俠在推進(jìn)大容量的同時(shí)也會(huì)發(fā)力低功耗、省電。針對(duì)各應(yīng)用中AI的功能,比如AI加速、推理對(duì)NAND的具體應(yīng)用,鎧俠也已投入研發(fā),此前曾推出針對(duì)圖像分類系統(tǒng)的AI加速技術(shù)。

  “做存儲(chǔ)第一要?jiǎng)?wù)是數(shù)據(jù)安全。此外,AI對(duì)能源的消耗太厲害了,存儲(chǔ)產(chǎn)品滿足性能需求前提下,功耗能省一點(diǎn)是一點(diǎn),不僅是省電,也是省散熱的預(yù)算。少一點(diǎn)熱量,GPU就能多一些功率去做計(jì)算,更快計(jì)算出結(jié)果。同時(shí),還要把密度做上去,密度越高產(chǎn)品就可以越小,用戶就越有空間去部署GPU,我們還會(huì)配合客戶做性能優(yōu)化,比如數(shù)據(jù)直接從SSD到達(dá)GPU,而不經(jīng)過(guò)CPU內(nèi)存?!?關(guān)于AI時(shí)代要如何做好存儲(chǔ),企業(yè)級(jí)SSD廠商憶恒創(chuàng)源CEO張?zhí)?lè)告訴記者。

  SK海力士執(zhí)行副總裁、NAND-Solution開發(fā)部負(fù)責(zé)人安炫則表示,SK海力士在發(fā)力的CXL接口技術(shù)將會(huì)回應(yīng)海量的AI數(shù)據(jù)需求等,相關(guān)方案能通過(guò)計(jì)算型存儲(chǔ)減少數(shù)據(jù)往來(lái)于GPU間的移動(dòng),其計(jì)算型內(nèi)存解決方案CXL2.0在特定工作負(fù)載環(huán)境下能節(jié)省20%工作能耗。

  記者了解到,作為非易失性存儲(chǔ),NAND Flash制成的SSD等存儲(chǔ)產(chǎn)品,還承擔(dān)了及時(shí)保存大模型運(yùn)算內(nèi)容的任務(wù),這要求SSD存入大量數(shù)據(jù)的速度足夠快。

  硬件之外,軟件層面的存儲(chǔ)基礎(chǔ)架構(gòu)也在適應(yīng)AI時(shí)代的要求。不少大模型訓(xùn)練和數(shù)據(jù)存儲(chǔ)在云服務(wù)器上進(jìn)行,云存儲(chǔ)廠商的對(duì)象存儲(chǔ)、文件存儲(chǔ)等技術(shù)正在針對(duì)AI訓(xùn)練進(jìn)行調(diào)整,同樣解決大模型訓(xùn)練效率和宕機(jī)保存問(wèn)題。

  記者從騰訊云獲悉,數(shù)據(jù)存儲(chǔ)約占大模型訓(xùn)練整體工程量的20%~30%。在大模型數(shù)據(jù)清洗階段,模型數(shù)據(jù)量可達(dá)PB乃至EB級(jí),對(duì)存儲(chǔ)提出多協(xié)議支持、高性能、大帶寬需求。大模型訓(xùn)練階段則涉及訓(xùn)練成果保存,需要降低存儲(chǔ)耗時(shí)。

  “模型訓(xùn)練階段短則數(shù)周,長(zhǎng)則數(shù)月,任何一個(gè)GPU階段掉線都會(huì)導(dǎo)致訓(xùn)練前功盡棄,需要容錯(cuò)措施,即每2~4小時(shí)暫停GPU訓(xùn)練、保存每個(gè)GPU Checkpoint(檢查點(diǎn))。” 騰訊云存儲(chǔ)總經(jīng)理馬文霜告訴記者,Checkpoint時(shí)間要非常短,否則GPU訓(xùn)練效率會(huì)被拉低,存儲(chǔ)因此需要有高寫入帶寬。為此,騰訊云將并行文件存儲(chǔ)CFS Turbo讀寫速度從100GB提升至1TB,減少Checkpoint寫入耗時(shí),并在數(shù)據(jù)清洗階段通過(guò)升級(jí)數(shù)據(jù)加速器GooseFS減少單次清洗任務(wù)耗時(shí)。

  騰訊云存儲(chǔ)總經(jīng)理陳崢告訴記者,從文生文、文生圖到文生視頻,數(shù)據(jù)爆發(fā)式增長(zhǎng),這個(gè)過(guò)程對(duì)存儲(chǔ)解決方案的要求越來(lái)越高,云存儲(chǔ)團(tuán)隊(duì)對(duì)各業(yè)務(wù)場(chǎng)景已在預(yù)研未來(lái)2~3年的存儲(chǔ)底座。馬文霜認(rèn)為,AI應(yīng)用爆發(fā)式增長(zhǎng),但還沒(méi)到繁榮的階段,當(dāng)下存儲(chǔ)需要解決高性能、高性價(jià)比、高速的問(wèn)題,后續(xù)應(yīng)用于數(shù)據(jù)審核、數(shù)據(jù)治理的智能存儲(chǔ)也將是一個(gè)重要方向。

  (實(shí)習(xí)生郝梓竹對(duì)此文亦有貢獻(xiàn))

海量資訊、精準(zhǔn)解讀,盡在新浪財(cái)經(jīng)APP

責(zé)任編輯:王許寧

VIP課程推薦

加載中...

APP專享直播

1/10

熱門推薦

收起
新浪財(cái)經(jīng)公眾號(hào)
新浪財(cái)經(jīng)公眾號(hào)

24小時(shí)滾動(dòng)播報(bào)最新的財(cái)經(jīng)資訊和視頻,更多粉絲福利掃描二維碼關(guān)注(sinafinance)

股市直播

  • 圖文直播間
  • 視頻直播間

7X24小時(shí)

  • 04-01 宏鑫科技 301539 10.64
  • 03-29 燦芯股份 688691 19.86
  • 03-27 無(wú)錫鼎邦 872931 6.2
  • 03-25 中瑞股份 301587 21.73
  • 03-22 廣合科技 001389 17.43
  • 新浪首頁(yè) 語(yǔ)音播報(bào) 相關(guān)新聞 返回頂部