進擊多元演算法時代,DPU之爭如何獲得更大贏面?

DPU這個名號變得響亮是從2020年開始的。彼時,英偉達宣佈完成對以色列網路晶片商Mellanox高達69億美元的收購交易,隨即就推出了這筆收購的成果——新一代DPU。英偉達創始人兼CEO黃仁勳強大的帶貨能力為DPU點亮光環,同年初創公司Fungible對DPU大肆推廣。AMD收購賽靈思以補齊FPGA短板,前不久又宣佈以約19億美元收購雲服務提供商Pensando,至此AMD也正式進入DPU領域。

DPU市場蛋糕持續做大和爆發。與此同時,國內短時間內也湧現數十家DPU初創企業,中科馭數、大禹智芯、芯啟源、益思芯、星雲智聯、雲豹智慧等本土DPU企業正組成推動DPU國產替代的主力軍。

在這場圍繞數字化時代的異構計算大亂鬥中,混合CPU+GPU大有成為未來大算力計算晶片設計的趨勢,分食資料中心計算市場的DPU擁有多大潛力?

DPU——算力釋放的關鍵晶片

DPU,全名Data Processing Units(資料處理單元),宛若一塊微型計算板、擁有更強的處理效能,是可以為CPU“減負”的一種新型專用處理器。在全球計算、儲存和網路基礎設施也在發生根本轉變的當下,資料中心已成為新型計算單元,隨著通用CPU的擴充套件性表現逐漸滑坡,複雜工作負載轉向智慧網絡卡(SmartNIC)或是DPU。DPU透過處理器和SmartNIC的組合,兼顧傳輸和計算的需求,於此DPU也被看作是SmartNIC技術的演化增強版本。主要的雲服務提供商和網絡卡供應商基於不同的解決方案,開發不同的SmartNIC,並向DPU方向升級。DPU成為繼CPU和GPU之後第三顆重要的算力晶片,相關技術的適用範圍在這時也開始明朗。

DPU主要承擔網路、儲存和安全的加速處理任務,旨在滿足網路側專用計算需求,尤其適用於伺服器量多、對資料傳輸速率要求嚴苛的場景。具體看來,DPU對CPU所不擅長的網路協議處理、資料加解密、資料壓縮等資料處理任務,可以順滑地接手,並且對各類資源分別管理、擴容、排程。以X86為例,DPU加上與自身密切整合的硬體加速器,釋放了X86處理器核心,從而使計算機不過度依賴CPU供應商。與此同時,DPU也可以像GPU一樣進行高效能任務解除安裝。如今的DPU(如英特爾定義的IPU)正在接管所有的工作負載,其應用遠遠超出網路堆疊加速,它囊括了服務加速、虛擬化堆疊儲存、應用程式加速以及如今資料中心需要的基礎設施任務,

進擊多元演算法時代,DPU之爭如何獲得更大贏面?

圖:透過將部分運算挪至DPU減少CPU運算;圖源:英偉達

DPU作為一個獨立的處理器,具有完全可程式設計性,兼具安全或測量啟動功能,可以看作是通往主機的網路流量的消防帶。DPU可實現基礎設施可信的解決方案,僅啟動處於供應商高度保護、特定版本的作業系統,執行特定的軟體堆疊,而與主機軟體完全隔離。以英偉達的DPU為例,當計算機系統物理上不聯網時,DPU實現防止入侵,從而承載了物理隔離安全特性的功能。

進擊多元演算法時代,DPU之爭如何獲得更大贏面?

圖:DPU可作為CPU和儲存的中樞;圖源:英偉達

擁有如“縫合怪”般功能屬性、潛力巨大的DPU同時吸引了學術界的目光,如色列理工學院電子與計算機工程學院正在探索DPU的GPU管理領域。

算力大斗法、DPU之技術漩渦

由於DPU需要大量的軟體來配合系統工作,系列晶片與客戶和場景強繫結,很難保證通用屬性,所以目前DPU在市面上佔有率並不高。以色列理工學院副教授、以色列理工學院電子與計算機工程學院副教授MarkSilberstein在接受集微諮詢(JW Insights)採訪時表示,當DPU被用來處理流量時,網路棧層級間的頻繁切換會耗損大量成本。DPU通常被用來處理傳入流量,終止安全傳輸層協議意味著要DPU上要執行整個TCP棧,由於網路棧的層次之間相輔相成,因而不能隨意取走網路處理管線中的一節,讓它們一部分在DPU上執行,一部分在CPU上執行,故而頻繁切換會耗損大量成本。另一方面,如果將所有運算都堆至DPU上並未正確地解除安裝硬體任務時,DPU的處理速度將會變慢。最後,效能不強的DPU不適合以線路速率處理整個流量。在DPU/智慧網絡卡被更廣泛地使用前,必須解決以上問題。

Mark表示,在演算法和硬體方面上看,DPU的效能和算力比不過X86處理器,但算力的價效比很高。一個單獨裝載Arm核的NIC的效能僅為X86的1/3或1/5,但DPU的耗能遠低於X86處理器,由此降低了成本。因此,在計算機對算力沒有很高的要求時,可以利用DPU網路延遲極低的特性,在不經過PCIe到CPU的情況下進行運算處理。但DPU執行時需要ASIC或NIC內部進行智慧處理,只引導部分流量進入DPU,放行其餘流量直接進入主機。

海外巨頭已經祭出算力組合拳,例如AMD打出CPU+GPU+FPGA+DPU超級套餐,磨刀霍霍向Intel。反觀國內這兩個賽道的企業,卻還在單打獨鬥,DPU相關的本土企業創新速度也落後於國際巨頭智慧網絡卡硬體壁壘,只能寄望於華為阿里,初創中有組合拳意識的僅有壁仞科技——自研GPU,投資了CPU和DPU。

市場潛力即將釋放,全球玩家如何引領新局面

賽迪顧問的資料顯示,從2023年開始全球DPU市場規模將突破百億美元,並進入年增長率超過50%的增長快車道。而在中國DPU市場規模在2023年也將有300億元人民幣以上,呈現跳躍式增長。目前從全球 DPU 產業格局來看,產品應用仍相對分散,還未催生大量新的應用和服務,帶動相關硬體和軟體系統平臺也有待增長。與海外群雄逐鹿的賽況不同,本土DPU行業目前主要以創業公司為主導,少有大體量的科技公司進入。

進擊多元演算法時代,DPU之爭如何獲得更大贏面?

圖源:賽迪顧問

進擊多元演算法時代,DPU之爭如何獲得更大贏面?

圖源:賽迪顧問

參照過往AI晶片市場競爭格局的轉變歷史,DPU賽道很可能也將不再是一個初創企業混戰的市場。隨著越來越多資本和大企業的湧入,最終有實力的大公司將成為整個市場的主導力量。集微諮詢(JW Insights)分析師馮翔表示,國外巨頭都在著力在點、線、面三大維度佈局,如透過併購或產品線的拓展布局線,實現核心技術轉化為主營收入,圍繞上下游進行串聯實現面的拓展,對本土企業來說,點突破就很難,線面則更難,未來仍任重而道遠。

DPU對雲場景強依賴,需要企業充分理解大規模雲廠商業務需求、定義架構特性,以及大晶片的工程實現能力,到底是獨立通用還是附屬專用,能否成為網路基礎設施中的主流方案,有待觀望。企業需要關注整體的生態,刺激到雲基礎設施的計算需求。我國的網際網路生態日漸強勁以及資料大爆發推動了對算力的需求,給予算力經濟有利的發展條件。另外,我國對網路安全的愈加重視,讓DPU在確保網路安全方面更有大展拳腳的機會,實現從資料安全到資料中心安全的全方位覆蓋。

(校對/李梅)