
算力是驅動經濟社會數(shù)字化轉型的新引擎,是新時代的核心生產力。很長一段時間,CPU主導了整個數(shù)據(jù)中心,虛擬化算力成為云計算的重點。伴隨數(shù)字經濟的推進,每年各行業(yè)產生的數(shù)據(jù)量以30%的速度向上增長,網(wǎng)絡帶寬也從10G向20G、100G,甚至400G邁進,然而影響算力的關鍵硬件CPU性能的增長速度每年卻不足3%。當CPU再無力解決數(shù)據(jù)中心基礎設施遇到的瓶頸時,新一代DPU芯片出現(xiàn)了。DPU是Data Processing Unit(數(shù)據(jù)處理單元)的簡稱,是最新發(fā)展起來的專用處理器的一個大類,被業(yè)界認為是繼CPU、GPU之后,數(shù)據(jù)中心場景中的第三顆重要的算力芯片,為高帶寬、低延遲、數(shù)據(jù)密集的計算場景供給計算引擎。DPU 可以重新分配算力和優(yōu)化算力資源,帶來新的數(shù)據(jù)中心創(chuàng)新范式,因而被認為是未來幾年行業(yè)內最重要的創(chuàng)新。

DPU 是在目前算力困境、摩爾定律放緩的大背景下產生的。隨著單一服務器的網(wǎng)絡端口的速度達到 200G 或以上,原來的網(wǎng)絡、存儲、虛擬化、安全等基礎設施多方面任務,已經無法有效率地由CPU承載,而將這一類基礎設施任務轉移到新的計算單元DPU上。DPU也因此從處理網(wǎng)絡負載和卸載CPU任務的智能網(wǎng)卡,演變成新一代數(shù)據(jù)中心算力和服務的核心。作為新型數(shù)據(jù)專用處理器,DPU針對基礎設施層的計算負載,通過創(chuàng)新專用DPU計算架構等方式,解決CPU處理效率低下以及任務負載無法處理等問題,是未來算力網(wǎng)絡的核心基礎設施。國際芯片巨頭如因英偉達、英特爾、AMD等廠商都已積極開展DPU芯片研發(fā)工作,預計到2025年,全球及國內市場有望分別達到245.3億美元與565.9億元,可見DPU芯片發(fā)展勢頭不容忽視。
首顆國產DPU芯片,填補國內市場空白目前我國DPU領域還處于起步階段,在國家大力推進數(shù)字經濟的背景下,國內DPU廠商面對全新賽道,正奮起直追,在機遇與挑戰(zhàn)之間努力搶占新技術制高點。位于中關村壹號的國內DPU芯片研發(fā)領軍企業(yè)
中科馭數(shù)是國內DPU芯片領域唯一擁有自研核心架構能力的企業(yè),近一年多來獲得了三輪數(shù)億元規(guī)模的融資,被評為中國信科“潛在獨角獸”。中科馭數(shù)創(chuàng)始團隊大多來自科研院所計算機體系結構國家重點實驗室,在計算機體系結構領域有著近二十年的技術積累,至今已經進行了三代DPU芯片的研發(fā)迭代。

2022年12月21日,中科馭數(shù)宣布:
其研發(fā)的第二代DPU芯片——K2成功點亮。這是國內首顆功能較完整的ASIC形態(tài)的DPU芯片,ASIC(Application Specific Integrated Circuit)形態(tài)即專用集成電路形態(tài),是指應特定用戶要求和特定電子系統(tǒng)的需要而設計、制造的集成電路形態(tài),與普通集成電路相比,具有體積更小、功耗更低、可靠性更高、性能更好、保密性更強、成本更低等優(yōu)點。ASIC形態(tài)DPU芯片對于中國芯片行業(yè)升級以及中科馭數(shù)的發(fā)展都具有里程碑式的意義。

“K2出現(xiàn)之際,正值國家提出東數(shù)西算戰(zhàn)略,可謂生逢其時。它的成功,為中科馭數(shù)DPU芯片產品規(guī)模化量產打下了堅實的基礎?!敝锌岂S數(shù)創(chuàng)始人、CEO鄢貴海表示。K2采用了28nm成熟工藝制程,可以支持網(wǎng)絡、存儲、虛擬化等功能卸載,是目前國內首顆功能較完整的ASIC形態(tài)的DPU芯片,具有極其出色的時延性能,可以達到1.2微秒超低時延,支持最高200G網(wǎng)絡帶寬。

此外,基于DPU芯片核心技術,中科馭數(shù)研發(fā)了超低時延DPU網(wǎng)卡、RDMA加速卡、數(shù)據(jù)查詢加速DPU卡,以及面向金融計算領域的極速風控、極速行情等產品。其中,中科馭數(shù)面向金融計算領域的極速行情加速卡,可達到業(yè)界領先的1微秒級別的轉發(fā)穿透時延,在加工處理行情時,能夠實時根據(jù)行情生成快照,最大吞吐量可達每秒近千萬條信息處理速度。
應用場景廣泛,解決多種行業(yè)難題近年來,隨著新基建、東數(shù)西算、“雙碳”目標等政策規(guī)劃的提出,以及云計算、智能駕駛、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術的創(chuàng)新突破,為我國經濟數(shù)字化轉型提供了廣闊場景,不斷催生多元算力需求。K2作為我國第一顆功能比較完整的DPU數(shù)據(jù)處理芯片,它的成功研制為我國數(shù)字經濟時代基礎設施建設提供了保障,為整個社會的數(shù)字化轉型提供強勁且綠色的動力。

在實際應用中,K2廣泛布局在金融計算、高性能計算、數(shù)據(jù)中心、云原生、5G邊緣計算、自動駕駛等領域,它的直接效果是給CPU“減負”,帶來算力和運營效率的雙倍提升,可用在一些超低時延和超大吞吐的應用上,在建設數(shù)字化、智能化產業(yè)中發(fā)揮巨大的價值。在未來的實際應用中,K2將推動云計算網(wǎng)絡、安全、存儲等方向上的技術革新,助力大數(shù)據(jù)計算基礎架構創(chuàng)新,賦能數(shù)據(jù)中心、運營商網(wǎng)絡高性能計算網(wǎng)絡,助力大數(shù)據(jù)和人工智能多領域基礎設施產業(yè)升級。
國內芯片技術的新時代標桿與技術集成開拓者目前,業(yè)界DPU主要運用FPGA形態(tài)方式,簡單來說FPGA就是一塊可由工程師反復編程的邏輯器件,本體是一種數(shù)字集成電路,一個可以通過編程來改變內部結構的芯片,具備布線資源豐富、可重復編程、集成度高、投資較低的特點。FPGA也存在不足,它的所有功能均需依靠硬件實現(xiàn),只能實現(xiàn)定點運算,無法實現(xiàn)分支條件跳轉等操作,雖然速度上可以和專用芯片相比,但設計的靈活性與通用處理器相比有很大的差距。隨著我國計算機領域的飛速發(fā)展,F(xiàn)PGA形態(tài)的芯片已不能滿足當前產業(yè)經濟發(fā)展需求。

而中科馭數(shù)ASIC形態(tài)K2芯片則恰到好處地彌補了FPGA的不足。K2芯片具有成本低、性能優(yōu)、功耗小等優(yōu)勢,包含帶寬支撐200G、60兆TPS轉發(fā)速度,主打延遲高性能網(wǎng)絡,不僅在網(wǎng)絡加速方面的功能顯著高于智能網(wǎng)卡和基礎網(wǎng)卡所能提供的延遲指標,還能對數(shù)據(jù)中心起到支撐作用,支撐各種軟件定義的技術。同時,中科馭數(shù)的自主研發(fā)優(yōu)勢,能更好地避免商業(yè)經濟捆綁與威脅,且能更好地適配用戶系統(tǒng)與產業(yè)特性,有利于當產業(yè)性能與貿易經濟發(fā)生細微變化時,能及時有效作出調整,具備強大的市場競爭力。
結語2019年,中科馭數(shù)研發(fā)了第一代DPU芯片K1,2022年,研發(fā)了第二代DPU芯片K2。從K1到K2,中科馭數(shù)拼搏進取,銳意創(chuàng)新,逐步填補了國產DPU市場的空白。“未來,中科馭數(shù)將繼續(xù)堅持自主可控、核心功能自研的策略,在軟件層面堅持開放,與上下游廠商充分融合,推進國內DPU產業(yè)發(fā)展?!敝锌岂S數(shù)創(chuàng)始人兼CEO鄢貴海表示。
小貼士[1] CPU是central processing unit的簡稱,即中央處理器,作為計算機系統(tǒng)的運算和控制核心,是信息處理、程序運行的最終執(zhí)行單元。[2] DPU是Data Processing Unit的簡稱,它是最新發(fā)展起來的專用處理器的一個大類,是繼CPU、GPU之后,數(shù)據(jù)中心場景中的第三顆重要的算力芯片,為高帶寬、低延遲、數(shù)據(jù)密集的計算場景提供計算引擎。[3] ASIC是Application Specific Integrated Circuit的簡稱,即專用集成電路,是指應特定用戶要求和特定電子系統(tǒng)的需要而設計、制造的集成電路。[4] GPU是graphics processing unit的簡稱,即圖形處理器,又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、游戲機和一些移動設備(如平板電腦、智能手機等)上做圖像和圖形相關運算工作的微處理器。[5] RDMA是Remote Direct Memory Access的縮寫,意思是遠程直接數(shù)據(jù)存取,就是為了解決網(wǎng)絡傳輸中服務器端數(shù)據(jù)處理的延遲而產生的。[6] FPGA(Field Programmable Gate Array)是在PAL (可編程陣列邏輯)、GAL(通用陣列邏輯)等可編程器件的基礎上進一步發(fā)展的產物。它是作為專用集成電路(ASIC)領域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點。[7] TPS是Transaction Per Second的簡稱,一個表達系統(tǒng)處理能力的性能指標,每秒處理的消息數(shù)。