AI服務器主要指的是采用異構形式的服務器,表現(xiàn)形態(tài)多為機架式。在異構方式上,可以為CPU+GPU、CPU+FPGA、CPU+TPU、CPU+ASIC或CPU+多種加速卡。
而在其他組成部件上,如內(nèi)存模塊、存儲模塊、網(wǎng)絡模塊與傳統(tǒng)服務器差別不大,主要的提升便是支持更大容量的內(nèi)存滿足當下實時負載增加的需求,提供更多外置硬盤插槽,并廣泛支持NVME/PCIE等SSD,滿足數(shù)據(jù)洪流需求,網(wǎng)絡模塊主要表現(xiàn)為帶寬增加。
盡管AI服務器可以采用多種異構形式,但目前廣泛使用的是CPU+GPU。也因此,業(yè)界在談到AI服務器時,往往將其默認為GPU服務器。因此,在第二部分中,筆者談到的AI服務器優(yōu)勢也主要為GPU服務器。
AI服務器的優(yōu)勢:
傳統(tǒng)服務器主要以CPU為算力提供者。而CPU為通用型處理器,采用串行架構,擅長邏輯計算,負責不同類型種類的數(shù)據(jù)處理及訪問,同時邏輯判斷又需要引入大量分支跳轉中斷處理,這使得CPU的內(nèi)部結構復雜。也因此,CPU算力的提升主要靠堆核來實現(xiàn)。
隨著云計算、大數(shù)據(jù)、AI、物聯(lián)網(wǎng)等技術應用,數(shù)據(jù)在近幾年呈指數(shù)型增長,IDC統(tǒng)計顯示全球90%數(shù)據(jù)均在近幾年產(chǎn)生,這便對CPU的處理能力提出考驗,而目前CPU的物理工藝、核心數(shù)已接近極限,數(shù)據(jù)量卻不會停止,服務器的處理能力必須提升。因此,在AI時代下,僅由CPU做算力提供者的傳統(tǒng)服務器并不能滿足需求。
不同于CPU,GPU采用并行計算模式,單卡核心數(shù)達到上千個,擅長處理密集型運算應用,如圖形渲染、計算視覺和機器學習。經(jīng)過幾年驗證,搭載GPU的服務器也被證實的確適用這個時代。