AI時代 GPU數據庫或成趨勢
2019-04-17 10:36:01 中關村在線CPU驅動的數據庫老矣
傳統數據庫,如Oracle、DB2,往往由CPU提供驅動力。而CPU為通用型處理器,采用串行架構,擅長邏輯計算,負責不同類型種類的數據處理及訪問,同時邏輯判斷又需要引入大量分支跳轉中斷處理,這使得CPU的內部結構復雜。也因此,CPU算力的提升主要靠堆核來實現。
隨著云計算、大數據、AI、物聯網等技術應用,數據在近幾年呈指數型增長,IDC統計顯示全球90%數據均在近幾年產生,這便對CPU的處理能力提出考驗,而目前CPU的物理工藝、核心數已接近極限,數據量卻不會停止,對硬件平臺的處理訪問能力也不會停止。因此,在AI時代下,由傳統CPU驅動的數據庫已不能滿足需求。
GPU數據庫風頭正盛
不同于CPU,GPU采用并行計算模式,單卡核心數達到上千個,擅長處理密集型運算應用,如圖形渲染、計算視覺和機器學習。由此,從2015年起,GPU數據庫也成為硅谷的投資熱點,經過3年有余的驗證,GPU已被證實的確適用于AI時代。
GPU數據庫的優勢
相比由CPU驅動的數據庫,采用GPU驅動的數據庫在性能、成本及能耗方面均具備優勢。
首先在性能上,得益于上千的處理核心,GPU數據庫比CPU驅動的數據庫性能提高10-100倍;而在硬件成本上,雖然單個GPU平臺高于單個CPU平臺,但總體GPU平臺部署數量遠少于CPU平臺,總體硬件成本降至十分之一;同樣,單個GPU平臺在能耗上超過單個CPU平臺,但平臺數的減少也使得總體能耗降低。
GPU數據庫創企
3年時間里,全球也誕生了幾家GPU數據庫公司,如MapD,總部位于舊金山,產品為GPU OLAP database,基于C++開發的MapD數據庫核心,開源遵循GPL3協議;Kinetica,同樣位于舊金山,提供商業智能分析和可視化技術實現海量數據的處理,并支持Google Cloud、AWS,Azure;SQream,以色列公司,采用閉源代碼,目前已獲阿里支持,并已在阿里云適用。
結語