GPU計算服務器(GPU-K1000)

研發(fā)背景

工業與學(xué)術界的數據科學(xué)家已將(jiāng) GPU 用于機器學(xué)習以便在各種(zhǒng)應用上實現開(kāi)創性的改進(jìn),這(zhè)些應用包括圖像分類、視頻分析、語音識别以及自然語言處理等等。 尤其是深度學(xué)習,人們在這(zhè)一領域中一直進(jìn)行大力投資和研究。深度學(xué)習是利用複雜的多級「深度」神經(jīng)網絡來打造一些系統,這(zhè)些系統能(néng)夠從海量的未标記訓練數 據中進(jìn)行特征檢測。 雖然機器學(xué)習已經(jīng)有數十年的曆史,但是兩(liǎng)個較爲新近的趨勢促進(jìn)了機器學(xué)習的廣泛應用: 海量訓練數據的出現以及 GPU 計算所提供的強大而高效的并行計算。  人們利用 GPU 來訓練這(zhè)些深度神經(jīng)網絡,所使用的訓練集大得多,所耗費的時間大幅縮短,占用的數據中心基礎設施也少得多。  GPU 還(hái)被(bèi)用于運行這(zhè)些機器學(xué)習訓練模型,以便在雲端進(jìn)行分類和預測,從而在耗費功率更低、占用基礎設施更少的情況下能(néng)夠支持遠比從前更大的數據量和吞吐量。 將(jiāng) GPU 加速器用于機器學(xué)習的早期用戶包括諸多規模的網絡和社交媒體公司,另外還(hái)有數據科學(xué)和機器學(xué)習領域中一流的研究機構。 與單純使用 CPU 的做法相比,GPU 具有數以千計的計算核心、可實現 10-100 倍應用吞吐量,因此 GPU 已經(jīng)成(chéng)爲數據科學(xué)家處理大數據的處理器。

爲此公司開(kāi)發(fā)了可擴展性很強的GPU計算服務器設備。

應用場景

适用于數據可視化、機器學(xué)習、計算建模等并行運算應用程序的理想設備。

支持8路GPU E5-2600 V3 V4系列

特性和優勢:

1、大規模CUDA并行架構,使工作站的功耗和成(chéng)本分别降至原來的1/20和1/10,性能(néng)卻能(néng)與小型集群媲美;

2、支持8  個Tesla K10/K40/K80/M40/M60/Xeon Phi 計算處理器(每個處理器有448個核心,共1,792個核心。以最終配置GPU卡爲準。);

3、可提供4.12 Teraflops的單精度浮點運算性能(néng)和2.06 Teraflops的雙精度浮點運算性能(néng)

4、CUDA程序環境,支持多種(zhǒng)編程語言和API,包括C、C++、OpenCL、DirectCompute或Fortran;

5、具備内存數據保護功能(néng),加強了應用數據的完整性和可靠性。注冊文件、L1/L2高速緩存、共享内存和DRAM都(dōu)處于ECC保護狀态;

6、NVIDIA® 并行數據緩存(DataCache™)技術,能(néng)夠對(duì)無法預知數據地址的算法進(jìn)行加速,例如物理解算器、光線追蹤、以及稀疏矩陣乘法等等;

7、NVIDIA® GigaThread™ 引擎通過(guò)更快的上下文切換、同時内核執行以及改善的線程塊調度功能(néng),最大限度提升了吞吐量;

規格:

1、支持8 個Tesla K10/K40/K80/M40/M60/Xeon Phi 計算處理器(每個處理器有448個核心,共1,792個核心 以最終配置GPU卡爲準。)

2、每台服務器可提供4.12 Teraflops的單精度浮點運算性能(néng)和2.06 Teraflops的雙精度浮點運算性能(néng)

3、IEEE 754 單雙精度浮點運算标準

4、支持12或24 GB的專用DDR5内存(每顆Tesla C2050 GPU 3 GB,每顆 Tesla C2070/C2075 6GB)

5、4x 384-bit GDDR5 内存位寬 (每個GPU 384-bit GDDR5接口)

6、顯存總帶寬達576 GB/s(每個GPU 144 GB/s)支持2顆32納米英特爾至強處理器Westmere 5600系列,每處理器6内核,12線程,和12MB二級緩存

7、支持Trusted Execution, Advanced Encryption Security,以及新的指令集 (AESNI), Turbo Boost, Intel® Virtualization, Intel® QuickPath

8、Intel 5520芯片組,處理器集成(chéng)内存控制器

9、Intel QuickPath總線架構,高達6.40 GT/s / 5.86 GT/s / 4.80 GT/s的總線帶寬

10、最高 192GB 1333 / 1066 / 800MHz DDR3 ECC Registered 内存

11、8x 3.5"SAS/SATA熱插拔硬盤位

12、兩(liǎng)個額外的單插槽卡擴展槽

産品示例圖: