新華網 正文
數據中心智能化,華為憑什麼做到一騎絕塵?
2019-06-24 15:34:56 來源: 新華網
關注新華網
微博
Qzone
評論
圖集

  這段時間如果你途經深圳或北京機場,可能會被華為的巨幅平面廣告所吸引。不是手機,也不是雲,而是隸屬于企業BG的數據中心係列産品。率先登場的,是華為數據中心交換機CloudEngine係列——號稱業界首個面向AI時代的數據中心交換機。

  在AI方興未艾的當下,華為的實力體現在哪裏?眾所周知,華為已經用AI手機在消費市場創下新高度,難道僅僅引入AI,就能讓華為在企業數據中心領域走完別人行走多年的路,實現彎道超車嗎?帶著這些問題,華為企業BG全球Marketing總裁邱恒做了解釋。

  AI貫穿一切,打造端到端智能數據中心

  華為“端到端”,指的是華為能夠提供端到端全面而完善的産品及解決方案。除機場廣告中的主角數據中心網絡外,位于深圳坂田的華為企業業務展廳還展出了包括計算、存儲、傳輸、電源、散熱在內的數據中心産品及方案。

  一個顯著的特徵是:AI不僅被華為應用到其中的計算或網絡等單一環節,而是貫穿整個數據中心的每一環。也就是説,基于全面的技術和産品能力,華為打造的是端到端的智能數據中心。

  比如在數據中心交換機環節,邱恒介紹到,華為CloudEngine係列最新産品CloudEngine 16800通過華為自研的昇騰310高性能AI芯片和獨創的iLossless智能無損交換算法,可實現流量模型自適應自優化,大幅降低故障識別和故障定位所需的時間,在零丟包基礎上獲得更低時延和更高吞吐的網絡性能,克服傳統以太網丟包導致的算力損失,將AI訓練效率提升40%,數據存儲IOPS性能提升30%。

  又如在存儲環節,華為的OceanStor Dorado V3全閃存存儲係統採用智能芯片、NVMe架構和FlashLink智能算法,可提供0.3ms的穩定時延,實現端到端加速,業務性能提升3倍。

  再如在電源、散熱及管理環節,華為的FusionModule2000智能模塊化數據中心實現了業界唯一的智能化管理,提出了基于iCooling、iPower、iManager的i3解決方案,能在典型場景(100kW數據中心,負載率50%)中每年省出13萬度電。

  端到端的智能帶來的好處是十分顯著的,邱恒在分享中列舉了一個銀行客戶做數據中心故障排查演練的案例,以前用傳統的方法要76分鐘才能找到故障,現在8分鐘就能把故障定位。這意味著,有了智能算法、智能芯片的幫助之後,數據中心的智能水平有了飛躍性的進步;從76分鐘到8分鐘,這是數量級的提升。

  綜上可見,不囿于一招鮮單點發力,AI已經被華為融入到數據中心的每一個環節,並且在關鍵場景性能提升和運維管理的降本增效層面均取得顯著突破。

  核心能力全上陣,不斷突破産品極致性能

  華為數據中心全線産品展現出來的另一個姿態是追求性能——核心能力不斷突破各類産品的行業極限,積極應對AI時代正在爆發或即將爆發的分布式存儲、高性能計算(HPC)和AI應用等場景對數據中心資源需求的爆發式增長。

  華為用于數據中心的核心能力首先表現在芯片層面。例如在CloudEngine係列數據中心網絡産品中,除了提到的昇騰310高性能AI芯片,核心的網絡芯片(NP)也是華為自研的Solar係列;又如在華為TaiShan服務器中,不僅搭載了華為自研的CPU芯片鯤鵬920,還配置了智能網絡融合芯片、智能管理芯片、智能SSD控制芯片等自研芯片;再如在華為OceanStor係列存儲中,也有華為自研的SSD控制芯片、BMC管理芯片、智能多協議接口芯片等。此外在異地災備數據中心互聯方案中,同樣用到了昇騰310,以及華為最傳統的強項oDSP光傳輸芯片。

  有自研高性能芯片的加持,産品性能的提升立竿見影。邱恒以計算環節為例,指出華為數據中心在採用了新型的處理芯片之後,跟傳統的數據中心相比AI訓練的算力提升了2倍。如今,集鯤鵬920、昇騰310等眾多芯片于一身的華為的TaiShan服務器,正在將高效能計算帶入每一個數據中心。

  除自主可控、創新靈活的芯片外,華為用于數據中心的核心能力還表現在ICT技術融會貫通後強大的産品設計能力,其中涉及到架構、材料等方方面面。以網絡産品CloudEngine 16800為例,其全面升級了硬件交換平臺,在正交架構、無背板基礎上突破超高速信號傳輸、高效供電、超強散熱等多項技術難題,使得單槽位可提供業界最高密度48端口400GE線卡(單機提供業界最大的768端口400GE交換容量),交換能力高達業界平均水平的5倍(一臺頂5臺),很好滿足了AI時代流量倍增的需求。

  其中,信號傳輸採用新型亞微米無損材料,使得電信號的傳輸效率提高了30%,確保了高性能板卡的實現;供電採用磁吹滅弧和大勵磁技術實現單個電源模塊獨立雙路輸入的ms級快速切換,大幅節省機房空間,使單位空間的供電效率提升95%;散熱採用新型碳納米導熱墊和VC相變散熱器,使得散熱效率較業界平均提升4倍,整機可靠性提升20%。

  無論是微觀的芯片設計,還是宏觀的産品設計,華為都傾其ICT核心能力發揮到極致,為數據中心全線産品帶來了極致性能。如此一來,當産品本身強大的基礎性能遇上AI效率倍增的能力,就會進一步爆發出巨大的能量了。

  以客戶需求為中心,多維度實現超低TCO

  面向AI時代的轉型中,企業如果不能抓住以數據高效處理、AI助力決策為特色的智能經濟浪潮,則極有可能會被時代拋棄。如何平衡?通常情況下,新技術的加入和産品性能的升級通常都意味著客戶擁有成本的增加,但華為智能數據中心展示了強大的TCO控制能力,多維度發力為客戶實現了超低TCO。邱恒解釋,為獲取超低TCO,華為數據中心解決方案考不僅考慮單個設備,而且要思謀如何端到端實現整體最低成本。

  邱恒指出,在擁有智能化能力和保障高性能的前提下,數據中心運營者第一需要省電,第二省空間,第三省運維。對此華為智能數據中心拿出了專門的供電智能、散熱智能和管理智能解決方案,通過AI算法自適應和架構設計優化,達成超低TCO。例如,整機滿配的CloudEngine 16800一年能節省32萬度電,同時機櫃只佔傳統方案1/5的空間。OceanStor Dorado V3能達到75%的OPEX節省和5:1的數據縮減率,同時無損性能。而如果採用集電源、散熱及管理于一體的FusionModule2000智能模塊化數據中心方案,則能在100kW數據中心、負載率50%的典型場景中一年省下13萬度電。

  綜上,華為數據中心的每個産品都在努力做到智能、極致性能和超低TCO,同時産品與産品之間還有協同,以達成端到端的智能、極致性能和超低TCO。華為數據中心的智能化水平,不是每一個單點設備提升的匯總相加,還有各部分之間的乘法效應。

+1
【糾錯】 責任編輯: 周靖傑
新聞評論
加載更多
象牙塔裏的“奇妙”專業
象牙塔裏的“奇妙”專業
聖彼得堡慶祝“紅帆節”
聖彼得堡慶祝“紅帆節”
自貢彩燈閃耀羅馬尼亞錫比烏國際戲劇節
自貢彩燈閃耀羅馬尼亞錫比烏國際戲劇節
中國駐比利時使館舉辦開放日活動
中國駐比利時使館舉辦開放日活動

010030090950000000000000011100001124663977