華東理工大學地處人文薈萃、海納百川的大都市上海,原名華東化工學院,其辦學歷史可以追溯到100多年前的南洋公學和震旦學院,是1952年全國院系調整時由交通大學(上海)、震旦大學(上海)、大同大學(上海)、東吳大學(蘇州)、江南大學(無錫)等校的化工系合并組建而成的全國第一所以化工特色聞名的院校。


      華東理工大學化工學院是學校重點院系,院系的師生這些年來在分子計算領域取得了極大的進展,以Gaussian,MS為中心的多種計算化學方面的高性能計算軟件和多幾點的高性能集群正在幫助材料學研究者以及理論化學研究者們實現(xiàn)多種計算機實驗和推導。
  
      用戶需求


      由于計算化學領域計算問題非常復雜,采用高性能計算機系統(tǒng)成為理論化學計算的必由之路。而院系原來一直采用AMD處理器的服務器進行運算,目前已經(jīng)不能滿足院系師生的需求,學院決定更新高性能集群服務器,切實實現(xiàn)高性能并行計算應用分析。


      更高的性能價格比。更高的可擴展性。更高的可管理性。更高的系統(tǒng)強壯性。對應用系統(tǒng)的支持。
  
      項目實施


      寶德科技的技術工程師立足前期的成功合作案例和經(jīng)驗,在INTEL的大力支持下,通過長達2個月的校方應用方向和需求分析,運用INTEL解決方案中心的測試條件,同時兼顧后期校方的更大規(guī)模網(wǎng)格計算的擴展需要,針對性的推出了POWER 8000 HPC應用方案。


      寶德技術人員投入極高的專注和熱情,針對華東理工的項目特點,設計了一整套符合學院軟件要求的集群方案,并在學院采購前和學院師生一起搭建測試平臺,驗證設計方案。


      另外Intel提供了系列的優(yōu)化工具、編譯工具、集群工具等眾多高性能計算組件,為IA架構、標準互聯(lián)的高性能計算系統(tǒng)應用提供高效率的保證。成為本次HPC項目成功實施的關鍵。


      方案描述


      寶德科技為華東理工大學高性能集群系統(tǒng)可提供標準的Intel服務器平臺系統(tǒng),先進的高性能服務器集群系統(tǒng),具有實時多任務并行操作的高性能、高可用性、高穩(wěn)定性、可靠性、可擴展性等優(yōu)勢。


      寶德HPC解決方案充分結合客戶的實際需要,提供了以最新Woodcrest雙核服務器為計算節(jié)點的Power Cluster8000I高性能計算機系統(tǒng),采用免費OSCAR中間件實現(xiàn)節(jié)點管理、任務分發(fā)和集群監(jiān)控,使用以太網(wǎng)的優(yōu)化通信庫模塊來實現(xiàn)節(jié)點之間的進程通信。


      再加上一套完整的Intel優(yōu)化編譯工具和函數(shù)庫等軟件來優(yōu)化化工院的應用,使系統(tǒng)的性能得到充分的發(fā)揮,成為高校高性能計算系統(tǒng)推廣的表率之一。


      華東理工大學高性能計算計算集群系統(tǒng)是一個是基于網(wǎng)絡、面向科研等的大型高性能并行計算系統(tǒng),該系統(tǒng)的基礎是主控節(jié)點、計算節(jié)點等硬件基礎平臺的建設和互聯(lián)系統(tǒng)的建設。


      該HPC系統(tǒng)對研究方向所涉及的大規(guī)模高復雜性系統(tǒng)模型驗證算法、大規(guī)模數(shù)據(jù)處理與服務等問題的研究提供了有效的支撐平臺,性能超過語氣,而成本投入比小型機集群節(jié)省60%?!辈捎没赪OODCREST處理器的計算平臺和以太網(wǎng)互聯(lián)網(wǎng)絡,在多個測試實例中,用Intel編譯器編譯應用程序和MPI庫函數(shù)比用GNU編譯器獲得53%-60%的性能提升。
  
      技術實現(xiàn)


      寶德高性能計算集群系統(tǒng)分層次設計,按照Intel的高性能計算生態(tài)系統(tǒng)部署,自上而下,按照:HPC并行應用程序→中間件集群管理和通信庫以及各類軟件優(yōu)化工具→操作系統(tǒng)→計算節(jié)點和主控節(jié)點的硬件平臺→系統(tǒng)環(huán)境的部署設計:包括散熱、電源、空間布局等規(guī)范化的設計。


      Intel高性能計算生態(tài)系統(tǒng)是Intel在業(yè)界多年研究和分析的結晶,科學的層次化部署,將復雜的大型并行計算平滑移植到性價比良好的IA架構的平臺上,并保證相當?shù)男?,不但為大型并行計算問題開拓出了新的解決方案,也為未來的網(wǎng)格計算做好了相當?shù)睦碚撛O計基礎。


      HPC系統(tǒng)從各個關鍵部件如節(jié)點、網(wǎng)絡拓撲、中間件、管理平臺的選用最終決定了HPC系統(tǒng)本身的穩(wěn)定和可靠,以及最關鍵的效能。本系統(tǒng)采用純英特爾服務器機架式設計,繼承了Intel服務器平臺七大技術,保證高性能計算系統(tǒng)平臺的高可靠、高可用和可維護性:


       √指示燈引導診斷(Light-Guided Diagnostics):提高可維護性和故障的迅速恢復。


      √電源和散熱空間(Power and Thermal Headroom):進行電源和散熱工程設計預算,以實現(xiàn)最高性能。


      √主動氣流控制(Active Airflow Control):提供機箱散熱和風扇控制,保證服務器冷卻和安靜。


      √硬盤穩(wěn)定技術(Drive Stabilization Technology):提高硬盤的可靠性、使用壽命和性能


      √驅動器電源隔離(Drive Power Isolation):為熱插拔硬盤提供關鍵緊急保護


      √多路徑引導(Multi-Path Boot):保證系統(tǒng)即使在出現(xiàn)許多基礎錯誤時也能正常啟動。


      √驗證壓力測試套件(Validation Stress Test Suite):有助于確保最新高性能服務器的數(shù)據(jù)完整性


      并根據(jù)系統(tǒng)環(huán)境的各種物理機械、電磁兼容性設計及冗余設計等,嚴格按照國家規(guī)范進行。
  
      推薦硬件


      節(jié)點采用寶德PR1510D服務器,采用INTEL 5110處理器,2GB ECC DDR RAM、SATA II 80G、Intel主板集成的雙千兆以太網(wǎng)卡Intel 。




   
      軟件環(huán)境


      操作系統(tǒng):RedHat Linux AS 3.0(支持64位應用);


      應用軟件系統(tǒng):MPICH(RedHat Linux自帶的模塊);


      其他:GNU C/C++編譯器、Intel C/C++編譯器、Total View調試工具、Intel Vtune調試工具、Intel® Cluster Tools集群工具(生成、分析和優(yōu)化集群應用)。
  
      經(jīng)驗收獲


      寶德高性能計算集群系統(tǒng)的軟件和硬件以及基礎架構都保證了規(guī)范、標準、開放、通用,可以方便使用和在其平臺上開發(fā)自己的應用。最大限度的提高了應用的效率和移植性,適合于客戶在化學領域多種應用的部署。


      華東理工化學計算研究中心主任黃偉民認為:“寶德科技的高性能計算集群系統(tǒng)由于采用了業(yè)內(nèi)領先的技術,不僅性能突出,安全穩(wěn)定,對未來的擴展能力也極強,用戶完全可以放心將來的集群擴展問題。整個集群的峰值計算能力以及實際預算能力這兩項指標都能躋身同類產(chǎn)品的前列,同時又有一個更低廉的價格?!?/P>

      深圳寶德科技有限公司總經(jīng)理張云評價:本次采用INTEL架構服務器搭建的HPC環(huán)境,充分體現(xiàn)了領先一代的Intel IA平臺從研發(fā)到制造工藝,Intel積累了近二十年的技術結晶,厚積薄發(fā),為高性能計算研究領域提供最好的計算平臺。

分享到

多易

相關推薦