Doserv 發(fā)表于:13年07月26日 10:00 [來稿] DOIT.com.cn
7月18-19日,英特爾集成眾核技術(shù)峰會在北京怡生園國際會議中心召開。本次峰會是英特爾集成眾核產(chǎn)品發(fā)布以來第一次專注于集成眾核技術(shù)的盛會。會議主要圍繞集成眾核技術(shù)深入展開,匯集了集成眾核技術(shù)的最新信息和行業(yè)前沿。參加此次會議并現(xiàn)場演講的嘉賓天河二號副總設(shè)計師盧凱研究員、并行科技CEO陳健、中國科學(xué)院網(wǎng)絡(luò)中心曹宗雁、東方地球物理公司物探技術(shù)研究中心副總工陳維、清華大學(xué)付昊桓、華大基因王丙強,以及英特爾的何萬青、陳媛、游亮、王哲等專家,與來自生命科學(xué)、石油化工、互聯(lián)網(wǎng)和科研機構(gòu)的客戶匯聚一堂,共同分享探討了Intel® Xeon Phi™協(xié)處理器產(chǎn)品特性及相關(guān)案例。并行科技(https://www.paratera.com)作為此次會議的獨立軟件開發(fā)商(ISV),由陳健帶來關(guān)于Intel® Xeon Phi™協(xié)處理器的高性能計算解決方案。
并行科技CTO陳健詳解“Intel® Xeon Phi™協(xié)處理器高性能計算解決方案”
陳健首先以Intel® Cluster Ready為切入點,介紹了并行科技的HPC機群建設(shè)整體解決方案:“ParaPlus是并行科技在國際通行的Rocks系統(tǒng)開源軟件基礎(chǔ)上,進行二次開發(fā)后形成的一套經(jīng)濟穩(wěn)定的成熟方案,其標(biāo)準(zhǔn)實施軟件是經(jīng)過Intel® Cluster Ready認證的。其中包括兩類機群管理軟件:第一,Rocks機群管理軟件,對于用戶而言,能夠免費獲取軟件,只需支付少量服務(wù)費用;第二,Bright Cluster Manager™,目前是英特爾主推的一個機群管理套件,已全部完成對Intel® Xeon Phi™協(xié)處理器的支持。BCM由Bright Computing公司提供,其可視化完成整個機群的安裝、使用及管理。對于用戶而言,最重要的是它已經(jīng)集成了所有Intel® Xeon Phi™協(xié)處理器的相關(guān)軟件,使得用戶能夠快速便捷地使用Intel® Xeon Phi™協(xié)處理器。”
隨后,陳健詳細闡述了針對Intel® Xeon Phi™協(xié)處理器的高性能計算解決方案,其包含三部分:(1)機群管理套件;(2)針對Intel® Xeon Phi™協(xié)處理器的調(diào)度系統(tǒng),可實現(xiàn)多種應(yīng)用模式的調(diào)度,比如調(diào)度MPI+Offload,或者把單進程任務(wù)直接調(diào)度至Intel® Xeon Phi™協(xié)處理器上,以及將MPI的任務(wù)直接調(diào)度到Intel® Xeon Phi™協(xié)處理器的本地區(qū)運行,另外,MPI任務(wù)還可以在常規(guī)服務(wù)器節(jié)點以及協(xié)處理器節(jié)點之間混合使用;(3)性能分析可視化軟件Paramon,盡可能地將高性能計算的程序開發(fā)、運行可視化,實現(xiàn)動態(tài)、實時地查看數(shù)據(jù)。
Intel® Xeon Phi™協(xié)處理器性能可視化分析
Paramon能夠?qū)崟r顯示基于Intel® Xeon Phi™協(xié)處理器的實時浮點性能Gflops值,此數(shù)值在以前并不存在獲取的較好辦法,而基于Paramon軟件可以實現(xiàn)秒級刷新,一秒一刷新當(dāng)前系統(tǒng)中正在運行的所有程序。Paramon能夠做到以卡為單位,即以一個嵌入式操作系統(tǒng)為單位,來捕捉卡的利用率。在Paramon4.0中,預(yù)計8月31日發(fā)布,提供兩個最基本的Intel® Xeon Phi™協(xié)處理器的微架構(gòu)數(shù)據(jù)——CPI、向量化率,這是目前常規(guī)應(yīng)用移植到Intel® Xeon Phi™協(xié)處理器上所遇到的兩個瓶頸點,并行科技已將這兩個瓶頸點解決。同時在執(zhí)行性能的移植與調(diào)優(yōu)時,可通過Paramon、Paratune迅速定位問題,快速識別應(yīng)用性能瓶頸。
陳健說道:“目前對于高性能計算領(lǐng)域,幾百臺服務(wù)器的一套機群已經(jīng)較為常見,所以我們首先考慮大規(guī)模機群運行狀態(tài)實時可視化,然后是盡可能地讓計算單元發(fā)揮最大性能,但如何能夠保證這一點?此時需要在一個界面內(nèi)看到所有CPU、內(nèi)存、網(wǎng)絡(luò)、磁盤四部分的數(shù)據(jù),而Paramon的設(shè)計則是將內(nèi)存、SWAP、本地磁盤、以太網(wǎng)、InfiniBand以及網(wǎng)絡(luò)文件系統(tǒng)的數(shù)據(jù)以可視化的方法置于同一界面中,此界面涉及已經(jīng)申請專利保護,符合人腦學(xué)習(xí)習(xí)慣,在有限視野中涵蓋了豐富的數(shù)據(jù),長期使用能夠習(xí)得一種高效的模式識別!熟悉此界面的專家,掃一眼就能了解機群的運行情況,包括是否存在閑置、性能瓶頸、故障判斷、非計劃任務(wù)等。”
并行科技CTO陳健
據(jù)悉,由并行科技和英特爾工程師團隊合作翻譯的《Intel® Xeon Phi™協(xié)處理器高性能程序設(shè)計》中文版書籍,將在10月份由人民郵電出版社正式出版。此書巧妙地以賽車為例,由通用編程模式開始從硬件到軟件,操作系統(tǒng),編程實踐,數(shù)學(xué)庫到性能剖析和優(yōu)化層層展開,抽絲剝繭,是關(guān)于Intel® Xeon Phi™協(xié)處理器上高性能編程的最新工程專著。此次峰會上,并行科技展出了此書的試讀版本,與會人員表示了對此書的極大興趣,對于使用Intel® Xeon Phi™協(xié)處理器的用戶以及英特爾而言,這無疑不是進行相關(guān)培訓(xùn)的最佳書籍。
最后,陳健總結(jié)道:“Paramon是目前唯一的秒級實時可視化性能工具,能夠看到程序運行的當(dāng)前狀態(tài),實時的浮點計算性能、內(nèi)存帶寬、向量化以及CPI,相比于Intel® VTune Amplifier而言,較為便捷。并行科技的Paramon、Paratune軟件得到了能源行業(yè)的大力支持,全中國能源行業(yè)Paramon的安裝機群數(shù)多達80套,總安裝服務(wù)器數(shù)量已超過2萬臺,全中國HPC Top100裝機率超過30%。Paramon0.1版本在勝利油田的地質(zhì)院安裝使用,Paramon1.0版本在大慶油田安裝使用,Paramon1.2版本在中石油東方地球物理公司(BGP)實現(xiàn)價值,Paramon3.0在南京物探(中國石化石油物探技術(shù)研究院)安裝使用,而最新的Paramon可以將商用、應(yīng)用級作業(yè)調(diào)度嵌入到軟件中,后臺提交的作業(yè)對于黑匣子管理員來說是透明的。總體上,并行科技的Para應(yīng)用運行特征文件實現(xiàn)了機群性能優(yōu)化循環(huán)的可查看、可記錄、可分析、可交流,是應(yīng)用用戶與性能專家之間進行溝通交流的語言。”
公司簡介 | 媒體優(yōu)勢 | 廣告服務(wù) | 客戶寄語 | DOIT歷程 | 誠聘英才 | 聯(lián)系我們 | 會員注冊 | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.