美國能源部于2000年開始與IBM合作,計劃投入經(jīng)費來研發(fā)一臺超級計算機,以此探索高性能計算機的設(shè)計方向。雙方設(shè)計開發(fā)的結(jié)晶就是現(xiàn)在我們所看到的藍色基因。藍色基因能夠處理大量數(shù)據(jù),并針對帶寬、可擴展性和計算能力進行了專門的優(yōu)化,與此同時,它所消耗的能源和占用的空間只相當于今天速度最快系統(tǒng)的一小部分。
2003年,藍色基因的原型機經(jīng)過三年研發(fā),終于浮出水面,當年11月它就一舉登上TOP500第73名。隨后,藍色基因以半年一個臺階快速占領(lǐng)TOP500排行榜。2004年6月,第4名;2004年11月,第一名,70萬億次浮點運算速度,超越占據(jù)第一位置幾年之久的地球模擬器。2005年3月,135萬億次,2005年11月280.6萬億次。
截至2005年11月發(fā)布的TOP 500,藍色基因有19臺上榜,前20名就有5臺,并穩(wěn)守冠軍亞軍?,F(xiàn)在全世界速度最快的那臺超級計算機藍色基因安裝在美國能源部國家核安全局的勞倫斯•利弗摩爾國家實驗室,它在64組機架中安裝了131,072顆PowerPC處理器。
藍色基因是IBM所提供的一套革命性的全新解決方案,在安裝時可以選擇只裝1組機架到64組機架全部裝上,能為用戶提供一套具有高度可擴展性的解決方案。藍色基因并不只是一部擴展性極強的超級計算機,效率也非常高。藍色基因特別設(shè)計的體系架構(gòu)可以高密度部署處理器、內(nèi)存和互聯(lián)系統(tǒng),更低的功耗和更小的占地面積也使其居于業(yè)界領(lǐng)先地位。
藍色基因??應用于重要業(yè)務
藍色基因計劃在2000年第一次獲得授權(quán)時,其目標就是發(fā)展能應用于生物分子現(xiàn)象(例如蛋白質(zhì)折疊)研究的大型并行計算機。這些努力的成果將能通過大量的模擬,對蛋白質(zhì)折疊的機制有更進一步的了解,此外還能探索在大型并行計算機架構(gòu)和軟件方面的創(chuàng)新想法。藍色基因所能提供的性能等級能夠大幅度提高模擬的規(guī)模,并遠遠超越其它超級計算機。在此規(guī)模上,成功的蛋白質(zhì)折疊模擬研究可望在生物分子仿真的技術(shù)、模型和算法上能有更進一步的發(fā)展。
諸多不同應用層面的實踐經(jīng)驗顯示,藍色基因架構(gòu)適用于各學科間相互關(guān)聯(lián)的作業(yè)?,F(xiàn)在,IBM與許多機構(gòu)正共同努力,擴展藍色基因架構(gòu)上高性能計算應用的名單,這些應用包括了生命科學、金融模型、流體力學、量子化學、分子動力學、天文學和宇宙研究、材料科學和氣候模型。
藍色基因應用實踐:
藍色基因能幫助美國國家大氣研究中心的研究人員建立大氣模型,并且能確保該中心在業(yè)內(nèi)處于領(lǐng)先地位。使用藍色基因系統(tǒng)等超級計算機,美國國家大氣研究中心將能更快地建立模型和分析資料,還能估算引起大氣變化的天然因素和人類活動正如何影響氣候。荷蘭ASTRON是領(lǐng)先的天文學組織。這個組織使用藍色基因作為新型射電望遠鏡的中央處理引擎。這款新型的射電望遠鏡叫做LOFAR,它能夠研究宇宙形成后,最早期的恒星和銀河在萌芽階段的狀況。
波士頓大學打算利用藍色基因來設(shè)立處理艱深科學問題的主機,這些科學問題包括核物理學、基因?qū)W、細胞生物學到宇宙氣候和海洋系統(tǒng)的模型建立。例如,波士頓大學的研究人員打算利用藍色基因來預測太陽表面上的活動(例如太陽耀斑)是如何影響地球的輻射帶、地球的上層大氣層和電離層。當許多科學家和研究人員將大規(guī)模集群運算應用到不同的問題組,并在類似計劃發(fā)展中建立共同的專業(yè)知識時,藍色基因的相關(guān)性就變得更加清楚。
藍色基因??集合創(chuàng)新架構(gòu)設(shè)計
藍色基因系統(tǒng)是由大量運算節(jié)點組成,每個節(jié)點的時鐘頻率相對來說都不很快,以節(jié)省電力和降低成本。藍色基因采用IBM PowerPC嵌入式處理器、嵌入式DRAM和系統(tǒng)芯片技術(shù),并整合所有系統(tǒng)功能,其中包括計算處理器、通訊處理器、三層高速緩存,在單一ASIC上有著復雜路徑的多重高速互聯(lián)網(wǎng)絡(luò)。因為處理器時鐘周期相比之下速度較為緩慢,因此就時鐘周期而言,內(nèi)存近似于處理器。這對減少耗電量來說是一項優(yōu)點,還能將1024個計算節(jié)點(內(nèi)含2顆PowerPC嵌入式處理器)放在單一機架內(nèi)進行密集封裝。藍色基因可以擴充到65,536個計算節(jié)點(共計131,072顆處理器),其峰值速度可達到367萬億次浮點運算速度,除了成本效益,還有低耗電、冷卻效果好及節(jié)省占地面積等特色。
藍色基因是由下列組件構(gòu)成:每計算節(jié)點2個處理器,每計算卡上有2個計算節(jié)點、每節(jié)點板上有16 張計算卡、每機架有32個節(jié)點板、機架由上下兩部分組成,中間有2個中間平面。
每個處理器在每個周期中可以執(zhí)行4次浮點運算。依照在藍色基因上所執(zhí)行應用程序性質(zhì)的不同,程序設(shè)計人員可以選擇在單一運算節(jié)點上同時采用兩個處理器進行運算,或是以一個處理器專門處理通信。除了這些運算節(jié)點外,藍色基因系統(tǒng)還提供了可彈性決定使用數(shù)量的雙處理器I/O(輸入/輸出)節(jié)點,這些節(jié)點可以處理運算節(jié)點和其它系統(tǒng)間的通訊。
藍色基因的計算節(jié)點是通過5種網(wǎng)絡(luò)來互相連接,這5種網(wǎng)絡(luò)分別是:1個3D圓環(huán)面網(wǎng)絡(luò),用在計算節(jié)點間以點對點的方式傳輸信息;1個總體集合網(wǎng)絡(luò),用于整個應用中的總體運行;1個總體障礙和中斷網(wǎng)絡(luò);1個千兆以太網(wǎng),用來控制機器;還有另1個千兆以太網(wǎng),用來連接到其它系統(tǒng)。3D 圓環(huán)面網(wǎng)絡(luò)讓每個節(jié)點都能和最近的6個相鄰節(jié)點以低延遲時間、高帶寬互連,3D圓環(huán)面網(wǎng)絡(luò)還支持一般的點對點通訊。圓環(huán)面網(wǎng)絡(luò)在使用區(qū)域通訊的應用程序上特別有效??傮w集合網(wǎng)絡(luò)對提高平常使用的MPI總體通訊架構(gòu)的速度相當有用。而總體障礙網(wǎng)絡(luò)能夠迅速地同步化系統(tǒng)內(nèi)所有處理器的狀態(tài)。
藍色基因還需要一個服務節(jié)點,在這個節(jié)點上系統(tǒng)管理員可以管理儲存資料用的文件服務器。藍色基因還能管理復雜的前端節(jié)點,在這些前端節(jié)點上終端用戶可以編譯資料并發(fā)出工作指令。藍色基因包含了多種設(shè)計創(chuàng)新,可以擴展到之前無法到達的性能水平,而且還能將客戶系統(tǒng)的耗電量、散熱量和可用的占用空間限制在合理范圍內(nèi)。
藍色基因提供常用軟件環(huán)境
在軟件環(huán)境方面,藍色基因也有特別設(shè)計,強調(diào)遵守下列三項基本原則:簡單化、高效和廣泛性。在軟件設(shè)計時以簡單化的原則進行開發(fā),且能夠利用硬件功能的優(yōu)勢,既保證高效又兼顧穩(wěn)定和安全性。而依據(jù)熟悉且被廣泛使用的程序語言、資料庫、工作管理工具和并行文件系統(tǒng)所建立的編程和管理環(huán)境,客戶將能夠從藍色基因的創(chuàng)新設(shè)計要素中獲益,而不用面對陡峭的學習曲線。
藍色基因的前端節(jié)點是程序設(shè)計人員存取系統(tǒng)運算核心的入口。前端節(jié)點執(zhí)行標準的SUSE SLES9版本Linux,能提供使用者熟悉的操作平臺,讓使用者可以在該操作平臺上編輯程序、進行程序糾錯等。支持藍色基因系統(tǒng)的語言為用在Power PC上標準的IBM XL Fortran、C和C++編輯器,這些還增加了一個能利用雙浮點運算單元優(yōu)勢的末端,而這個雙浮點運算單元是藍色基因所獨有的。
程序設(shè)計人員可以運用廣受歡迎的IBM工程及科學子程序資料庫(Engineering and Scientific Subroutine Library,ESSL),這是一套最先進的資料庫,收集了超過400個數(shù)學子程序,能給Fortran、C或C++等語言所寫成的浮點工程和科學應用程序提供最佳性能。這些程序中有許多都已經(jīng)調(diào)整成適用于藍色基因架構(gòu)。
為了支持并行編寫程序,藍色基因還一并提供了一套MPI解決方案,這套解決方案可以利用美國Argonne國家實驗室的MPICH2數(shù)據(jù)庫,可生成一個利用運算節(jié)點通訊技術(shù)的執(zhí)行方案。
在工作任務及平衡工作量方面,IBM LoadLeveler對藍色基因也提供支持。LoadLeveler已經(jīng)過許多大規(guī)模集群客戶的考驗,能提供建立、提出和處理工作的設(shè)備,其設(shè)計是以可用資源來搭配應用程序處理過程中的需求。
藍色基因中還包括了IBM General Parallel File System (一般并行文件系統(tǒng),GPFS),可以進一步強化藍色基因的軟件環(huán)境。GPFS是一個高性能的磁盤共享文件系統(tǒng),它能從藍色基因的所有節(jié)點中提供快速數(shù)據(jù)存取功能。應用程序可以立即存取使用標準文件系統(tǒng)界面的共享文件,使用者將因此能從數(shù)個節(jié)點中存取同樣的文件。
藍色基因系統(tǒng)還包括一個讓系統(tǒng)管理員可以管理該系統(tǒng)的服務節(jié)點。管理員可使用的重要功能有系統(tǒng)設(shè)定、初始化、監(jiān)督功能和運行。這些功能都已經(jīng)整合到IBM Cluster Systems Management產(chǎn)品中,以提供額外的管理功能和在單一控制點上,在CSM支持的運行平臺間進行管理。能在服務節(jié)點上執(zhí)行的還有一個和DB2相關(guān)的數(shù)據(jù)庫,這個數(shù)據(jù)庫是靜態(tài)和動態(tài)狀態(tài)的信息儲存點。
總之,藍色基因系統(tǒng)軟件集合了諸多為用戶考慮的因素,這些因素都為了達到高性能和高可靠性而加以調(diào)整,并符合許多現(xiàn)有集群客戶所熟悉的特性。在這種情況下,客戶將能夠快速讓藍色基因發(fā)揮強大計算能力,還能從藍色基因的結(jié)構(gòu)功能中獲益。
藍色基因-對深度計算不變承諾
IBM深度計算解決方案不僅有藍色基因,還包括了以POWER處理器為主的UNIX對稱多處理器系統(tǒng)(SMP)、Linux集群、高速互連、存儲、工作站、虛擬化解決方案和廣泛的軟件工具。IDC報告顯示,IBM自1999年就成為大規(guī)模高性能計算領(lǐng)域的佼佼者。創(chuàng)新的藍色基因解決方案,以及近十年內(nèi)將計算速度提升到千萬億次的產(chǎn)品發(fā)展藍圖,都展示了IBM對深度計算和對人類所面臨重大挑戰(zhàn)而尋求解決方案的研究人員所作的不變承諾。
藍色基因計劃在過去五年中發(fā)展迅速。實踐經(jīng)驗證明它可以應用到各種不同的計算密集型工作中,而且現(xiàn)有的應用程序增加了研究者接觸藍色基因的機會。藍色基因?qū)⒛転镮BM集群解決方案帶來極高價值的套裝軟件,這些努力也確保使用者熟悉它的運行環(huán)境。
和政府實驗室、高等學術(shù)機構(gòu)、應用程序和工具提供商及各行業(yè)一起共同研究,是藍色基因的潛在能力能不斷有新發(fā)現(xiàn)的原因。
自推出以來,藍色基因以高成本效益比、高資源有效利用率及高可擴展性等特點,對人類科技發(fā)展不斷做出了重大貢獻。