北京市環(huán)境保護(hù)檢測中心需要一個并行計(jì)算集群來運(yùn)行北京市空氣質(zhì)量決策支持系統(tǒng),空氣質(zhì)量決策支持系統(tǒng)內(nèi)主要運(yùn)行MM5氣象模型和Model-3 (CMAQ)空氣污染擴(kuò)散模型。曙光公司全面分析了用戶的實(shí)際需求,根據(jù)實(shí)際的用戶需求,曙光公司制定出如下的方案設(shè)計(jì)原則:
實(shí)際原則,從實(shí)際應(yīng)用出發(fā),遵照實(shí)際情況確定方案的選擇與實(shí)施。
先進(jìn)原則,利用先進(jìn)的計(jì)算機(jī)技術(shù)來建設(shè)一套完整的應(yīng)用于科學(xué)計(jì)算的集群系統(tǒng)。
經(jīng)濟(jì)原則,系統(tǒng)采用廣泛應(yīng)用且具有良好性能價(jià)格比的產(chǎn)品,既考慮節(jié)省投資,又保證產(chǎn)品的先進(jìn)性和可用性。
安全原則,系統(tǒng)應(yīng)該受到嚴(yán)格的安全監(jiān)控,保證系統(tǒng)的正常運(yùn)行。
擴(kuò)展原則,系統(tǒng)支持動態(tài)擴(kuò)展,在系統(tǒng)性能需要提升時(shí),可以很方便地進(jìn)行擴(kuò)展。易管理原則,64個節(jié)點(diǎn)的機(jī)群服務(wù)器的管理必須非常簡便,可以保證系統(tǒng)管理的有序性,高效性,避免管理上的混亂。
依據(jù)以上設(shè)計(jì)原則,曙光公司設(shè)計(jì)出面向高性能計(jì)算的曙光TC4000集群系統(tǒng)方案。該集群系統(tǒng)由1個管理節(jié)點(diǎn)、4個計(jì)算節(jié)點(diǎn)、一套MYRINET網(wǎng)絡(luò)、一套千兆以太網(wǎng)絡(luò)、機(jī)柜系統(tǒng)、電源系統(tǒng)、SKVM系統(tǒng)、硬件監(jiān)控系統(tǒng)以及其他附件組成。該集群系統(tǒng)通過四套網(wǎng)絡(luò)(MYRINET計(jì)算網(wǎng),千兆管理網(wǎng), SKVM網(wǎng)。IIC監(jiān)控網(wǎng))將管理節(jié)點(diǎn)、計(jì)算節(jié)點(diǎn)以及控制設(shè)備和監(jiān)控設(shè)備連接起來,組成了一個充滿活力的集群系統(tǒng),這個集群系統(tǒng)具備以下幾個特點(diǎn):
管理節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn)分開:能夠充分利用計(jì)算節(jié)點(diǎn)的計(jì)算能力,將管理任務(wù)分配給管理節(jié)點(diǎn)大大地提高了計(jì)算節(jié)點(diǎn)的運(yùn)算能力。
千兆管理網(wǎng)絡(luò):千兆以太網(wǎng)的作用是在MYRINET網(wǎng)出現(xiàn)故障的時(shí)候仍然能夠提供不間斷的計(jì)算服務(wù),并且千兆以太網(wǎng)還提供了絕大多數(shù)的管理功能
SKVM網(wǎng)絡(luò):使得管理節(jié)點(diǎn)就像管理本地計(jì)算機(jī)一樣輕松,并且這樣的事情可以在幾百米以外完成。
管理監(jiān)控網(wǎng)絡(luò):采用基于硬件采集的監(jiān)控系統(tǒng),不占用系統(tǒng)資源,做到主板級的監(jiān)控。
提供千兆外部連接,用戶可以通過千兆網(wǎng)絡(luò)連接到管理節(jié)點(diǎn)從而使用整個集群系統(tǒng)。
曙光公司TC4000集群在北京市環(huán)境保護(hù)檢測中心的成功應(yīng)用顯示了曙光在行業(yè)應(yīng)用領(lǐng)域的領(lǐng)先地位。實(shí)際上,曙光公司一直致力于服務(wù)氣象行業(yè),特別是在國際型重大活動的舉辦中都有非常出色的發(fā)揮,同時(shí)在氣象行業(yè)積累了豐富的行業(yè)經(jīng)驗(yàn)。2001年,曙光服務(wù)器成功地服務(wù)了第21屆大學(xué)生運(yùn)動會。2002年曙光公司正式推出了專門面向氣象研究的氣象專用計(jì)算機(jī),填補(bǔ)了國家空白,當(dāng)年此類機(jī)型就應(yīng)用于西藏和貴州省的氣象服務(wù),去年又進(jìn)入了山西氣象局等氣象系統(tǒng),開辟了一條科研和市場同步走的先河。作為引領(lǐng)IT潮流的曙光64位集群計(jì)算機(jī),采用了國際領(lǐng)先的AMD OPTERON處理器,國內(nèi)運(yùn)行次數(shù)最高的每秒運(yùn)算10萬億次的超級服務(wù)器曙光4000A也采用了同種系統(tǒng)結(jié)構(gòu)。作為我國高性能計(jì)算領(lǐng)域的領(lǐng)頭雁,曙光公司在“整合計(jì)算,細(xì)分應(yīng)用”的指導(dǎo)思想下,已經(jīng)在我國的氣象、石油等關(guān)系到國計(jì)民生的重點(diǎn)行業(yè)中積累了豐富的行業(yè)應(yīng)用經(jīng)驗(yàn),而隨著浮點(diǎn)運(yùn)算達(dá)到10萬億次的曙光4000A在上海超級計(jì)算中心投入運(yùn)營,曙光高性能計(jì)算機(jī)在我國的現(xiàn)代化建設(shè)發(fā)揮愈來愈重要的作用。