標(biāo)簽:
隨著“云物移大智”(指云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、智慧城市)的發(fā)展,今天企業(yè)的數(shù)據(jù)中心正變得越來越復(fù)雜,一方面是各種應(yīng)用層出不窮,這些應(yīng)用對(duì)后端的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)提出了不同的要求,有些是計(jì)算密集型,有些是數(shù)據(jù)密集型,有些是IO密集型等等,另一方面則是IT硬件技術(shù)也出現(xiàn)了多樣化發(fā)展,如CPU核數(shù)越來越多,虛擬機(jī)和云計(jì)算使用越來越普及,萬兆以太網(wǎng)和Infiniband各有千秋,機(jī)械硬盤和固態(tài)磁盤各有優(yōu)勢(shì)……這些對(duì)用戶的異構(gòu)資源管理、IT應(yīng)用資源匹配都提出了新的挑戰(zhàn),需要通過管理軟件來解決,“軟件定義”也因此受到了大家的廣泛關(guān)注。
近日,在位于北京上地的IBM中國區(qū)開發(fā)中心,IT168記者就”軟件定義基礎(chǔ)架構(gòu)“這一話題,采訪到了IBM系統(tǒng)部軟件定義基礎(chǔ)架構(gòu)大中華區(qū)業(yè)務(wù)經(jīng)理周立旸和IBM系統(tǒng)部軟件研發(fā)實(shí)驗(yàn)室軟件開發(fā)總監(jiān)謝東博士。
何謂”軟件定義基礎(chǔ)架構(gòu)“?
首先,我們來了解一下什么是”軟件定義基礎(chǔ)架構(gòu)“。
據(jù)介紹,IBM所謂的軟件定義基礎(chǔ)架構(gòu)主要涉及三個(gè)層面,分別是軟件定義計(jì)算、軟件定義存儲(chǔ)和基礎(chǔ)架構(gòu)管理。具體來說,就是通過Platform Computing、Spectrum Scale、Cluster Manager、Cloud Manager、SoftLayer等一系列軟件,來幫助用戶實(shí)現(xiàn)分布式計(jì)算環(huán)境的整合,從而為不同類型水平擴(kuò)展的應(yīng)用提供彈性的共享資源池,實(shí)現(xiàn)IT應(yīng)用的靈活性和資源調(diào)度管理的智能化。
其一,在軟件定義計(jì)算層面,近年來,不同類型的分布式架構(gòu)應(yīng)用越來越多,從最早的高性能計(jì)算集群,到Hadoop大數(shù)據(jù)集群,再到內(nèi)存計(jì)算、流計(jì)算、Spark、MongoDB等一些新型應(yīng)用,由于采用不同的軟件堆棧,需要不同的底層基礎(chǔ)設(shè)施,進(jìn)而造成集群蔓延、成本增加的現(xiàn)象。
IBM提出的一個(gè)可行辦法是通過資源管理和應(yīng)用管理軟件,來在一套彈性的資源池上整合不同的應(yīng)用負(fù)載。這套軟件就是IBM Platform Computing系列家族產(chǎn)品,包括Symphony、LSF、Application Service Controller(ASC)等。其中LSF主要是針對(duì)高性能計(jì)算應(yīng)用的資源調(diào)度,Symphony則主要面向高性能分析和Hadoop大數(shù)據(jù)應(yīng)用,ASC針對(duì)Spark 和MongoDB等新型云應(yīng)用,并通過容器的技術(shù)來保障應(yīng)用的業(yè)務(wù)連續(xù)性。
其二,在軟件定義存儲(chǔ)層面,隨著數(shù)據(jù)類型越來越多,冷熱度不均的數(shù)據(jù)也需要存儲(chǔ)在不同的介質(zhì)上,對(duì)存儲(chǔ)架構(gòu)、存儲(chǔ)技術(shù)、IO帶寬都有各自的需求,因而也需要有智能的流程來管理存儲(chǔ)資源和數(shù)據(jù)。
對(duì)此,IBM近期已經(jīng)推出了全新的存儲(chǔ)軟件產(chǎn)品系列IBM Spectrum Storage(光譜存儲(chǔ)),將之前分散的存儲(chǔ)管理軟件重新整合,涉及“監(jiān)控、保護(hù)、虛擬化、加速、備份、擴(kuò)展”等6大類功能。IBM承諾未來5年將投入超過10億美元開發(fā)下一代技術(shù),以強(qiáng)化其在軟件定義存儲(chǔ)領(lǐng)域的領(lǐng)導(dǎo)地位,這些投資將主要用于新的云存儲(chǔ)軟件、對(duì)象存儲(chǔ)與包括OpenStack在內(nèi)的開放標(biāo)準(zhǔn)技術(shù)的研發(fā)。據(jù)了解,IBM光譜存儲(chǔ)管理軟件通過存儲(chǔ)虛擬化、GPFS、XIV等技術(shù),能夠集中管理超過300種不同存儲(chǔ)設(shè)備,以及高達(dá)YB級(jí)別的數(shù)據(jù)規(guī)模,幫助用戶以自動(dòng)化方式選擇合適的、更經(jīng)濟(jì)的存儲(chǔ)設(shè)備。
其三,在基礎(chǔ)架構(gòu)管理層面,對(duì)用戶而言,數(shù)據(jù)中心的異構(gòu)化也日益突出,傳統(tǒng)集群、私有云、公有云都可能涉及,從而形成一種混合云的IT環(huán)境。對(duì)此,IBM也推出了不同的方案來應(yīng)對(duì)這些基礎(chǔ)設(shè)施的管理,比如Cluster Manager可以實(shí)現(xiàn)多個(gè)物理機(jī)的管理和部署,基于OpenStack的Cloud Manager可以實(shí)現(xiàn)多個(gè)虛擬機(jī)的部署,同時(shí)這些技術(shù)也在IBM的云數(shù)據(jù)中心SoftLayer上面應(yīng)用,提供平臺(tái)即服務(wù)的軟件。通過這一系列技術(shù),IBM得以幫助用戶實(shí)現(xiàn)異構(gòu)基礎(chǔ)架構(gòu)的管理。
周立旸談到,IBM所謂的軟件定義基礎(chǔ)架構(gòu)中的”軟件“一詞有雙重含義,其一是指IBM的全系列產(chǎn)品本身就是軟件,二是指客戶的應(yīng)用軟件。對(duì)用戶來說,IBM的軟件可以針對(duì)應(yīng)用特點(diǎn)來實(shí)現(xiàn)底層基礎(chǔ)設(shè)施的優(yōu)化、自動(dòng)化等功能,賦予IT基礎(chǔ)設(shè)施自動(dòng)感知和適應(yīng)上層應(yīng)用負(fù)載的能力。
Platform:隨分布式架構(gòu)起舞
早在2011年,IBM收購了Platform Computing,這家企業(yè)在當(dāng)時(shí)就已經(jīng)是為分布式計(jì)算環(huán)境提供集群和網(wǎng)格管理軟件的全球領(lǐng)導(dǎo)者,尤其是在高性能計(jì)算領(lǐng)域有著重要的影響力。四年后,Platform Computing變身為IBM軟件定義基礎(chǔ)架構(gòu)戰(zhàn)略中的重要一環(huán)。這當(dāng)中發(fā)生了哪些變化?
周立旸告訴記者,Platform最大的專長在于”工作負(fù)載感知“,在加入IBM大家庭之后,以一種中間件的形式,構(gòu)成了IBM系列通用產(chǎn)品如服務(wù)器、存儲(chǔ)、GPFS與各種不同應(yīng)用負(fù)載之間的接口,從而可以通過資源管理、作業(yè)調(diào)度等方式來實(shí)現(xiàn)工作負(fù)載的優(yōu)化。而這正是Platform系列產(chǎn)品對(duì)于IBM和用戶的價(jià)值所在。
謝東也談到,Platform在被IBM收購之后,產(chǎn)品定位并沒有大的改變,但側(cè)重點(diǎn)有一些不同,主要是與IBM原有產(chǎn)品結(jié)合更加緊密,比如針對(duì)GPFS文件系統(tǒng)、POWER平臺(tái)、大數(shù)據(jù)分析軟件進(jìn)行了深度優(yōu)化。
另外一個(gè)較大變化是Platform Computing的適用面在擴(kuò)寬。周立旸告訴記者,誕生于1994年的Platform實(shí)際上已經(jīng)有20多年歷史。但早在2000年,Platform在國外的一大部分收入就已經(jīng)不是純高性能計(jì)算類業(yè)務(wù),而是幫助很多金融機(jī)構(gòu)、投行做高性能分析應(yīng)用。相比之下,國內(nèi)高性能分析運(yùn)算要晚于國外,但這幾年隨著大數(shù)據(jù)的產(chǎn)生,需要復(fù)雜的、分布式架構(gòu)來實(shí)現(xiàn),因此國內(nèi)也看到越來越多的市場(chǎng)機(jī)會(huì)。對(duì)Platform而言,無論是高性能計(jì)算,還是大數(shù)據(jù)或云計(jì)算應(yīng)用,其本質(zhì)都是分布式計(jì)算,因此,隨著應(yīng)用的擴(kuò)展,Platform的適用范圍也正變得更加寬廣。
謝東補(bǔ)充道,在研發(fā)思路上,IBM不只是關(guān)注Platform產(chǎn)品本身,而是會(huì)更多關(guān)注行業(yè)應(yīng)用,針對(duì)不同行業(yè)、不同用戶的需求來定制方案。據(jù)他介紹,IBM在收購Platform之后,將其全球主要研發(fā)力量都集中在中國,經(jīng)過幾年發(fā)展,團(tuán)隊(duì)規(guī)模已經(jīng)達(dá)到近400人,不僅有開發(fā)、測(cè)試還有售后技術(shù)支持,主要分布在北京、西安、上海。。
案例知多少
從具體實(shí)際案例,周立旸介紹了包括花旗銀行、USAA保險(xiǎn)公司、大港油田在內(nèi)的多個(gè)客戶案例,有的是數(shù)據(jù)密集型應(yīng)用,有的是計(jì)算密集型應(yīng)用。
比如,花旗銀行采用了軟件定義基礎(chǔ)架構(gòu)的解決方案,通過使用Symphony、GPFS、Spectrum Scale等,實(shí)現(xiàn)了百倍的應(yīng)用性能提升,涉及全球4個(gè)數(shù)據(jù)中心、超過300個(gè)應(yīng)用。
美國USAA保險(xiǎn)公司由于業(yè)務(wù)快速發(fā)展導(dǎo)致基礎(chǔ)架構(gòu)成本急速增加。IBM通過使用BigInsights高級(jí)分析工具、Platform Symphony、Spectrum Scale等軟件解決方案,最終將其5個(gè)業(yè)務(wù)部門30多個(gè)組的大數(shù)據(jù)和分析應(yīng)用,包括CRM、欺詐檢測(cè)、網(wǎng)頁點(diǎn)擊流分析等,整合在一個(gè)平臺(tái)上,實(shí)現(xiàn)了多租戶共享服務(wù),即在一套集群上可以同時(shí)運(yùn)行多種不同的大數(shù)據(jù)和分析應(yīng)用,大幅度減少硬件投入及管理成本。
又如,紅牛賽車通過Platform實(shí)現(xiàn)高性能計(jì)算調(diào)度、軟件許可調(diào)度和流程調(diào)度等功能,以提升硬件使用率和設(shè)計(jì)流程效率。
這里值得一提的是高性能計(jì)算云的應(yīng)用。過去業(yè)界有說法認(rèn)為高性能計(jì)算和云計(jì)算兩者之間是不可調(diào)和的,因?yàn)樘摂M化環(huán)境不太適用于HPC這類應(yīng)用。但實(shí)際上,云計(jì)算的構(gòu)建并不一定要依賴于虛擬化來實(shí)現(xiàn)。周立旸告訴記者,通過Platform、SoftLayer和其他軟件,也可以實(shí)現(xiàn)基于物理機(jī)集群環(huán)境的彈性資源池,可以動(dòng)態(tài)實(shí)現(xiàn)軟硬件部署,或者讓應(yīng)用在不同集群之間切換等,使得用戶可以通過私有云或公有云的方式來實(shí)現(xiàn)高性能計(jì)算。
如中石油大港油田通過Platform Computing實(shí)現(xiàn)高性能計(jì)算云,在一套云環(huán)境中運(yùn)行十幾個(gè)不同的HPC應(yīng)用,而無需構(gòu)建多套集群。
又如,Transvalor和MINES ParisTech等公司面臨的挑戰(zhàn)是其數(shù)字風(fēng)洞實(shí)驗(yàn)需要先進(jìn)的HPC解決方案,而其研究人員又沒有能力搭建自己的HPC環(huán)境。對(duì)此,這兩家公司聯(lián)合多個(gè)商家嘗試建造HPC云服務(wù),匯集先進(jìn)的流體模擬軟件,IBM為其提供了基于Platform Computing和SoftLayer的HPC云服務(wù),讓用戶可以通過即用即付費(fèi)的模式來獲得低成本、高質(zhì)量的HPC能力,大大降低了中小企業(yè)和大學(xué)研究人員進(jìn)行HPC研究實(shí)驗(yàn)的門檻。
|