2009年十大新興企業(yè)級(jí)技術(shù):MapReduce折桂
對(duì)于《InfoWorld》來(lái)說(shuō),我們的一個(gè)任務(wù)就是從這個(gè)噪音中提取信號(hào),從重要的東西中分離出對(duì)IT專(zhuān)業(yè)人員有重要價(jià)值的東西。我們都知道嗡嗡聲是什么:是噪音。對(duì)于《InfoWorld》來(lái)說(shuō),我們的一個(gè)任務(wù)就是從這個(gè)噪音中提取信號(hào),從重要的東西中分離出對(duì)IT專(zhuān)業(yè)人員有重要價(jià)值的東西。這是我們?cè)谠u(píng)選2009年十大新興企業(yè)技術(shù)的主旨。我們相信,對(duì)于IT行業(yè)來(lái)說(shuō),這次評(píng)選是一次盛宴,因?yàn)槲覀儗⒃u(píng)出大量有可能降低成本、改變我們 工作模式、開(kāi)拓新領(lǐng)域的新技術(shù)。評(píng)選中,我們決定摒棄分析師們所鼓吹的高層次發(fā)展趨勢(shì),而是問(wèn)我們自己:正在被交付,但是還沒(méi)有被大范圍采用的企業(yè)技術(shù) 中,哪些技術(shù)將會(huì)產(chǎn)生巨大影響?
坦白的說(shuō),從眾多候選技術(shù)中選出僅十個(gè)技術(shù)并不容易,尤其是在我們?cè)诮衲?月份公布提名后收到許多見(jiàn)解精辟的意見(jiàn)后。以下是我們?cè)u(píng)選出來(lái)的2009年十大新興企業(yè)級(jí)技術(shù):
10.白名單(Whitelisting)
跟上惡意軟件特征已經(jīng)不可能了。比如,賽門(mén)鐵克在2008年一年推出的反病毒特征已經(jīng)超過(guò)了該公司在過(guò)去17年所推出的總和。如今,不僅病毒、蠕 蟲(chóng)、木馬越來(lái)越多,而且有能力變種規(guī)避特征對(duì)比偵測(cè)或使用密碼對(duì)自身進(jìn)行加殼的病毒數(shù)據(jù)也在增長(zhǎng)。對(duì)于不斷增長(zhǎng),設(shè)計(jì)復(fù)雜的惡意軟件,白名單可能是唯一的 解決辦法。
白名單與一個(gè)干凈無(wú)惡意軟件的臺(tái)式機(jī)或服務(wù)器鏡像啟動(dòng)。白名單軟件將對(duì)那些用一個(gè)或多個(gè)用密碼編寫(xiě)的文件進(jìn)行識(shí)別。然后,管理系統(tǒng)中的監(jiān)控代理標(biāo)示 任何未在哈希表(HashList)中的執(zhí)行文件或阻止它們運(yùn)行。大部分公司會(huì)分發(fā)跨企業(yè)的標(biāo)準(zhǔn)系統(tǒng)鏡像,所以白名單是一個(gè)最有效的確保安全的辦法。
白名單需要進(jìn)行一個(gè)文件轉(zhuǎn)變。在當(dāng)今許多企業(yè)中,用戶(hù)仍然有許多辦法控制在他們的臺(tái)式機(jī)或筆記本電腦上運(yùn)行的內(nèi)容。但是由于更加復(fù)雜的新惡意軟件急 劇增長(zhǎng),利用惡意軟件實(shí)施攻擊的有組織犯罪案件數(shù)量也在增長(zhǎng),在企業(yè)安全領(lǐng)域中,白名單可能將是我們戰(zhàn)勝惡意軟件的唯一的希望。
9.跨平臺(tái)移動(dòng)應(yīng)用開(kāi)發(fā)
近幾年來(lái),移動(dòng)設(shè)備上的企業(yè)應(yīng)用一直沒(méi)有得到很好地普及,主要有兩個(gè)原因,一個(gè)是因?yàn)殚_(kāi)發(fā)者需要耗費(fèi)大量的時(shí)間去學(xué)習(xí)如何為智能設(shè)備編程,另外是因 為不同設(shè)備間的應(yīng)用移植性不好。這也是為什么InfoWorld認(rèn)為“跨平臺(tái)移動(dòng)應(yīng)用開(kāi)發(fā)”是2009年新興企業(yè)技術(shù)的主要原因:
跨平臺(tái)移動(dòng)應(yīng)用開(kāi)發(fā)環(huán)境,比如Rhomobile的Rhodes框架,可以讓開(kāi)發(fā)者寫(xiě)一次應(yīng)用,但能在多個(gè)不同的設(shè)備上運(yùn)行,如iPhone、Windows Mobile和BlackBerry等,提供了很多很炫的功能。
對(duì)于企業(yè)來(lái)說(shuō),跨平臺(tái)應(yīng)用開(kāi)發(fā)可大力促進(jìn)研發(fā)和部署行動(dòng)應(yīng)用。你不可能讓每位雇員都使用相同的智能手機(jī),即使你做到了,針對(duì)特定平臺(tái)的應(yīng)用也讓你局 在了一個(gè)平臺(tái)上。通過(guò)跨平臺(tái)應(yīng)用開(kāi)發(fā),你在開(kāi)發(fā)應(yīng)用程序時(shí),將可以不用再針對(duì)特定平臺(tái)進(jìn)行研究,所開(kāi)發(fā)的應(yīng)用也可以在許多設(shè)備上運(yùn)行。未來(lái),廣泛部署移動(dòng) 企業(yè)應(yīng)用將成為現(xiàn)實(shí)。
8. 節(jié)能硬件
我們都知道“兩種綠色”的內(nèi)容是:通過(guò)降低能源消耗保護(hù)地球和節(jié)省資金。實(shí)現(xiàn)這兩個(gè)目標(biāo)的技術(shù)已經(jīng)找到了進(jìn)行服務(wù)器、臺(tái)式機(jī)和其它硬件的方法,但是在一些情況下,只有出現(xiàn)更好的軟件支持才會(huì)出現(xiàn)效益。
更有效的電源適配器和在不需要時(shí)能夠自動(dòng)降低速度或關(guān)閉的硬盤(pán)正在被廣泛應(yīng)用。要想讓不活動(dòng)的內(nèi)核、主板或其它部件睡眠,多核CPU通常需要在操作系統(tǒng)或應(yīng)用層級(jí)被告之。
電源適配器是最簡(jiǎn)單的節(jié)能辦法。它們不需要軟件支持,就可以實(shí)現(xiàn)上述兩個(gè)目標(biāo)。在AC-to-DC轉(zhuǎn)換過(guò)程中,它們幾乎不浪費(fèi)電能,幾乎不產(chǎn)生熱量 —這也降低了冷卻所需的電力。80 Plus認(rèn)證項(xiàng)目鼓勵(lì)生產(chǎn)廠商生產(chǎn)轉(zhuǎn)換效率至少達(dá)80%的電源適配器。此前,老的電源適配器的轉(zhuǎn)換效率只有50%,也就是說(shuō)只有一半的電力被傳輸?shù)搅酥靼?上,另外50%的電能變成了熱能。多家存儲(chǔ)廠商也開(kāi)始生產(chǎn)能夠在不使用時(shí)降低轉(zhuǎn)速或關(guān)閉的硬盤(pán)。最新的CPU、主板和網(wǎng)卡等硬件也開(kāi)始引入節(jié)能概念。
7.多核芯片
主要的處理器廠商在時(shí)鐘頻率上撞到了墻。處理器時(shí)鐘頻率的每一次增加帶來(lái)的都是電能的大量消耗,任何一次性能的提升,隨之而來(lái)的是大功耗和高熱量。
有鑒于此,處理器廠商從單線程轉(zhuǎn)向了多線程,隨后又從單一快速核設(shè)計(jì)轉(zhuǎn)向了多個(gè)雖然速度較慢但是可并行執(zhí)行代碼的多核。時(shí)鐘頻率已經(jīng)不再是制約計(jì)算的瓶頸,取而代之的是吞吐量。
多核芯片耗電量低,發(fā)熱量小,工作效率更高。在服務(wù)器領(lǐng)域,他們正是IT人員夢(mèng)寐以求的芯片。
6.固態(tài)硬盤(pán)
雖然固態(tài)硬盤(pán)在上個(gè)世紀(jì)就已經(jīng)出現(xiàn),但是最近才開(kāi)始推出大量新產(chǎn)品,并且價(jià)格也大幅下降。在過(guò)去,固態(tài)硬盤(pán)主要用于那些需要盡可能高性能的應(yīng)用程 序。如今,固態(tài)硬盤(pán)已經(jīng)被廣泛應(yīng)用,如使用固態(tài)硬盤(pán)做為外部緩存以提高應(yīng)用程序的性能。與傳統(tǒng)機(jī)械硬盤(pán)相比,固態(tài)硬盤(pán)的價(jià)格仍然偏高,但是與添加服務(wù)器內(nèi) 存條相比,它們還是便宜多了。
與傳統(tǒng)機(jī)械硬盤(pán)相比,固態(tài)硬盤(pán)不僅讀寫(xiě)速度更快,而且支持更高的傳輸速率,更為省電。不足的是,固態(tài)硬盤(pán)的壽命較短,因?yàn)楣虘B(tài)硬盤(pán)中的每一個(gè)單元的寫(xiě)入次數(shù)有限。
5. NoSQL數(shù)據(jù)庫(kù)
數(shù)據(jù)正前所未有的流向每個(gè)角落。“SQL”與“數(shù)據(jù)庫(kù)”可以互換的日子正在快速消逝,部分原因是老式關(guān)系型數(shù)據(jù)庫(kù)無(wú)法處理來(lái)自Web 2.0應(yīng)用的大量數(shù)據(jù)。
對(duì)于NoSQL數(shù)據(jù)庫(kù)這個(gè)概念,在剛提出時(shí)就遇到了很大的挑戰(zhàn),因?yàn)槟壳皫缀跛械拇笮蛻?yīng)用采用的都是關(guān)系型數(shù)據(jù)庫(kù),或者說(shuō)SQL數(shù)據(jù)庫(kù)。 NoSQL的推出,無(wú)異于一場(chǎng)革命。NoSQL數(shù)據(jù)庫(kù)對(duì)于那些如安全日志或者系統(tǒng)日志等結(jié)構(gòu)化不強(qiáng)的數(shù)據(jù)而言,使用起來(lái)很順手。另外,因?yàn)槿鄙賹?duì)數(shù)據(jù)的控 制,NoSQL數(shù)據(jù)庫(kù)處理數(shù)據(jù)的速度也很快。
4. I/O 虛擬化
I/O虛擬化解決了運(yùn)行諸如Vmware、微軟Hyper-V等虛擬化軟件的服務(wù)器所出現(xiàn)的問(wèn)題。當(dāng)大量的虛擬機(jī)在一個(gè)單一服務(wù)器上運(yùn)行時(shí),I/O 將成為一個(gè)重要的制約VM與網(wǎng)絡(luò)通信以及VM聯(lián)接后端存儲(chǔ)的瓶頸。I/O虛擬化不僅可以在一個(gè)單一服務(wù)器上更加容易的在跨多VM分配帶寬,它還為動(dòng)態(tài)管理 物理服務(wù)器池和存儲(chǔ)池找到了一個(gè)解決方案。
3.重復(fù)數(shù)據(jù)刪除
數(shù)據(jù)是所有公司的血液。問(wèn)題是如何處理這些數(shù)據(jù)。據(jù)IDC觀察,企業(yè)的數(shù)據(jù)每18個(gè)月就會(huì)翻一倍,直至存儲(chǔ)系統(tǒng)崩潰。導(dǎo)致這一問(wèn)題的原因經(jīng)常是因?yàn)?要遵守公司保存信息與文件的規(guī)定。更為重要的是這些數(shù)據(jù)在商業(yè)價(jià)值方面都沒(méi)有有效期。對(duì)多年前的數(shù)據(jù)進(jìn)行分析可以幫助用戶(hù)把握發(fā)展趨勢(shì),預(yù)見(jiàn)未來(lái),預(yù)測(cè)客 戶(hù)的行為等等。
為此,我們必須要找到一種可以降低數(shù)據(jù)存儲(chǔ)量,又無(wú)需犧牲有用數(shù)據(jù)。在這里我們要感謝重復(fù)數(shù)據(jù)刪除。
2.桌面虛擬化
桌面虛擬化已經(jīng)出現(xiàn)在了我們身邊。你可能會(huì)說(shuō),桌面虛擬化在上世紀(jì)九十年代中期就已經(jīng)出現(xiàn)。不過(guò),今天的桌面虛擬化已經(jīng)從我們大多數(shù)人在兩年前或三前年所想象的有很大區(qū)別。另一個(gè)里程碑是:新技術(shù)以桌面管理程序形式出現(xiàn)。
1. MapReduce
MapReduce是Google在2004年提出的一個(gè)軟件架構(gòu),主要用于大規(guī)模數(shù)據(jù)集的并行運(yùn)算,它通過(guò)把對(duì)數(shù)據(jù)集的大規(guī)模操作,將其分發(fā)給網(wǎng) 路上的每個(gè)節(jié)點(diǎn)實(shí)現(xiàn)可靠性。在Google內(nèi)部,MapReduce得到廣泛的應(yīng)用,比如分布排序、Web連接圖反轉(zhuǎn)和Web訪問(wèn)日志分析等。提到為什么 將MapReduce放在第一位,InfoWorld解釋說(shuō):
某種程度上來(lái)說(shuō),這是考慮到MapReduce的獨(dú)特創(chuàng)新,它使得從前只能在大型商業(yè)硬件上所做的事情,在普通的PC機(jī)上即可操作——處理千兆級(jí)別 的數(shù)據(jù)。在亞馬遜的Amazon Elastic MapReduce產(chǎn)品中,以Web服務(wù)的方式很好地應(yīng)用了MapReduce的實(shí)現(xiàn)——Apache Hadoop。而且,MapReduce還被集成進(jìn)一些來(lái)自IBM、Oracle等公司的主流解決方案,現(xiàn)在它們?cè)朴?jì)算所用的服務(wù)器中可能就跑著 MapReduce。
【編輯推薦】