整合企業(yè)NoSQL的10大要點
如今NoSQL(非關(guān)系型數(shù)據(jù)庫)能提供靈活性、可伸縮性、執(zhí)行性和可用性來支持許多應(yīng)用程序,但實現(xiàn)它們并不總是那么容易。
數(shù)據(jù)推動企業(yè)創(chuàng)新和業(yè)務(wù)增長,但只為有準(zhǔn)備的企業(yè)有效地處理數(shù)據(jù)。
雖然關(guān)系數(shù)據(jù)庫有自己的一席之地,但是今天數(shù)據(jù)的復(fù)雜性,海量和需求使它們不適合一些特定的應(yīng)用程序。在很多這樣的情況下,NoSQL技術(shù)的加入填補了這一缺憾。不過,要想實現(xiàn)NoSQL系統(tǒng)進入你的企業(yè)可并不是易事。
這是值得做的,但它需要仔細(xì)的規(guī)劃和企業(yè)的買入,這是許多IT組織忽略的關(guān)鍵, Mark Logic(NoSQL的提供商)的產(chǎn)品執(zhí)行副總裁Joe Pasqua發(fā)表看法,認(rèn)為企業(yè)NoSQL的引入拯救了Healthcare.gov (美國聯(lián)邦健康保險交換系統(tǒng)的核心)。
Pasqua將分享 10個要點,有助于順利整合NoSQL系統(tǒng)集成到你的企業(yè)。
開發(fā)用例
Pasqua認(rèn)為一個成功的NoSQL項目的***步是沒有秘訣的,你就是需要開發(fā)一個堅實的用例和清晰的理解你到底想實現(xiàn)什么。
Pasqua 說“沒有NoSQl,公司幾乎注定要失敗。我們已經(jīng)在大數(shù)據(jù)領(lǐng)域看到了很多這樣的例子。我和人們曾經(jīng)在會議中討論過,他們說需要Hadoop,將 Hadoop帶入企業(yè)。他們不確定是為什么或者他們想要試圖完成什么,但CIO(***信息官)就是告訴他們,他們需要Hadoop。只有好運到極大程度才能順利實現(xiàn)這個要求。他們想要進入大數(shù)據(jù)的領(lǐng)域,但有時這個愿望真的會妨礙他們理解業(yè)務(wù)價值的內(nèi)容。”
對于需要大規(guī)模和大量數(shù)據(jù)的項目,使用NoSQL常常是正確的選擇,其具備以下功能:個性化、用戶配置文件管理、從運行數(shù)據(jù)中實時提取信息、內(nèi)容管理、目錄、客戶360度視圖、移動應(yīng)用、物聯(lián)網(wǎng)應(yīng)用、數(shù)字通信和欺詐檢測。
確定NoSQL模型如何符合現(xiàn)有的數(shù)據(jù)庫
一旦你已經(jīng)明白你的用例,你就可以確定NoSQL是否適合你的項目。它可能是你的團隊已經(jīng)熟悉的已有工具,他們對此抱有期待。但Pasqua警告(反對),不要試圖強迫方釘釘入圓孔中。
Pasqua說:“我們在商業(yè)中看到很多這樣的情況。他們會找出他們的用例,而且知道他們想要完成什么。然后他們會說,‘讓我來做吧,我們有現(xiàn)成的工具和技術(shù)’。對于大量的項目而言,特別是那些要求大數(shù)據(jù)和數(shù)據(jù)靈活性的項目而言,他們經(jīng)常發(fā)現(xiàn)手中已有的工具不能工作。有時候他們還是會使用這些工具好幾年直到他們認(rèn)清事實:這些工具不能工作。”
這是Healthcare.gov崩潰的其中一個原因。Pasqua說,服務(wù)最初是建立在Oracle數(shù)據(jù)庫上,但是一個嚴(yán)格的底層數(shù)據(jù)模式的需求會給系統(tǒng)帶來巨大的壓力。所需的用例要求NoSQL具備敏捷性。Mark Logic作為其中一個供應(yīng)商能為他們提供幫助。Pasqua補充道“當(dāng)這些工具不適合或者NoSQL更適合解決你的問題時, 能分清這些狀況真的很重要”。
承認(rèn)NoSQL是顛覆性的
如果你決定在你的業(yè)務(wù)基礎(chǔ)建設(shè)里實現(xiàn)NoSQL你就必須要承認(rèn),——開始計劃——它將產(chǎn)生一種顛覆性的力量。
Pasqua 說:“NoSQL是具有顛覆性的,它的顛覆性體現(xiàn)在很多方面。從開發(fā)人員的角度來看,人們希望使用已有的工具和技術(shù)。即使他們決定想要做一些不一樣的事情,他們會形成一個關(guān)于如何構(gòu)建應(yīng)用程序和使用數(shù)據(jù)庫的整體思維。很自然地,他們會試圖采用這個經(jīng)驗,嘗試讓NoSQL以同樣的方式工作。但是它沒有。他們嘗試將NoSQL像SQL一樣使用,最終兩邊都做不好。你需要退后一步,考慮實際使用NoSQL的正確方式。不要試圖改變它,使它成為一個關(guān)系數(shù)據(jù)庫。這是一個新的模型,這是一個顛覆性的模型,我們要學(xué)會利用它。”
Pasqua說,例如,傳統(tǒng)的經(jīng)驗法則是,你的任何一個應(yīng)用程序都必須要有一大批數(shù)據(jù)庫管理員(DBA)。但他指出,在NoSQL的世界中,他只會看到一個數(shù)據(jù)庫管理員,可能在過去是10個。你可以不需要這些員工,將他們應(yīng)用到別的方面。成本模型,也將會改變。NoSQL就是一個基于硬件技術(shù)的擴展,商品。
Pasqua 說“你購買我們的方式,使用我們的方式,是非常不同的, 你可以買到很劃算的硬件和令其發(fā)展為你所需要的樣子。這真的影響到采購流程。你無須提前購買1000萬美元或2000萬美元的硬件,它會允許你通過采購周期很快的移動。在這方面做得很好的人善于利用這一點。”
從小事做起,然后逐漸提升
從相關(guān)小技術(shù)做起是很困難的。如果你是一個大公司,你已經(jīng)擁有成百上千的客戶,他們可能是個人也有可能是企業(yè),你將頻繁的遇到許多關(guān)于數(shù)據(jù)的不同政策的挑戰(zhàn),或者整合其他公司你所要求的數(shù)據(jù)。
Pasqua說:“把不同的數(shù)據(jù)孤島的數(shù)據(jù)集中到一起是一件大工程,而且數(shù)據(jù)量每天都在增長。”
使用相關(guān)技術(shù)解決這些數(shù)據(jù)孤島問題意味著:你必須從你要集中的數(shù)據(jù)中分清所有不同的數(shù)據(jù)孤島, 創(chuàng)建一個協(xié)調(diào)數(shù)據(jù)的模式,并開發(fā)和部署的ETL過程把所有數(shù)據(jù)集中在一起。這個過程可能需要幾個月甚至更長時間。
他說:“就像你看到隧道盡頭的光,你創(chuàng)建了一個新的產(chǎn)品或收購一家新公司或新的處理控制請求,你就回到了起點,你必須要提前建好所有的數(shù)據(jù)模型。”
他說,NoSQL的擴展性,基于商品的結(jié)構(gòu)和模式的靈活性意味著你可以從小規(guī)模的數(shù)據(jù)開始,但是你必須要很努力。你可以從混亂,非結(jié)構(gòu)化的數(shù)據(jù)開始,從它的正確方式獲得價值,然后必要的隨著時間添加結(jié)構(gòu)數(shù)據(jù)。
確認(rèn)企業(yè)中的決策者和執(zhí)行者
這不是NoSQL的唯一性。當(dāng)處理顛覆性改變,改變管理才可能是你的面對的***障礙。
Pasqua 說“沒有決策者,你會一事無成,但是你的團隊中也必須有實現(xiàn)者。”
實現(xiàn)具體的細(xì)節(jié)可以實現(xiàn)甚至打破你的初衷,所以在你的團隊中有把技術(shù)發(fā)揮到位的人,可以實現(xiàn)所有的改變。
明確約束和使用主動權(quán)的流程
必要的,你要反復(fù)思考你在NoSQL世界的流程。慣性可能是你***的約束之一。
他說:“目前的現(xiàn)狀可以看出,他們一直使用同樣的方法,順從自己內(nèi)心渴望去做這些事情 .”
通過新的技術(shù)理解你的用例和顛覆性改變,可以讓你評估你的流程,更好的利用新的能力。關(guān)鍵的架構(gòu)師和技術(shù)***會幫助你塑造這些流程,團結(jié)他們的企業(yè)。
明確你是否擁有正確的技能
Pasqua說:“擁有修改應(yīng)用程序的設(shè)計過程和系統(tǒng)應(yīng)用程序體系結(jié)的技能是很關(guān)鍵的,這有助于實現(xiàn)NoSQl。”
“擁有合適的技能是至關(guān)重要的,”他說。“這并不是說NoSQL很復(fù)雜。事實上,它通常更加簡單,但是它是不同的。許多人已經(jīng)在數(shù)據(jù)庫業(yè)務(wù)上工作了30年,他們曾經(jīng)使用過的唯一數(shù)據(jù)庫是關(guān)系數(shù)據(jù)庫。所以學(xué)習(xí)NoSQL他們沒有任何麻煩,但真的需要時間。”
培訓(xùn)是流程的一個至關(guān)重要部分。Pasqua提到Mark Logic現(xiàn)在提供所有的免費培訓(xùn),不管你是否是客戶。
非結(jié)構(gòu)化數(shù)據(jù)庫的數(shù)據(jù)庫管理(NoSQL DBMS)和查詢語言的估計理解
評估你的組織對NoSQL的理解和如何使用。
“你的人已經(jīng)是‘智能數(shù)據(jù)庫人’,”帕斯瓜說。“他們理解NoSQL不會有任何麻煩。從技術(shù)方法上這不是一個不可逾越的問題。它更多的是文化問題。”
形成緊迫感
幫助所有利益相關(guān)者了解您的NoSQL實現(xiàn)的需求以及了解他們期待獲得什么樣的回報。
如果你發(fā)展NoSQL,你的挑戰(zhàn)就是有些人已經(jīng)面臨***的底線和看不到未來的方向。
“通常這些人的問題是關(guān)于大數(shù)據(jù)和數(shù)據(jù)集成的,他們抓破腦袋,使用手中的工具想去解決問題,并且已經(jīng)花費了很多時間,” Pasqua說。“因為他們花費很多時間在這個問題上所以他們遭受著時間的壓力,但是結(jié)果還是走進了死胡同。我們看到的這些挑戰(zhàn)形成的緊張感籠罩著這些人。”
這可能是商業(yè)中以業(yè)務(wù)為導(dǎo)向或者以管理為導(dǎo)向的***期限,這些底限籠罩著人們。Pasqua 說,你要確保你的技術(shù)人員和負(fù)責(zé)采購的人員對***期限有足夠的緊迫感。“從小事做起,然后逐漸增加,并將其傳遞給所有的利益相關(guān)者。”
依靠經(jīng)驗,包括來自同行和顧問的
Pasqua說,經(jīng)驗改變一切。
“因為像Mark Logic這樣的技術(shù)真的很棒,但是它很容易令人走入陷阱,所以要能走出去,和那些使用這些技術(shù)并真正從中受益的人進行網(wǎng)絡(luò)交流和一起工作是非常重要的。如果某人正在使用Mark Logic,他們利用它來運作銀行或者作為他們訓(xùn)練系統(tǒng)的一部分。
Healthcare.gov正使用它來運行exchange。最棒的事情是你可以走出去和那些使用的人交流。從技術(shù),文化以及流程方面和他們交流,找到如何在你的企業(yè)中使用這些技術(shù),從而實現(xiàn)利益***化。”
如果你要引入第三方顧問,應(yīng)該尋找專業(yè)的結(jié)構(gòu)化服務(wù),能夠引入工程師和顧問,令你的人處于有利的地位。這比單純的專業(yè)服務(wù)更加獨立,能夠一直伴隨企業(yè)的發(fā)展。
作者:Thor Olavsrud,***信息官,熟悉IT安全,大數(shù)據(jù),開源技術(shù),微軟工具和服務(wù)器?,F(xiàn)居紐約、






















