偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

精碩科技劉喆:上不上云,需求說(shuō)了算

存儲(chǔ) 云計(jì)算
在大會(huì)的云計(jì)算基礎(chǔ)架構(gòu)與實(shí)踐分論壇上,精碩科技資深架構(gòu)師劉喆帶來(lái)了《云 Or not?》的主題演講。他從自身的工作實(shí)踐講起,談到了云的優(yōu)點(diǎn)和未來(lái)的發(fā)展趨勢(shì),并跟大家分享了哪些具體的業(yè)務(wù)應(yīng)該上云,哪些業(yè)務(wù)不能夠上云。

   由中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院主辦、51CTO承辦的“第七屆中國(guó)云計(jì)算標(biāo)準(zhǔn)和應(yīng)用大會(huì)”于2018年1月4日至1月5日在北京成功召開。本次大會(huì)全面展示我國(guó)云計(jì)算國(guó)家標(biāo)準(zhǔn)研制工作的成果,解讀國(guó)內(nèi)云計(jì)算產(chǎn)業(yè)政策,報(bào)告云計(jì)算標(biāo)準(zhǔn)化工作的重要進(jìn)展。同時(shí),大會(huì)還重磅發(fā)布了國(guó)家開源領(lǐng)域的標(biāo)準(zhǔn)化產(chǎn)物,分享了云計(jì)算***的技術(shù)趨勢(shì)和應(yīng)用創(chuàng)新成效,并頒發(fā)了云計(jì)算產(chǎn)品及解決方案第五批測(cè)評(píng)證書。此外,第二屆中國(guó)優(yōu)秀云計(jì)算開源案例評(píng)選結(jié)果也在大會(huì)現(xiàn)場(chǎng)公布。

[[216313]]

  在大會(huì)的云計(jì)算基礎(chǔ)架構(gòu)與實(shí)踐分論壇上,精碩科技資深架構(gòu)師劉喆帶來(lái)了《云 Or not?》的主題演講。他從自身的工作實(shí)踐講起,談到了云的優(yōu)點(diǎn)和未來(lái)的發(fā)展趨勢(shì),并跟大家分享了哪些具體的業(yè)務(wù)應(yīng)該上云,哪些業(yè)務(wù)不能夠上云。雖然劉老師的演講時(shí)間比較靠后,但生動(dòng)活潑的演講仍然吸引了大批聽眾的認(rèn)真聆聽。

  以下為演講實(shí)錄:

  大家下午好!

  我看到現(xiàn)在還有這么多聽眾愿意在這兒聽我跟大家扯,感覺(jué)特別特別高興,現(xiàn)在坐在這里的都是真愛(ài)。受到大會(huì)的邀請(qǐng)跟大家做演講,如果我還講一些技術(shù)、細(xì)節(jié)、實(shí)現(xiàn)、優(yōu)化好像沒(méi)有太大的必要,因?yàn)檫@些東西大家可以在網(wǎng)上看到,可以跟身邊的人交流得到,我想了想準(zhǔn)備做這樣一個(gè)分享,就是云Or not。我叫劉喆,在場(chǎng)的有不認(rèn)識(shí)我的嗎?沒(méi)有人舉手,大家都認(rèn)識(shí)我,我來(lái)自于精碩科技,我們公司每天處理的數(shù)據(jù)量太大,每天超過(guò)一百億的數(shù)據(jù)增量,所以跟云和大數(shù)據(jù)相關(guān)。

  不是所有的業(yè)務(wù)都適合上云

  一切有云、有AI的地方必須涉及到大數(shù)據(jù),這是騰訊的馬化騰說(shuō)的一句話。在深圳的高鐵站有一個(gè)更大的照片,那個(gè)圖片我找不到了,只找到這個(gè),那句話?cǎi)R化騰是這樣說(shuō)的:“未來(lái)在云上用大數(shù)據(jù)來(lái)處理人工智能”。這句話說(shuō)的特別到位,或者特別高大上而全。之所以把這個(gè)圖片放在這里,寫了個(gè)“云”,打一個(gè)問(wèn)號(hào),我們真的要把所有的東西都放在云上去嗎?除了跟大家分享技術(shù)方面的東西,還想給每一個(gè)在座的做更多云以外的分享,怎么樣能讓大家升職加薪,相信這一點(diǎn)大家都會(huì)非常關(guān)注。大家都想升職加薪,怎么樣才能做到呢?我們CEO經(jīng)常跟我們說(shuō)的一句話是要想升職,要想加薪就要讓你的老板無(wú)事可做。我的老板經(jīng)常問(wèn)我,這個(gè)東西要上云嗎?我要先替他想這個(gè)東西要上云嗎?到時(shí)候你給他一個(gè)12345,老板就很高興,你不升職加薪才怪。

  云的優(yōu)點(diǎn)有很多很多,相信各位已經(jīng)聽的不厭其煩了,簡(jiǎn)單列幾個(gè):***個(gè),按需付錢,節(jié)省成本。第二混合編排,充分利用資源。第三,占機(jī)器眾多,使用不充分,放在云上比較合適。

  “成本、資源、放在云上”,這幾個(gè)詞也是我們經(jīng)常要考慮的點(diǎn),云真的省成本嗎?我們以前做過(guò)一個(gè)計(jì)算,當(dāng)你的數(shù)據(jù)量在500臺(tái)服務(wù)器上可以放下的時(shí)候,放在云上和放在云下其實(shí)成本是差不多的,大家可以記得這個(gè)數(shù)字,以后如果有人要做一個(gè)什么決策,可以參考一下這個(gè)數(shù)字。

  放到云上真的能充分利用資源嗎?但是其實(shí)不一定,后面跟大家分享兩個(gè)案例來(lái)講講關(guān)于資源這個(gè)事情。所有搞大數(shù)據(jù)的同學(xué)都會(huì)知道,占的機(jī)器特別多,使用充分嗎?不一定。之前給一個(gè)企業(yè)做內(nèi)訓(xùn)的時(shí)候了解到他們的服務(wù)器超級(jí)的牛,相對(duì)我們來(lái)說(shuō)已經(jīng)牛了好幾代,比如說(shuō)一個(gè)硬盤8T,一個(gè)機(jī)器12臺(tái)硬盤,內(nèi)存最小的是256G。我說(shuō)你們機(jī)器不會(huì)出問(wèn)題嗎?不出問(wèn)題,怎么出問(wèn)題?多少臺(tái)機(jī)器,一千多吧,你說(shuō)一千多臺(tái)這樣的機(jī)器放一起怎么可能出問(wèn)題呢?我們經(jīng)常碰到的問(wèn)題是什么?老板,硬盤快寫滿了怎么辦?趕緊加機(jī)器,我說(shuō)你們不需要加嗎?我們不需要加,我們硬盤使用率在15%左右,我就發(fā)現(xiàn)沒(méi)法跟他對(duì)話了,使用不充分,放在云上正合適。是嗎?

  我們有一些業(yè)務(wù)是放在云上的,我就被我的客戶問(wèn)了這樣一個(gè)問(wèn)題,我想把阿里云的大數(shù)據(jù)框架處理AWS的文件,因?yàn)樗奈募旁趤嗰R遜上,但是它有一部分業(yè)務(wù)在阿里云上,他說(shuō)阿里云的大數(shù)據(jù)平臺(tái)比較好用,我想處理一下AWS,我們就灰頭灰臉的,我沒(méi)有辦法,我說(shuō)不行,那我的數(shù)據(jù)在AWS上怎么辦呢?我還是不行。數(shù)據(jù)不好搞了,我自己搞,我又搞了一份上去。另外,由于各種原因,阿里云漲價(jià)了,老板說(shuō)阿里云太貴了,我們想換個(gè)平臺(tái),我還是整不了。沒(méi)辦法,我只能用私有云,我不用他們折騰了,我自己搞,因?yàn)闈q價(jià)歸他管,我自己公司有私有云。但是我們是面向企業(yè)用戶的,我的客戶來(lái)說(shuō),我不能把我的數(shù)據(jù)放在你的云上,我可以放在阿里云上,又繞回去了,很煩??赡艽蠹疫€沒(méi)有遇到這樣的問(wèn)題,但是總有一天你們會(huì)遇到,我們遇到這么多,他怎么溝通,怎么互相通信呢?這始終是一個(gè)問(wèn)題,如果你沒(méi)想這個(gè)事情,等你老板來(lái)問(wèn)你你就傻眼了,像我一樣,怎么在阿里云上處理AWS,可能你一開始不建議他這么玩。 我們?cè)趺赐?我們是玩私有云,因?yàn)橥饷娴氖遣豢煽氐?,我們不想被任何一個(gè)平臺(tái)綁架。

  我剛才說(shuō)過(guò)一個(gè)數(shù)字:500臺(tái)。很多很多交流過(guò)的公司,特別是創(chuàng)業(yè)公司他們數(shù)據(jù)量很小,我們也在做大數(shù)據(jù),我們有多少多少數(shù)據(jù),我一聽就“呵呵了……沒(méi)有超過(guò)500臺(tái)的不要跟我說(shuō)大數(shù)據(jù),我們有一天兩三個(gè)G的數(shù)據(jù),我們不考慮這個(gè)事情,因?yàn)槟阍诎⒗镌粕贤娴暮芎茫憔驮谀莾和?,如果你的?shù)據(jù)量很小,你就扔在公有云,你就在哪兒玩,所有你需要的東西它都有,KV、存儲(chǔ)、計(jì)算,大數(shù)據(jù)的計(jì)算,人工智能的計(jì)算,語(yǔ)音、視頻什么東西都能搞。如果你的量很大,我把這些東西都扔到公有云上,遲早會(huì)玩死你的。

  我們會(huì)有一個(gè)目標(biāo),叫資源優(yōu)化。當(dāng)然所有寫程序的同學(xué)都不會(huì)想這個(gè)事情,上來(lái)想老板提了一個(gè)功能趕緊做完,但是如果你后面還不去想,你怎么升職加薪呢?優(yōu)化的前提是度量,度量,度量,重要的事情說(shuō)三遍。我們是一家做度量的公司,所有的東西先度量了之后才說(shuō)其它。當(dāng)然,這個(gè)東西在其他公司可能有另外一種表述,叫“用數(shù)據(jù)說(shuō)話”。大家可以記得這一句話,“用數(shù)據(jù)說(shuō)話”,有人講我有多少多少臺(tái)東西扔到云上,然后就怎么樣。你先給我一個(gè)數(shù)據(jù)看一下,如果沒(méi)有數(shù)據(jù)不要在這兒說(shuō)優(yōu)化也一樣。我們用私有云優(yōu)化了什么什么東西,數(shù)據(jù)在哪里?如果沒(méi)有相關(guān)的數(shù)據(jù)支撐,你可以測(cè)試。我不知道這樣好不好,我可以測(cè)一下,測(cè)出來(lái)的數(shù)據(jù)告訴我,這樣可能是好的,也可能是不好的,有了度量你太可能做后面所謂的優(yōu)化。

  非集群類的需求不上云

  我們最終的結(jié)論是非集群類的需求不上云。比如說(shuō)一個(gè)前端機(jī),有人訪問(wèn)你的頁(yè)面扔上去,沒(méi)問(wèn)題,比如說(shuō)你有一個(gè)Mysql數(shù)據(jù)庫(kù),如果在公有云上不需要考慮安全不安全,就扔上去,所有集群類的需求我給他們做決策都是不要放在云去。比如說(shuō)hadoop,你說(shuō)我扔到云上吧,可以,但是不建議。為什么?所有集成類的應(yīng)用,在設(shè)計(jì)之初就是想著我自己怎么樣容錯(cuò),我自己怎么樣擴(kuò)展。所有集成類的都是上一些假設(shè),東西都是壞的,哪一天我要擴(kuò)展,這個(gè)東西跟云設(shè)計(jì)之初的想法是一樣的。昨天一個(gè)同學(xué)問(wèn)我一個(gè)事情特別有意思,我在阿里云上做了一個(gè)Hadoop,我能不能把它副本同一個(gè)變成三個(gè),一個(gè)副本也沒(méi)有問(wèn)題,它不會(huì)丟棄。但是問(wèn)題來(lái)了,Hadoop設(shè)計(jì)之初根本沒(méi)有考慮過(guò)你在底層做三備份,在我看來(lái)只有一個(gè),我不知道你做了三備份,所有針對(duì)三備份的優(yōu)化你都用不了,在他看來(lái)就是一備份,他知道這個(gè)在哪個(gè)機(jī)架上,所以所有集成類的我們都不建議他扔到云上去。

  另一個(gè),度量,有了數(shù)據(jù)支撐才能好的決策,否則就是瞎猜。,現(xiàn)在可以說(shuō)我現(xiàn)在就是瞎猜,我歡迎所有人說(shuō)我現(xiàn)在就是瞎猜,因?yàn)槲覜](méi)有這個(gè)數(shù)據(jù)。我們就是靠做度量起家的,度量什么呢?廣告,我們給廣告主度量,這個(gè)廣告做在這里是不是有效的,你做完了我給你評(píng)價(jià),今天放在這里沒(méi)有人看你的廣告,你在優(yōu)酷做了一個(gè)廣告,今天看你廣告的有兩百萬(wàn)人,放在搜狐變成五百萬(wàn)人,我兩個(gè)數(shù)據(jù)放在這里,哪個(gè)有效呢?我不用告訴你。程序的優(yōu)化靠時(shí)間分析,Profiler。

  資源的優(yōu)化,找出浪費(fèi)的大頭,比如說(shuō)看見(jiàn)這個(gè)程序大部分時(shí)間CPU忙的要死,把它拆開跑,內(nèi)存占用太大,跑著跑著爆掉了,自己看哪里的問(wèn)題。

  什么樣的非集群的需求上到云上?前端,開發(fā)機(jī),相信每一個(gè)公司里面都會(huì)有一些開發(fā)機(jī),應(yīng)用人員要寫應(yīng)用,要是,開發(fā)機(jī)測(cè)試統(tǒng)統(tǒng)扔到云上去沒(méi)有任何問(wèn)題,因?yàn)樗?fù)載也不高,掛了也沒(méi)關(guān)系,安全性也沒(méi)有那么高的要求,掛就掛了。

  數(shù)據(jù)庫(kù),如果一些不重要的數(shù)據(jù)庫(kù),你就扔上去就好了,他使用率也不高。尤其現(xiàn)在有一種東西特別建議扔在云上去,就是前端,我們的前端都是用容器扔到云上面去的,曾經(jīng)有一次我們?cè)噲D把它拿出來(lái),然后就發(fā)現(xiàn)各種坑,因?yàn)镴S這個(gè)東西依賴的東西太多了,一會(huì)兒依賴這個(gè),一會(huì)兒依賴那個(gè),如果你沒(méi)有,這個(gè)機(jī)器掛了,重新部署一遍。

  集群類的需求,不上云怎么辦呢?我們用Yarn管理所有統(tǒng)一的大數(shù)據(jù)應(yīng)用,像Hive/MR/Storm/Spark/Flink,給大家講一個(gè)案例,ES,原來(lái)這個(gè)東西是布在docker上面,他們問(wèn)我這個(gè)東西經(jīng)常跑著跑著掛,怎么優(yōu)化一下。沒(méi)有度量就沒(méi)有優(yōu)化,我們就去看這個(gè)東西為什么老是掛呢?到底哪里占的比較高?去分析,發(fā)現(xiàn)沒(méi)有任何東西,沒(méi)有明顯的顯示CPU很高,內(nèi)存很高,但是它就是掛。發(fā)現(xiàn)在docker上面跑的,把它拿出來(lái),一看別人跑的是OpenJdk,不知道大家知不知道這個(gè)埂?在docker早期的時(shí)候關(guān)于Jdk,全部是openJdk,我們發(fā)現(xiàn)有一個(gè)問(wèn)題,某些情況下你拿openJdk可以跑這些JAVA的大數(shù)據(jù)的應(yīng)用,但是某些情況下就是會(huì)出問(wèn)題。跑著跑著就掛了,我們沒(méi)有深究為什么,我們統(tǒng)一把這些東西搞出來(lái),放在JDK上就Ok了。我們現(xiàn)在嘗試在測(cè)試集群上把H扔進(jìn)去,我們的老板不關(guān)心技術(shù),你部署一次環(huán)境浪費(fèi)時(shí)間那么多天,200臺(tái)機(jī)器什么時(shí)候好?我說(shuō)兩天,太慢了,扔在docker瞬間搞定了,然后發(fā)現(xiàn)這個(gè)程序跑的很慢,雖然沒(méi)有慢那么多,中間加了一層總是會(huì)慢的,大家會(huì)覺(jué)得沒(méi)慢多少,總是會(huì)慢的。在這種情況下,“差之毫厘,謬之千里”,慢了0.01秒,你一天做那么多的計(jì)算,那你可以想象。

  大數(shù)據(jù)放在云上并不是都能省資源

  問(wèn)題就來(lái)了,大數(shù)據(jù)放在云上不是也可以省資源嗎?其實(shí)云一開始想解決的問(wèn)題就是你一會(huì)兒一個(gè)波峰,一會(huì)兒一個(gè)波谷,我把這個(gè)東西消掉,你需要的時(shí)候給你,不需要給你減了,一開始解決這個(gè)問(wèn)題,如果一開始解決了,他天天忙的要死,上哪兒節(jié)省資源去?下一個(gè)問(wèn)題大數(shù)據(jù)計(jì)算中大家覺(jué)得成本***的是什么,谷歌每年會(huì)會(huì)一個(gè)大會(huì),那個(gè)大會(huì)的內(nèi)容一般不歸關(guān)注,但是名字很有意思,叫IO大會(huì)。

  其實(shí)大數(shù)據(jù)里面最慢的就是IO,網(wǎng)絡(luò)也好,硬盤也好。虛擬化技術(shù)里面如果你想提高性能,最簡(jiǎn)單的事情是所有的東西都本地化,你永遠(yuǎn)不要去訪問(wèn)網(wǎng)絡(luò),永遠(yuǎn)不要去訪問(wèn)問(wèn)盤,永遠(yuǎn)不要訪問(wèn)別人的CPU和別人的硬盤。

  比如說(shuō)我要讀一個(gè)數(shù)據(jù),在你的云上可能覺(jué)得我是讀的本地的呀,但是其實(shí)是不是呢?不一定,如果你讀的真是物理機(jī)本地的,它是會(huì)快的,如果你讀的東西要跨網(wǎng)絡(luò),肯定受限于網(wǎng)絡(luò)。昨天一個(gè)同事找我說(shuō),我要從集群上拿一個(gè)東西拿不下來(lái),怎么回事,你去看一看我們的監(jiān)控你就會(huì)發(fā)現(xiàn)所有跑集群計(jì)算的交換機(jī)都是滿的,網(wǎng)絡(luò)都是滿的,***的瓶頸就是你要讀別人的數(shù)據(jù)把你卡住,你是在沒(méi)有辦法,如果你只讀本地的,取決于你的硬盤,最快的是CPU讀case最快,case讀硬盤最快。

  谷歌的大會(huì)叫IO大會(huì),IO和Shuffle,是幾乎所有大數(shù)據(jù)計(jì)算框架最關(guān)心性能問(wèn)題,你要優(yōu)化,其實(shí)優(yōu)化就是本地化,盡量讀自己的。方案就是locallzing把東西拷到自己這里來(lái)。比如說(shuō)Mem page配置預(yù)讀,內(nèi)存比配置快一千倍,你可以預(yù)先讀。最早的時(shí)候MR出來(lái)之所以先于現(xiàn)在大數(shù)據(jù)計(jì)算這一波過(guò)來(lái),他自己設(shè)定的時(shí)候就是我假定如果你有資源怎么辦?誰(shuí)離我近我在哪兒跑,不要讓我讀網(wǎng)絡(luò),讀網(wǎng)絡(luò)很慢。程序設(shè)計(jì)里面其實(shí)更多,我們知道邏輯判斷有個(gè)東西叫短路。大數(shù)據(jù)放到云上會(huì)有那些問(wèn)題呢?大數(shù)據(jù)平臺(tái)都是基于物理機(jī)設(shè)計(jì)的,我們現(xiàn)在跑的Hadup,什么Spark,沒(méi)有哪個(gè)平臺(tái)說(shuō)我是基于云設(shè)計(jì)的?,F(xiàn)在云平臺(tái)上他們自己提供這種能力,自己有EMR,可能是根據(jù)自己的云又設(shè)計(jì)的一套大數(shù)據(jù)的計(jì)算框架,可能是。但是如果你用的是原生的,我還要用到云上這樣用,他不是為你的云設(shè)計(jì)的。

  硬盤是不靠譜的,因?yàn)樗紤]到擴(kuò)容,考慮到容災(zāi),要做副本,但是其實(shí)云上面他已經(jīng)給你做了副本,就是剛才講的那個(gè)例子,這兩個(gè)副本怎么處理呢?要么就是浪費(fèi),要么就是低效。下面這兩個(gè)已經(jīng)講過(guò)了,讀寫網(wǎng)絡(luò)是比較慢的。為防止數(shù)據(jù)一下子壞掉,要放在不同的地方,大數(shù)據(jù)框架一般都會(huì)想的一個(gè)點(diǎn),數(shù)據(jù)會(huì)壞,壞了怎么辦?不要把雞蛋放在一個(gè)籃子里,要放在不同的地方,現(xiàn)在把這個(gè)東西扔到云上,問(wèn)題來(lái)了,我怎么知道我所謂的不同地方是不是在一起?應(yīng)用 框架說(shuō)我放在不同的地方你放心吧,結(jié)果在云上這倆就是在一起,結(jié)果這個(gè)機(jī)器掛了,他說(shuō)我沒(méi)有放在一起,下面說(shuō)你就是放在一起了。這個(gè)過(guò)程很可怕。

  我希望大家只記住一句話,替你老板想你才能升職加薪,因?yàn)樯厦孢@些問(wèn)題都是我老板天天問(wèn)我的。謝謝!

責(zé)任編輯:張誠(chéng) 來(lái)源: 51CTO
相關(guān)推薦

2016-09-23 11:32:28

2016-12-08 11:39:00

騰訊云

2018-07-18 12:25:20

2011-09-02 09:58:21

云計(jì)算數(shù)據(jù)

2012-06-14 09:27:07

免費(fèi)WIFIWIFI

2020-09-21 10:29:48

AI人工智能產(chǎn)品迭代

2021-01-13 22:40:57

人工智能房地產(chǎn)疫情

2009-03-25 11:12:55

2011-01-25 16:25:29

數(shù)據(jù)中心

2014-08-25 13:13:54

傲游瀏覽器

2013-10-25 09:11:28

可編程WANSDN軟件定義網(wǎng)絡(luò)

2015-04-01 10:06:45

4GTD-LTELTE FDD

2011-04-28 11:05:30

黑白打印機(jī)

2016-09-29 17:00:40

存儲(chǔ)

2016-11-25 23:04:00

AdMaster架構(gòu)實(shí)踐

2019-07-17 15:53:54

AIIBM績(jī)效管理

2017-08-21 11:10:26

大數(shù)據(jù)

2022-12-19 14:31:22

馬斯克推特

2018-10-10 08:46:55

IPv4IPv6根服務(wù)器

2016-11-02 10:44:56

AdMasterNoSQLLambda
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)