怎么理解分布式、高并發(fā)、多線程
一、什么是分布式?
分布式更多的是一個概念,是為了解決單個物理服務(wù)器容量和性能瓶頸問題而采用的優(yōu)化手段,該領(lǐng)域需要解決的問題極多,在不同的技術(shù)層面上,又包括:分布式文件系統(tǒng)、分布式緩存、分布式數(shù)據(jù)庫、分布式計算等,一些名詞如Hadoop、zookeeper、mq等都跟分布式有關(guān)。從理念上講,分布式的實現(xiàn)有兩種形式:
- 水平擴(kuò)張
當(dāng)一臺機(jī)器扛不住流量時,就通過添加機(jī)器的方式,將流量平分到所有的服務(wù)器上,所有機(jī)器都可以提供相當(dāng)?shù)姆?wù)。
- 垂直拆分
前端有多種查詢需求時,一臺機(jī)器扛不住,可以將不同的需求分發(fā)到不同的機(jī)器上,比如A機(jī)器處理訂單查詢的請求,B機(jī)器處理支付的請求。
二、什么是高并發(fā)?
相對于分布式來講,高并發(fā)在解決的問題上會集中一些,其反應(yīng)的是同時有多少量:比如在線直播服務(wù),同時有上萬人觀看。
高并發(fā)可以通過分布式技術(shù)去解決,將并發(fā)流量分到不同的物理服務(wù)器上。但除此之外,還有很多其它優(yōu)化手段:比如使用緩存系統(tǒng),將所有的,靜態(tài)內(nèi)容放到CDN等;還可以使用多線程技術(shù)將一臺服務(wù)器的服務(wù)能力最大化。
三、什么是多線程?
多線程是指軟件或者硬件上實現(xiàn)多個線程并發(fā)執(zhí)行的技術(shù),它更多的是解決CPU調(diào)度多個進(jìn)程的問題,從而讓這些進(jìn)程看上去是同時執(zhí)行(實際上是交替運行的)。
這幾個概念中,多線程解決的問題是最明確的,手段也是比較單一的,基本上遇到的最大問題就是線程安全。在JAVA語言中,需要對JVM內(nèi)存模型、指令重排等深入了解,才能寫出一份高質(zhì)量的多線程代碼。
四、總結(jié)
分布式是從物理資源的角度將不同的機(jī)器組成一個整體對外服務(wù),技術(shù)范圍非常廣且難度非常大,有了這個基礎(chǔ),高并發(fā)、高吞吐等系統(tǒng)就很容易構(gòu)建;
高并發(fā)是從業(yè)務(wù)的角度去描述系統(tǒng)的能力,實現(xiàn)高并發(fā)的手段可以采用分布式,也可以采用諸如緩存、CDN等,當(dāng)然也包括多線程;
多線程則聚焦于如何使用編程語言將CPU調(diào)度能力最大化。