分布式計(jì)算的背景?
計(jì)算機(jī)已經(jīng)發(fā)展到成為大多數(shù)復(fù)雜計(jì)算任務(wù)的第一工具。常見的計(jì)算方法分為集中式計(jì)算和分布式計(jì)算,集中式計(jì)算任務(wù)完全依靠一臺(tái)大型中央計(jì)算機(jī)的處理能力。
分布式計(jì)算則相反,大量的計(jì)算任務(wù)被仔細(xì)地切分到集群中的各個(gè)節(jié)點(diǎn)。分布式計(jì)算比集中式計(jì)算面臨更多挑戰(zhàn),但由于其各種優(yōu)勢(shì),它也可以處理更多的任務(wù)。
三種計(jì)算任務(wù)類型
以下是三種比較常見的分布式計(jì)算任務(wù)類型:
不需要迭代處理的計(jì)算任務(wù)。例如典型的WordCount,可以使用Hadoop MapReduce進(jìn)行處理。
需要迭代處理的圖計(jì)算任務(wù)。例如網(wǎng)頁(yè)P(yáng)ageRank計(jì)算,可以使用Spark、Naiad進(jìn)行處理。
需要迭代處理的機(jī)器學(xué)習(xí)任務(wù)。例如計(jì)算擁有大數(shù)據(jù)邏輯回歸任務(wù),可以使用Spark、參數(shù)服務(wù)器進(jìn)行處理。
?