百科創(chuàng)建
13.6K
3940

Spark計算引擎

為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎。

Spark計算引擎是美國加利福尼亞大學(xué)伯克利分校的算法、機器和人(algorithms machines and people,AMP)實驗室所開源的Hadoop映射-化簡(MapReduce)的通用并行框架。Spark擁有MapReduce所具有的優(yōu)點,不同于MapReduce的是其工作中間輸出結(jié)果可以保存在內(nèi)存中,從而不再需要讀寫Hadoop分布式文件系統(tǒng)(Hadoop distributed file system,HDFS),因此Spark能更好地適用于數(shù)據(jù)挖掘與機器學(xué)習(xí)等需要迭代的MapReduce的算法。

Spark的核心概念是彈性分布式數(shù)據(jù)集(resilient distributed datasets,RDD)。從本質(zhì)上來說,RDD是分布式內(nèi)存的一個抽象概念,RDD提供了一種高度受限的共享內(nèi)存模型,即RDD是只讀的記錄分區(qū)的集合,只能通過在其他RDD執(zhí)行確定的轉(zhuǎn)換操作而創(chuàng)建,然而這些限制使得實現(xiàn)容錯的開銷很低。對開發(fā)者而言,RDD可以看作是Spark的一個對象,它本身運行于內(nèi)存中,如讀文件是一個RDD,對文件計算是一個RDD,結(jié)果集也是一個RDD,不同的分片、數(shù)據(jù)之間的依賴、鍵值類型的映射數(shù)據(jù)都可以看作RDD。

Spark已經(jīng)形成了較為完整的生態(tài)圈,其中包括:Spark Core是Spark的核心應(yīng)用程序接口(application program interface,API),實現(xiàn)了很多基本的RDD轉(zhuǎn)換操作;Spark SQL是Spark針對結(jié)構(gòu)化數(shù)據(jù)的API,能夠使SQL對結(jié)構(gòu)化數(shù)據(jù)進行標(biāo)準(zhǔn)分析;Spark Streaming是Spark針對流數(shù)據(jù)的API,可以實現(xiàn)對大規(guī)模數(shù)據(jù)流以元組為單位低延遲的處理;Spark MLib是Spark針對機器學(xué)習(xí)任務(wù)的API,可以有效地進行大規(guī)模迭代計算;Spark GraphX是Spark針對圖數(shù)據(jù)的API。

3940

免責(zé)聲明:本站詞條系由網(wǎng)友創(chuàng)建、編輯和維護,內(nèi)容僅供參考。

以上內(nèi)容均為商業(yè)內(nèi)容展示,僅供參考,不具備專業(yè)問題解決服務(wù),

如果您需要解決具體問題(尤其在法律、醫(yī)學(xué)等領(lǐng)域),建議您咨詢相關(guān)領(lǐng)域的專業(yè)人士。

如您發(fā)現(xiàn)詞條內(nèi)容涉嫌侵權(quán),請通過 948026894@qq.com 與我們聯(lián)系進行刪除處理!

一秒推
主站蜘蛛池模板: 亚洲欧美视频网站| 国产超碰人人模人人爽人人喊| 无码精品a∨在线观看中文 | 国产电影麻豆入口| 台湾一级淫片高清视频| 久久久久一区二区三区| 贵妇的脚奴视频vk| 日本一本二本免费播放视频| 国产免费拔擦拔擦8x| 久久国产免费观看精品| 青青国产成人久久91网站站| 日本三级带日本三级带黄首页| 国产专区中文字幕| 亚洲xxxx18| 婷婷综合缴情亚洲狠狠图片| 浪潮AV色综合久久天堂 | 国产亚洲综合一区二区在线| 久久免费观看国产精品| 草莓视频丝瓜视频-丝瓜视18岁苹果免费网| 日本精品一区二区三区视频| 国产精品亚洲专一区二区三区| 亚洲婷婷综合色高清在线| 男女无遮挡动态图| 最近中文字幕mv图| 国产偷人视频免费观看| 中文字幕精品一区二区精品| 精品国产一区二区三区无码| 日韩毛片最新看| 国产乱女乱子视频在线播放 | 国产国产人免费人成免费视频| 久久国产精品久久| 美女范冰冰hdxxxx| 教官你的太大了芊芊h| 动漫人物将机机插曲3d版视频| 久久久久久亚洲精品中文字幕 | 色偷偷人人澡人人爽人人模| 成人免费看黄20分钟| 人人爽人人爽人人片av免费| 又大又硬又爽又粗又快的视频免费 | 国产成人免费a在线资源| 久久久久久国产精品免费免费男同 |