Cloudera 將Spark加入Hadoop

袁紹龍發(fā)表于：14年02月07日 10:35 [原創(chuàng)] DOIT.com.cn

分享：

[導(dǎo)讀]近日，Cloudera正式宣布開始商業(yè)支持Apache Spark 機器學(xué)習(xí)和數(shù)據(jù)流處理環(huán)境。

Spark作為一個通用的并行計算框架，已經(jīng)成為繼Hadoop之后又一大熱門開元項目，逐漸獲得很多企業(yè)的支持。近日，Cloudera正式宣布開始商業(yè)支持Apache Spark 機器學(xué)習(xí)和數(shù)據(jù)流處理環(huán)境。

Spark內(nèi)存計算框架適合各種迭代算法和交互式數(shù)據(jù)分析，能夠提升大數(shù)據(jù)處理的實時性和準確性。而MapReduce處理框架則擅長復(fù)雜的批處理操作、登陸過濾、ETL（數(shù)據(jù)抽取、轉(zhuǎn)換、加載）、網(wǎng)頁索引等應(yīng)用，MapReduce在低延遲業(yè)務(wù)上一直被人所詬病。

圖一：Spark內(nèi)存計算框架。

“Spark記錄著數(shù)據(jù)產(chǎn)生的每一個操作，能夠可靠地將這些數(shù)據(jù)存儲在內(nèi)存之中，這使得它非常適用于第掩飾的計算和有效的迭代算法。”Cloudera表示。

據(jù)悉，Cloudera Enterprise Data Hub版本提供多種先進的組件的無限支持，如交互式SQL分析的Impala、交互式搜索、導(dǎo)航數(shù)據(jù)管理以及Hbase NoSQL。Enterprise Flex版本則提供可選擇組件版本，Enterprise Basic版本則是僅僅提供Hadoop基礎(chǔ)核心組件。

根據(jù)Cloudera介紹，Cloudera將會在兩個版本中安裝支持Spark組件。用戶可以利用它作為Enterprise Flex版本中一個可選組件，或者作為Enterprise Data Hub版本中包含的組件。

圖二：Spark On YARN

據(jù)悉，該產(chǎn)品采用了Spark 0.9.0，Spark獨立模式已經(jīng)在Cloudera Enterprise Data Hub4.4.0中測試過。在不久的將來，Cloudera表示Enterprise 5.0和YARN中也將支持Spark。

延伸閱讀：敢為人先優(yōu)酷土豆用Spark完善大數(shù)據(jù)分析

[責(zé)任編輯：袁紹龍]

IDC：服務(wù)器和存儲引領(lǐng)2014年IT支出復(fù)蘇

根據(jù)知名市場調(diào)研公司IDC公布的最新數(shù)據(jù)表明，2014年全球IT開支將增長4.6%，主要因為企業(yè)著手升級存儲、服務(wù)器以及網(wǎng)絡(luò)設(shè)備等IT基礎(chǔ)設(shè)施。

官方微信

相關(guān)閱讀

精彩專題更多

2014企業(yè)級IT風(fēng)云榜

存儲風(fēng)云榜”是由DOIT傳媒主辦的年度大型活動。回顧2014年，存儲作為IT系統(tǒng)架構(gòu)中最基礎(chǔ)的元素，已經(jīng)成為了推動信息產(chǎn)業(yè)發(fā)展的核心動力，存儲產(chǎn)業(yè)的發(fā)展邁向成熟，數(shù)據(jù)經(jīng)濟的概念順勢而為的提出。

華為OceanStor V3開啟全融合數(shù)據(jù)架構(gòu)時代

華為OceanStor V3系列存儲系統(tǒng)是面向企業(yè)級應(yīng)用的新一代統(tǒng)一存儲產(chǎn)品。在功能、性能、效率、可靠性和易用性上都達到業(yè)界領(lǐng)先水平，很好的滿足了大型數(shù)據(jù)庫OLTP/OLAP、文件共享、云計算等各種應(yīng)用下的數(shù)據(jù)存儲需求。

聯(lián)想亮相高交會

聯(lián)想攜ThinkServer+System+七大行業(yè)解決方案驚艷第十六屆高交會

国产精品一区二区av交换,中文字幕人成无码免费视频,永久免费av无码网站性色av,欧美一道本一区二区三区,樱桃熟了a级毛片

Cloudera 將Spark加入Hadoop