該圖片由OpenClipart-VectorsPixabay上發(fā)布

同時(shí),在經(jīng)濟(jì)危機(jī)的沖擊之下,影院面臨著經(jīng)營(yíng)壓力,為了增加營(yíng)收,許多影院開(kāi)始售賣(mài)爆米花,很快,在電影院營(yíng)收財(cái)務(wù)數(shù)據(jù)中,爆米花的收入和門(mén)票收入都變得非常重要,看電影時(shí)手捧爆米花成了電影觀眾風(fēng)靡全球的標(biāo)準(zhǔn)操作,直到2021年也是如此。

影院和爆米花的結(jié)合可謂是最佳拍檔,客觀上推動(dòng)了院線的經(jīng)營(yíng)和發(fā)展。長(zhǎng)遠(yuǎn)來(lái)看,由于它可以補(bǔ)貼票價(jià),讓更多觀眾愿意走進(jìn)電影院,或多或少對(duì)于電影文化的傳播乃至電影產(chǎn)業(yè)的發(fā)展起到了積極作用。

而在最近,全球最大的企業(yè)級(jí)存儲(chǔ)企業(yè)戴爾科技集團(tuán)宣布存儲(chǔ)平臺(tái)PowerScale,通過(guò)了企業(yè)大數(shù)據(jù)分析平臺(tái)Cloudera最嚴(yán)苛的QATS認(rèn)證,戴爾的存儲(chǔ)平臺(tái)和Cloudera的結(jié)合契合度非常高,兩者的強(qiáng)強(qiáng)聯(lián)合成立造就了數(shù)據(jù)經(jīng)濟(jì)時(shí)代的一對(duì)最佳拍檔,堪比電影和爆米花。

存儲(chǔ)平臺(tái)與數(shù)據(jù)分析平臺(tái)的緊密結(jié)合

PowerScale是戴爾在2010年推出的NAS文件存儲(chǔ)平臺(tái),是久經(jīng)考驗(yàn)的Isilon存儲(chǔ)平臺(tái)的續(xù)作,是最具代表性的橫向擴(kuò)展NAS。在如今非結(jié)構(gòu)化數(shù)據(jù)大爆炸的年代,PowerScale這種非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)平臺(tái),在全球范圍內(nèi)得到了越來(lái)越多的應(yīng)用。

企業(yè)都明白,數(shù)據(jù)只是存起來(lái)是不夠的,要有用起來(lái)才更有價(jià)值。

于是,企業(yè)都想變成大數(shù)據(jù)驅(qū)動(dòng)型組織,因?yàn)檫@種組織更容易獲得客戶(hù)資源,更容易留下老客戶(hù),更容易提高市場(chǎng)份額,也就是說(shuō),擅長(zhǎng)利用大數(shù)據(jù)的企業(yè)往往活的更好。但是想變成大數(shù)據(jù)驅(qū)動(dòng)型組織挺難,需要解決數(shù)據(jù)安全性、數(shù)據(jù)治理等各種問(wèn)題。

Cloudera是Hadoop生態(tài)系統(tǒng)中的典型代表,規(guī)模非常大、知名度非常高,它為Hadoop發(fā)行版開(kāi)發(fā)了很多功能,如今正在提供企業(yè)級(jí)數(shù)據(jù)交互的軟件平臺(tái),能讓企業(yè)以更快的速度和更低的成本來(lái)存儲(chǔ)、運(yùn)行和分析數(shù)據(jù)。

Cloudera的迭代速度,這是好事也是麻煩事兒,企業(yè)在使用了某版本的引擎之后,如果在未來(lái)又想用新引擎,則需要在技術(shù)上和業(yè)務(wù)上重新做許多梳理和對(duì)應(yīng)工作。Cloudera和戴爾的合作就是要解決大數(shù)據(jù)分析平臺(tái)中碰到的問(wèn)題,幫助企業(yè)減少投資并提高生產(chǎn)效率。

2021年4月,戴爾的PowerScale存儲(chǔ)平臺(tái)通過(guò)了Cloudera最嚴(yán)苛的,同時(shí)也是最高級(jí)的QATS認(rèn)證,目前,全球僅有兩家存儲(chǔ)公司獲得該項(xiàng)認(rèn)證,需要認(rèn)證雙方都投入大量的人力、物力、時(shí)間和精力。

戴爾科技集團(tuán)大中華區(qū)非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)事業(yè)部高級(jí)經(jīng)理李海介紹說(shuō),QATS不是簡(jiǎn)單的兼容性認(rèn)證,它需要在用戶(hù)的實(shí)際環(huán)境中進(jìn)行模擬,需要使用Cloudera CDP里全部模塊,需要按照用戶(hù)的整個(gè)流程步驟來(lái)驗(yàn)證所有軟硬件,最終確保每一個(gè)環(huán)節(jié)都能順暢提供服務(wù)。

如果選擇了戴爾PowerScale存儲(chǔ),如果使用的是Cloudera CDP數(shù)據(jù)平臺(tái),那么恭喜你,兩種組合方案會(huì)有體驗(yàn)加成,能享受到更絲滑的使用體驗(yàn)。

這種區(qū)別就好比品牌筆記本電腦和DIY組裝機(jī)的區(qū)別,后者可能會(huì)存在軟硬件兼容性問(wèn)題,而品牌筆記本電腦在出廠時(shí)候就在軟硬件上做了最合理的配置,無(wú)需額外配置即可進(jìn)入最佳狀態(tài),這正是QATS追求的效果。

對(duì)用戶(hù)來(lái)說(shuō),PowerScale是非常適合數(shù)據(jù)分析的基礎(chǔ)架構(gòu)

PowerScale是戴爾的NAS文件存儲(chǔ),是老牌存儲(chǔ)陣列,對(duì)用戶(hù)來(lái)說(shuō),PowerScale是什么呢?

PowerScale是一個(gè)能從3節(jié)點(diǎn),10TB起步的可橫向擴(kuò)展的存儲(chǔ)系統(tǒng),哪怕數(shù)據(jù)量很少的企業(yè)也適合用它。10TB什么水平呢?話說(shuō)筆者的個(gè)人臺(tái)式電腦都快20TB的存儲(chǔ)空間了。

PowerScale是一個(gè)容量上限很大的存儲(chǔ)系統(tǒng),最多可擴(kuò)展到252個(gè)節(jié)點(diǎn),容量最高可達(dá)將近100PB的水平,這么多的數(shù)據(jù)管理起來(lái)也不麻煩,甚至可以放在單一命名空間里進(jìn)行管理,很方便。

PowerScale非常成熟,可用的應(yīng)用非常多。李海表示,PowerScale有各種工具和軟件,在數(shù)據(jù)治理、數(shù)據(jù)安全、數(shù)據(jù)訪問(wèn)方面都非常成熟。

PowerScale非常適合作為大數(shù)據(jù)平臺(tái)的基礎(chǔ)架構(gòu)。PowerScale跟Hadoop更搭,與額外使用插件來(lái)構(gòu)建的訪問(wèn)方式不同,PowerScale的文件系統(tǒng)原生支持HDFS,能大幅提升大數(shù)據(jù)訪問(wèn)效率。

有了PowerScale的數(shù)據(jù)分析架構(gòu)會(huì)變得更簡(jiǎn)潔明了,因?yàn)镻owerScale實(shí)現(xiàn)了計(jì)算和存儲(chǔ)的分離,當(dāng)系統(tǒng)數(shù)據(jù)增多時(shí)候,只需擴(kuò)容PowerScale存儲(chǔ)即可,無(wú)需擴(kuò)容服務(wù)器計(jì)算資源,能省下不少購(gòu)買(mǎi)和管理服務(wù)器的成本。

PowerScale的存儲(chǔ)效率更高。Hadoop架構(gòu)設(shè)計(jì)中需要三副本來(lái)存儲(chǔ)數(shù)據(jù),如果加上容災(zāi)就需要6份數(shù)據(jù),這其中存在巨大的浪費(fèi),因?yàn)椴捎么嫠惴蛛x的架構(gòu)PowerScale+CDP方案,用戶(hù)只需要兩份數(shù)據(jù)拷貝即可。

有了PowerScale后的數(shù)據(jù)分析操作更高效,PowerScale在做數(shù)據(jù)分析時(shí),無(wú)需數(shù)據(jù)遷移,因?yàn)镻owerScale里面既可以服務(wù)于生產(chǎn)環(huán)境,也可以做大數(shù)據(jù)分析,從而能節(jié)省用戶(hù)的時(shí)間和金錢(qián)。

對(duì)于那些與時(shí)間賽跑的企業(yè)來(lái)講,這種高效的方案非常有價(jià)值。

以芯片行業(yè)為例,芯片行業(yè)投資巨大,早一天投產(chǎn)上市可能意味著避免數(shù)百萬(wàn)美金的損失。然而,芯片設(shè)計(jì)離不開(kāi)EDA系統(tǒng)以及復(fù)雜的測(cè)試驗(yàn)證環(huán)節(jié),而EDA系統(tǒng)又非常依賴(lài)于數(shù)據(jù)存儲(chǔ)和分析系統(tǒng)。于是,對(duì)于芯片企業(yè)來(lái)講,PowerScale和Cloudera所提供的價(jià)值非常明顯。

Cloudera與戴爾的緊密合作

如上文所說(shuō),Cloudera是Hadoop開(kāi)源生態(tài)系統(tǒng)中的典型代表,規(guī)模非常大、知名度非常高,稱(chēng)的上是最成功的大數(shù)據(jù)技術(shù)服務(wù)公司之一。

Cloudera大中華區(qū)售前技術(shù)總監(jiān)劉隸放介紹說(shuō),十幾年來(lái)Cloudera一直在不斷開(kāi)發(fā)各種組件,不斷地把業(yè)界最流行的、最適用的新組件加入其中。

與公有云上的數(shù)據(jù)分析服務(wù)不同,企業(yè)數(shù)據(jù)分析平臺(tái)的落地過(guò)程中,Cloudera非常需要而且非常有必要與存儲(chǔ)廠商進(jìn)行合作。

這是因?yàn)?,從技術(shù)可行性來(lái)看,Cloudera提供了分解計(jì)算的方式,而戴爾的PowerScale提供的是分布式存儲(chǔ)能力,只要通過(guò)認(rèn)證兩者就能很好的配合起來(lái),如上文所說(shuō),這還遠(yuǎn)遠(yuǎn)不夠。

從現(xiàn)實(shí)生態(tài)來(lái)看,必須適應(yīng)企業(yè)數(shù)據(jù)存儲(chǔ)架構(gòu)的現(xiàn)狀,而不是重新構(gòu)建一套異構(gòu)的存儲(chǔ)方案,增加企業(yè)數(shù)據(jù)架構(gòu)的復(fù)雜度。

而戴爾與Cloudera的合作非常理想,堪比像電影院與爆米花一樣的黃金搭檔。

戴爾是全球范圍內(nèi)規(guī)模最大的企業(yè)存儲(chǔ)公司,這意味著很多戴爾存儲(chǔ)的用戶(hù)都能更好落地Cloudera的方案。

而從另一個(gè)角度看,Cloudera與戴爾的QATS層次的認(rèn)證也成了戴爾存儲(chǔ)的一個(gè)差異化優(yōu)勢(shì),目前全球有同等認(rèn)證的存儲(chǔ)公司僅有兩家。

戴爾與Cloudera的合作由來(lái)已久,在戴爾還沒(méi)有正式與EMC合并前,Cloudera就已經(jīng)與EMC有較為深入的合作關(guān)系了,這種合作關(guān)系延續(xù)到了現(xiàn)在并且在逐步升級(jí)。

與想象中不同的是,Cloudera并不會(huì)廣撒網(wǎng)式的開(kāi)展深入合作,對(duì)于合作伙伴其實(shí)非?!疤籼蕖保粫?huì)跟少數(shù)技術(shù)實(shí)力,合作意愿和能力比較強(qiáng)的企業(yè)進(jìn)行合作。

Cloudera與戴爾的合作期間,雙方都是非常慎重的,因?yàn)殡p方都需要大幅度的投入,合作周期很少有短于6個(gè)月的,每個(gè)版本的迭代和演進(jìn)都需要3到6個(gè)月時(shí)間,雙方的工程師要一起工作,共同完成很多調(diào)試和測(cè)試任務(wù)。

劉隸放在談起與戴爾的合作時(shí)表示,Cloudera的團(tuán)隊(duì)與戴爾的團(tuán)隊(duì)溝通非常多,對(duì)于戴爾表現(xiàn)出的專(zhuān)業(yè)性印象深刻,合作過(guò)程中,戴爾在專(zhuān)業(yè)知識(shí)上和業(yè)務(wù)拓展上都給Cloudera帶來(lái)了很大幫助。

據(jù)了解,Cloudera在大中華地區(qū)的用戶(hù)群中,許多非常大規(guī)模的部署都是基于戴爾Isilon(PowerSacle的前身)進(jìn)行的,有的甚至達(dá)到了PB級(jí)。

結(jié)束語(yǔ)

作為存儲(chǔ)公司的戴爾與大數(shù)據(jù)分析公司Cloudera的合作有明顯的積極意義,這種合作不禁讓筆者想起了如今電影院售賣(mài)爆米花的操作。

爆米花豐富了觀眾在影院的觀影體驗(yàn),人們也習(xí)慣了手捧爆米花來(lái)度過(guò)愉快的觀影時(shí)間。而電影也沒(méi)有虧待爆米花。爆米花的起源非常久遠(yuǎn),而發(fā)達(dá)的現(xiàn)代電影工業(yè)則讓這種古老的食品與現(xiàn)代社會(huì)產(chǎn)生了更深入的聯(lián)系,比如,有一類(lèi)許多人比較喜歡的電影就叫爆米花電影。

Cloudera幫助戴爾的用戶(hù)更輕松地把數(shù)據(jù)用起來(lái),戴爾在客觀上起到了幫助Cloudera數(shù)據(jù)分析服務(wù)在企業(yè)落地的步伐,兩者也在相互促進(jìn),相互成就。

分享到

zhupb

相關(guān)推薦