圖1:數(shù)據(jù)保留的各項要求
上圖表明,1%的企業(yè)數(shù)據(jù)必須為了訴訟需求而保留下來,5%的數(shù)據(jù)必須受控以滿足合規(guī)性要求。另外還有25%的數(shù)據(jù)是具有商業(yè)價值的。 那意味著69%的數(shù)據(jù)其實是毫無價值的。
也許有人會對這些數(shù)據(jù)的準確性提出質疑,但是讓我們先來進行一項合理的測試:在很大程度上,企業(yè)和它們的IT部門主要專注于當前正在發(fā)生的事情(當前的交易、電子郵件和分析等),而并不是數(shù)據(jù)積累的過程。
IT部門就向是數(shù)據(jù)的監(jiān)護人一樣,而且該部門同時承擔著存儲和管理數(shù)據(jù)的成本,但他們并不是那樣數(shù)據(jù)的所有者??赡軜I(yè)務部才是那些數(shù)據(jù)真正的所有者,對于個人員工來說,他們只是某些特定數(shù)據(jù)集的管理員。 但是如果員工帶著他們的電子郵件離開公司會怎么樣呢?那么剩下的數(shù)據(jù)是否就是再也不會被用到的數(shù)據(jù)碎片了呢? 誰知道呢?這又該誰來管理呢? 答案是:也許沒人來管理那些數(shù)據(jù)。
進行數(shù)據(jù)處理的原因
現(xiàn)在我要提出一個問題了:清除掉無用的數(shù)據(jù)到底有多重要呢?
假如20%的IT預算是用于存儲領域,而且你們70%的數(shù)據(jù)對企業(yè)來說是毫無價值的。那就意味著14%左右的IT存儲預算被浪費掉了。 各位首席信息官們,這能夠引起你們的重視嗎? 現(xiàn)在,即便能夠通過一些技術將所有沒有用的數(shù)據(jù)都安全地清除掉,那也不一定能夠馬上在成本節(jié)約上看到成效。雖然可以省下大量的磁盤空間,但是企業(yè)并不能將已經(jīng)配置的陣列再賣掉。 坦白說,你能夠從中省下來的開支可能遠比你以前花掉的開支要少得多(這就好比是舊車折舊的問題)。
釋放磁盤空間意味著以后的存儲設備采購計劃可以延期了,但那并不能馬上轉化為成本上的節(jié)約。但是尋求成本節(jié)約最終是為了提高生產(chǎn)力,比如現(xiàn)在資金投入不足但又迫切需要的IT改革,這也許就是解決這一問題最好的理由。
這個問題是一種永遠無法徹底解決的問題。那意味著雖然你現(xiàn)在暫時還能容忍它,但是新數(shù)據(jù)的持續(xù)快速增長必然會令情況不斷惡化,讓這個問題越來越難以解決。
將業(yè)務轉到云并不能解決這個問題,但是它也許會迫使企業(yè)加大對這個問題的關注力度。云計算的其中一個目的是提供服務型IT,即讓用戶從一個自助服務目錄中選擇他們想要的服務。 然而,這種令人愉快的體驗是有代價的。各種資源被分配給用戶并被他們消費掉,這意味著必須使用chargeback(或者至少是showback)。 猜猜看, 一家擁有數(shù)據(jù)的企業(yè)是否愿意為具備3美元價值的數(shù)據(jù)支付10美元呢?
可能要花很長的時間才能說清數(shù)據(jù)處理面臨的各種難題。這不但是一件很困難的事,它可能是很難處理的,而且可能沒有一家科技公司能夠解決存儲的問題。 另外,還有一些邏輯上和技術上的問題需要解決。數(shù)據(jù)管理功能必須設定和建立政策。 必須找到一種方法論將優(yōu)質數(shù)據(jù)與劣質數(shù)據(jù)區(qū)分開來。 這個過程可能不能通過人工的方式完成,可能需要用到自動化處理軟件工具。
從現(xiàn)實的角度來說,也許必須用最小的投資來實現(xiàn)數(shù)據(jù)量的最大縮減。即使在最理想的環(huán)境下,你可能也不得不接受這樣一個事實,那就是你永遠也不可能做到盡善盡美。 況且,你不但需要解決現(xiàn)在的海量數(shù)據(jù)問題,而且你還必須使用合適的工藝和程序來避免類似的情況再次發(fā)生。清理海量數(shù)據(jù)并不是一件容易的事,但是企業(yè)用戶們必須獲得合適的工具并制定合適的政策以實現(xiàn)那一目標。
Mesabi沉思
存儲需求持續(xù)快速增長是當前的一個熱門話題,大數(shù)據(jù)是其中最醒目的因素。海量數(shù)據(jù)的背后隱藏著什么樣的問題?雖然人們似乎還不太重視這方面的問題,但是卻又不得不面對數(shù)據(jù)清理的問題。
如果存儲在IT預算中占用的比例為20%,而且現(xiàn)在70%的數(shù)據(jù)是毫無價值的,那就等于每年14%的IT預算被浪費掉了。正視這一問題是企業(yè)用戶們需要做的第一件事。 找出解決這個問題的辦法需要時間、心理訓練和努力,但是這些付出都是值得的。如何解決這個問題令所有人都受益呢?這是我下一篇文章將要討論的話題。