每個追尋巨量資料的組織機構都對它寄予厚望,希望它可以回答長期的業務問題,讓企業在市場中具有更多的競爭力,更好地交付產品和服務。然而在這種熱情之中,很容易產生對巨量資料的虛假期望——有些好處永遠不會實現,除非你藉助一定的「幫助」。以下就是巨量資料不會為你做的10件關鍵的事情,除非你採取正確的步驟來優化它的價值。

1、解決你的業務問題

巨量資料不會解決業務問題,解決問題的是人。只有那些在採用巨量資料之前冷靜地坐下來考慮他們想要從中獲得什麼的組織機構,才能獲得他們一直在尋求的商業智能的成果。

2、有助於你的資料管理

IBM聲稱全球每天會生成2.5億億個位元組的資料,其中大多數資料是巨量資料。不出所料,全球企業中受管理的資料正在成倍增長。隨著資料快速累積卻沒有明確的資料保留和使用策略(尤其是針對巨量資料),那麼機構組織就要面對管理這些資料的難題了。

3、緩解你的安全擔心

對於很多企業來說,確定對資料的安全訪問仍然是一個開放的話題。這是因為針對巨量資料的安全實踐,並不像系統記錄中的資料那樣已經限定好了。我們正處於這樣一個時間點,IT應該與終端用戶合作,確定誰可以訪問哪些巨量資料以及相應的分析結果。

4、解決關鍵IT技能領域

巨量資料資料庫管理、伺服器管理、軟體開發和業務分析技能都是供不應求的。這在很多IT部門已經匱乏的重要核心IT技能上有增加了額外的負擔。

5、減少遺留系統的價值

如果有的話,在巨量資料時代,記錄在案的遺留系統要比以往任何時候都更有價值。通常情況下,這些遺留系統為如何更好地剖析巨量資料提供了關鍵線索,讓資料分析可以回答重要的業務問題。

6、簡化你的資料中心

巨量資料要求並行處理計算集群和不同於傳統IT轉型的系統管理模式以及資料倉庫系統。這意味運行這些新系統所需的能耗、冷卻、軟體、硬體和系統技能也將是不同的。

7、改善你的資料質量

傳統事務處理系統的優點在於,會有固定的資料欄位長度,對資料的全面編輯和驗證,有助於讓其轉變為相對乾淨的格式。對於巨量資料並非如此,巨量資料是非結構化的,可以是任何一種格式。這讓巨量資料質量成為一大難題。資料質量是至關重要的。如果你沒有資料質量的話,你就無法信任資料查詢的結果。

8、驗證當前的投資回報率指標

從記錄系統中衡量投資回報的最常用方法就是監測交易的速度,然後推斷這在獲得收入方面意味著什麼(例如每分鐘你能獲得多少個新的酒店預定)。交易速度對於巨量資料處理來說並不是很好的指標,可能需要數小時甚至數天時間處理大規模資料並運行資料分析。相反,評估巨量資料處理效率的最好指標是利用率,這應該在定期基礎上高出90%(與交易系統相比,後者可能只有20%)。開發這些針對巨量資料的新ROI指標很重要,因為你仍然需要說服CFO和其他業務領導在巨量資料上進行投資。

9、減少「噪音」

巨量資料中95%都是「噪音」,對商業智慧貢獻很少或者幾乎沒有。過濾這些資料、獲得能真正幫助企業的情報將是一件艱巨的事情。

10、每次都管用

多年來,大學和研究中心運作了很多巨量資料實驗以得出基因組、藥物研究以及外星生命方面難以捉摸的答案。雖然這些演算法和查詢中很多會產生結果,但更多的是沒有定論的。大學和研究環境對於沒有定論是可以容忍的,但是在企業環境中就不行了。這是IT和其他關鍵決策者需要管理期望的所在。

FineReport報表與BI商業智慧工具【免費下載】opensource開發,類excel設計,全方位異質資料庫整合,資料填報、Flash列印、權限控制、行动應用、客制化、交互分析、報表協同作業管理系統。分享自:ZDNet