實際上,大數(shù)據(jù)和云計算有很大的重疊和交集,所以企業(yè)很可以很明確的宣稱自己正在利用內(nèi)部部署的Hadoop、NoSQL或者是企業(yè)數(shù)據(jù)倉庫環(huán)境進行基于云計算的大數(shù)據(jù)戰(zhàn)略。同時還要提醒大家:云計算被廣泛的認為是包括除了“私有部署”以外或者是代替公有云、SaaS和多租戶托管環(huán)境。
但如果你將云計算的定義限制為公共訂購服務,你就會遇到一個核心問題:需要確定哪些大數(shù)據(jù)應用更為適合公有云/SaaS環(huán)境或者是傳統(tǒng)的內(nèi)部部署。換句話說:通過外部的服務提供商的管理,何時才能提高大數(shù)據(jù)的可擴展性、彈性、效能以及成本效益、可靠性。以下是四個關(guān)于大數(shù)據(jù)遷移至云端的用例,幫助辨別你的大數(shù)據(jù)是否已經(jīng)處于云端了。
企業(yè)應用已托管在云中對于很多企業(yè)來說,特別是中小企業(yè)來說,如果你用的是外部服務商提供的基于云計算的應用程序,實際上企業(yè)中的大部分交易源代碼已經(jīng)在公有云當中。如果你有很多的歷史數(shù)據(jù)都在云計算平臺中,也許已經(jīng)累計構(gòu)成大數(shù)據(jù)了。
此時,利用外部服務提供商或者是其合作伙伴提供的數(shù)據(jù)分析增值服務比完全依靠企業(yè)內(nèi)部的資源更有效,服務包括客戶流失分析,營銷優(yōu)化,或異地的客戶數(shù)據(jù)的備份和歸檔服務。
高容量的外部數(shù)據(jù)源則需要預處理
舉個例子,若是你正在通過收集社交網(wǎng)絡來進行客戶的情緒監(jiān)控,也許你的企業(yè)內(nèi)部沒有服務器、存儲和帶寬能夠全面的監(jiān)測這些數(shù)據(jù),但是通過基于公有云的大數(shù)據(jù)服務,你就能夠很簡單的利用社交媒體過濾服務來對客戶的情緒變化進行監(jiān)控。
企業(yè)內(nèi)部無法承受的戰(zhàn)略應用
若是企業(yè)內(nèi)部已有一個基于應用程序的大數(shù)據(jù)平臺,如專用的Hadoop集群的高容量ETL非結(jié)構(gòu)化數(shù)據(jù)源,通過公有云來解決新的應用程序是比較可行的,例如,多渠道營銷,社交媒體分析、地理空間分析、可查詢歸檔和彈性數(shù)據(jù)等。對于不適合當前平臺的應用程序來說,一個按需收費的服務的成本效益是最好的。
事實上,企業(yè)如果想要盡快處理PB級規(guī)模的多種結(jié)構(gòu)的流媒體的大數(shù)據(jù),公有云是唯一一個可行的解決方案。
分析沙箱的彈性配置
若是你需要進行數(shù)據(jù)探索的是一個生命周期較短的項目,訂單量又是數(shù)量級的時候,云計算可能是唯一可行的或經(jīng)濟實惠的選擇。你可以快速的為項目配置基于云的存儲和計算能力,當項目結(jié)束的時候,企業(yè)可以快速的取消這些配置。這種模式可以稱之為“泡沫集市”部署模型,可以說是為云量身定制。
只要你遇到以上任何一種情況,基于云計算的大數(shù)據(jù)戰(zhàn)略問題也就會隨之而來,隨著云計算和大數(shù)據(jù)服務的成熟,價格,性能,可擴展性,靈活性和可管理性都將會得到改善,但這個問題仍然還是會存在,只不過階段不同了。再過幾年,越來越多的應用和數(shù)據(jù)遷移到公有云之后,利用你現(xiàn)在的服務器來運行你的大數(shù)據(jù)應用似乎也不太實際了。所以企業(yè)要懂自己的大數(shù)據(jù)戰(zhàn)略,同時還要搞清楚企業(yè)數(shù)據(jù)是不是已經(jīng)在云端了,并及時做好戰(zhàn)略的調(diào)整。