亚洲一区二区无码|成人国产经典精品视频|亚洲欧美综合精美二区|视频一区中文字幕日本有码|亚洲av午夜精品无码专区|国产喷水高潮网红在线观看|欧美日韩在线观看精品一区二区|国产亚洲精品精品国产亚洲综合

云設計

熱門搜索: 防爆監(jiān)控 電動機 防爆暖通 防爆風機

當前位置:首頁>云設計>新聞詳情

防爆云平臺從存儲角度看大數據和云計算

2016年11月23日 來源:防爆云平臺--防爆產業(yè)鏈一站式O2O服務平臺 防爆電氣、防爆電機、防爆通訊、防爆空調 瀏覽 2523 次
0


  關于大數據和云計算的關系人們通常會有誤解。而且也會把它們混起來說,防爆云平臺(www.www.thenaturalessexgirl.com)分別做一句話直白解釋就是:云計算就是硬件資源的虛擬化;大數據就是海量數據的高效處理。
  
  如果做一個更形象的解釋,云計算相當于我們的計算機和操作系統(tǒng),將大量的硬件資源虛擬化之后再進行分配使用,在云計算領域目前的老大應該算是amazon,可以說為云計算提供了商業(yè)化的標準,另外值得關注的還有vmware(其實從這一點可以幫助你理解云計算和虛擬化的關系),開源的云平臺有活力的就是openstack了;
  
  大數據相當于海量數據的“數據庫”,而且通觀大數據領域的發(fā)展也能看出,當前的大數據處理一直在向著近似于傳統(tǒng)數據庫體驗的方向發(fā)展,hadoop的產生使我們能夠用普通機器建立穩(wěn)定的處理tb級數據的集群,把傳統(tǒng)而昂貴的并行計算等概念一下就拉到了我們的面前,但是其不適合數據分析人員使用(因為mapreduce開發(fā)復雜),所以piglatin和hive出現了(分別是yahoo!和facebook發(fā)起的項目,說到這補充一下,在大數據領域google、facebook、twitter等前沿的互聯網公司作出了很積極和強大的貢獻),為我們帶來了類sql的操作,到這里操作方式像sql了,但是處理效率很慢,絕對和傳統(tǒng)的數據庫的處理效率有天壤之別,所以人們又在想怎樣在大數據處理上不只是操作方式類sql,而處理速度也能“類sql”,google為我們帶來了dremel/powerdrill等技術,cloudera(hadoop商業(yè)化強的公司,hadoop之父cutting就在這里負責技術領導)的impala也出現了。
  
  整體來看,未來的趨勢是,云計算作為計算資源的底層,支撐著上層的大數據處理,而大數據的發(fā)展趨勢是,實時交互式的查詢效率和分析能力,借用google一篇技術論文中的話,“動一下鼠標就可以在秒級操作pb級別的數據”難道不讓人興奮嗎?
  
  在談大數據的時候,首先談到的就是大數據的4v特性,即類型復雜,海量,快速和價值。ibm原來談大數據的時候談3v,沒有價值這個v。而實際我們來看4v更加恰當,價值才是大數據問題解決的終目標,其它3v都是為價值目標服務。在有了4v的概念后,就很容易簡化的來理解大數據的核心,即大數據的總體架構包括三層,數據存儲,數據處理和數據分析。類型復雜和海量由數據存儲層解決,快速和時效性要求由數據處理層解決,價值由數據分析層解決。
  
  數據先要通過存儲層存儲下來,然后根據數據需求和目標來建立相應的數據模型和數據分析指標體系對數據進行分析產生價值。而中間的時效性又通過中間數據處理層提供的強大的并行計算和分布式計算能力來完成。三層相互配合,讓大數據終產生價值。



  數據存儲層
  
  數據有很多分法,有結構化,半結構化,非結構化;也有元數據,主數據,業(yè)務數據;還可以分為gis,視頻,文件,語音,業(yè)務交易類各種數據。傳統(tǒng)的結構化數據庫已經無法滿足數據多樣性的存儲要求,因此在rdbms基礎上增加了兩種類型,一種是hdfs可以直接應用于非結構化文件存儲,一種是nosql類數據庫,可以應用于結構化和半結構化數據存儲。
  
  從存儲層的搭建來說,關系型數據庫,nosql數據庫和hdfs分布式文件系統(tǒng)三種存儲方式都需要。業(yè)務應用根據實際的情況選擇不同的存儲模式,但是為了業(yè)務的存儲和讀取方便性,我們可以對存儲層進一步的封裝,形成一個統(tǒng)一的共享存儲服務層,簡化這種操作。從用戶來講并不關心底層存儲細節(jié),只關心數據的存儲和讀取的方便性,通過共享數據存儲層可以實現在存儲上的應用和存儲基礎設置的徹底解耦。


  數據處理層
  
  數據處理層核心解決問題在于數據存儲出現分布式后帶來的數據處理上的復雜度,海量存儲后帶來了數據處理上的時效性要求,這些都是數據處理層要解決的問題。
  
  在傳統(tǒng)的云相關技術架構上,可以將hive,pig和hadoop-mapreduce框架相關的技術內容全部劃入到數據處理層的能力。原來我思考的是將hive劃入到數據分析層能力不合適,因為hive重點還是在真正處理下的復雜查詢的拆分,查詢結果的重新聚合,而mapreduce本身又實現真正的分布式處理能力。
  
  mapreduce只是實現了一個分布式計算的框架和邏輯,而真正的分析需求的拆分,分析結果的匯總和合并還是需要hive層的能力整合。終的目的很簡單,即支持分布式架構下的時效性要求。



  數據分析層
  
  后回到分析層,分析層重點是真正挖掘大數據的價值所在,而價值的挖掘核心又在于數據分析和挖掘。那么數據分析層核心仍然在于傳統(tǒng)的bi分析的內容。包括數據的維度分析,數據的切片,數據的上鉆和下鉆,cube等。
  
  數據分析我只關注兩個內容,一個就是傳統(tǒng)數據倉庫下的數據建模,在該數據模型下需要支持上面各種分析方法和分析策略;其次是根據業(yè)務目標和業(yè)務需求建立的kpi指標體系,對應指標體系的分析模型和分析方法。解決這兩個問題基本解決數據分析的問題。
  
  傳統(tǒng)的bi分析通過大量的etl數據抽取和集中化,形成一個完整的數據倉庫,而基于大數據的bi分析,可能并沒有一個集中化的數據倉庫,或者將數據倉庫本身也是分布式的了,bi分析的基本方法和思路并沒有變化,但是落地到執(zhí)行的數據存儲和數據處理方法卻發(fā)生了大變化。
  
  談了這么多,核心還是想說明大數據兩大核心為云技術和bi,離開云技術大數據沒有根基和落地可能,離開bi和價值,大數據又變化為舍本逐末,丟棄關鍵目標。防爆云平臺簡單總結就是大數據目標驅動是bi,大數據實施落地式云技術。
  
  更多關于防爆電機/暖通/箱柜開關/監(jiān)控通訊/風機/燈具等信息,敬請關注:
  
  防爆云平臺官網:http://www.www.thenaturalessexgirl.com
  
  防爆云平臺官方微信公眾號:fbypt12580
  
  交流互動加QQ群:224548301  451081856
  
  “2016年首屆國際防爆產業(yè)網上博覽會”于11月11日-12月12日在防爆云平臺(www.www.thenaturalessexgirl.com)舉辦!

0
營業(yè)執(zhí)照 | 增值電信業(yè)務經營許可證 | 豫公網安備41130202000490號 | 豫ICP備19015714號-1 (版權所有 防爆云平臺 © Copyright 2009 - 2024 . All Rights Reserved.)