2014年7月30日星期三

EMC推Data Lake Hadoop分析出非結構化數據


EMC於2010年底成功併購Isilon,從而增添了橫向擴充的NAS產品線。Isilon採用NAS控制器與儲存裝置合一的架構,每個節點均同時兼有控制器與磁碟櫃的角色,故只要增加節點,即可等比例地增加效能與容量。

早前,EMC續宣布為Isilon儲存方案作重大升級,提供業界首款採用HDFS,將Hadoop運用在海量數據的企業級橫向擴充數據湖(Data Lake)。全新Isilon S210與Isilon X410平台具有2倍的效能,而相較於其他方案,數據湖具備高出一個等級的可擴充性,能讓用戶將數據整合到單一檔案系統,以及單一磁碟區的數據湖。

此外,其SmartFlash快閃快取功能,更可支援新一代的作業負載協定。

數據湖具高度擴展性

強化企業級橫向擴充數據湖,可謂是次EMC Isilon OneFS的重大升級。新產品針對HDFS提供不間斷支援,有助企業大幅提升擷取、儲存、保護,以及管理超大量的非結構性數據的能力。透過在數據湖中運用HDFS,企業可將Hadoop運用在海量數據,因此能避免在移動數以10億兆位元(petabyte)計的數據,所需耗費的時間和成本。由於數據湖具有高擴充性的儲存庫,能接納從傳統與新一代作業負載所產生的眾多來源的儲存數據,且能運用各種機制來處理,亦不必處理眾多獨立的儲存庫,因此數據湖愈趨普及。數據湖的擴充性,比現有方案高出一個等級,所有數據均能匯整到單一檔案系統,以及單一磁碟區的數據湖,加上透過Hadoop的能力,讓Isilon能作好分析作業的準備。

在數據湖核心方面,EMC藉由Isilon S210與Isilon X410,此兩款全新EMC Isilon平台,改寫橫向擴充NAS的定義,另配合OneFS軟件,提供雙倍效能及超越上一代方案的靈活性。媒體與娛樂、金融服務,及生命科學等行業的網絡環境要求嚴苛,新Isilon方案則可進一步提升每個叢集的規模、效能、靈活性及成本效率。此外,由Isilon建立的數據湖,可支援多種協定和存取方法,如NFS、SMB、NDMP、HDFS,及透過ViPR與OpenStack SWIFT原生物件的OBJECT,不僅支援主目錄,與檔案分享等各種傳統作業負載,還能支援分析、雲運算應用,以及流動數據同步與分享等新一代作業負載。



沒有留言:

發佈留言