2013年8月14日星期三

Splunk針對Hadoop推出測試版本數據分析工具

近年愈來愈多企業或機構,採用Hadoop作為數據儲存,貪其開放式架構兼且可分散地運行於多台廉價伺服器(commodity server)。Hadoop以java寫成,可提供大量資料的分散式運算環境,用以儲存和處理超大規模的資料。

有見及此,實時智能市場軟件供應商Splunk早前便針對Hadoop市場,推出Splunk Analytics for Hadoop測試(beta)版本。此測試版本Hunk乃Splunk之最新產品,具備Hadoop資料探索、分析、圖像化功能,並以Splunk建置的海量數據分析技術為基礎,大幅提升與Hadoop數據互動及分析的速度和便利性,毋須設計程式、斥資整合或被迫遷移數據。

簡易部署毋須特殊技能

Splunk產品市場推廣部副總裁Sanjay Mehta表示,「由於目前市場上缺乏支援Hadoop的商業分析技術,要從Hadoop擷取數據進行分析並不容易,因此我們推出Hunk,目的就是為了在Hadoop上進行數據探索、分析和視像化。現階段參與測試的用戶,主要從事銀行金融、網上零售、電訊以及大學等。」

Mehta續強調Hunk的一大優勢在於簡易部署整合,毋須數據科學家的特殊技能與專業知識,亦能於一小時內完成安裝整合。「Hadoop的一大缺點是非實時,然而Splunk的虛擬索引技術,讓Hunk得以在接收到查詢請求(query)之時即能得出結果;此外,Hunk又融合了加速和視像化技術,令整體效率大幅提高。」

據悉,Hunk的主要功能包括正在申請專利的Splunk虛擬索引技術,讓用戶可流暢地使用所有Splunk技術,包括運用Splunk Search Processing Language、互動式探索、分析與圖像化數據,而不受儲存位置所限,令數據如同存放在Splunk索引內般便利。此外,Hunk亦適用於互動式探索大型多元數據庫,毋須事先了解數據內容,只須將Hunk設定於Hadoop叢集,即可開始進行數據探索,讓用戶能深層分析龐大的數據,同時偵測各項模式與異常狀態,也能自數據中發掘趨勢,並歸納出值得注意的數據規則或模式,從而助用戶總結出有價值的洞見。

沒有留言:

發佈留言