2012年9月12日星期三

了解4V特性 即時串流分析 IBM度身設計大數據解決方案


互聯網發展一日千里,產生海量數據(Big Data),為企業帶來龐大商機。然而企業面對海量數據,往往不知從何入手;加上各家廠商提供截然不同的解決方案,推薦不同的技術,企業更無所適從。

IBM增長市場大數據方案主管Alex Paris建議,企業應先了解大數據的特性,再按自身的需要和發展方向,靈活選擇大數據解決方案。他指出,海量數據包括4個特點:巨量(Volume)、即時性(Velocity)、多樣性(Variety)和準確性(Veracity)。

顯然,海量數據的最大特色在於其龐大的數量,而且數據量有增無減,數以TB甚至PB計。要管理如此龐大的數據,企業需要專業的技術與知識,以加快處理和分析數據的過程。即時性是指企業消化數據的速度,大數據一般只有非常短的時效,企業必須於最短時間內分析和使用數據,方能達到最大效用。Paris舉例說,流動網絡供應商T-Mobile經常運用串流數據,實時分析顧客的使用模式,針對顧客的喜好,決定下一步行動,如推銷更優惠的月費計劃,或及時致歉以挽留顧客,減低顧客流失率。

大數據除了一般的結構性資料,也包括各類非結構性資料,如文件、音訊、視訊、網頁內容、點擊串流、日誌檔以至其他市場資料,構成大數據的多樣性。隨著流動運算和社交網絡急速發展,企業面對五花八門的海量數據,需要仔細分析,以提升競爭力。此外,企業要確保數據的準確性,識別真正有價值的數據,才能作出行動回應。「揉合以上4項特點的解決方案,最能滿足企業所需,善用大數據提升業務表現。」

按需靈活選擇解決方案

Paris強調,IBM擁有全面的技術、知識和產品,會按照客戶的需要,度身訂造最適合的海量數據方案,而非只側重任何一項產品或功能。「IBM的優勢在於彈性,企業可在現有的數據管理技術基礎上,加入新技術和產品,而且IBM兼容其他廠商的數據基建,包括甲骨文數據庫,有助企業全面開發大數據。」

IBM的大數據平台採用Hadoop開放源碼技術,以串流分析(Streaming Analytics)和互聯網規模分析(Internet Scale)為核心,儲存和分析數據,而且可與DB2數據庫軟件、Netezza數據倉庫裝置、Cognos和SPSS商業數據分析軟件等整合,按照企業的發展藍圖,靈活建立最合適的大數據解決方案。

「不同的行業對大數據解決方案的需求不一。比方說,醫療服務大都人命攸關,串流運算和分析技術正好協助醫護人員實時監測、即時反應,分秒必爭。安大略大學技術研究所(University of Ontario Institute of Technology)現時利用IBM的串流運算技術,快速處理和分析數據,協助新生嬰兒深切治療部(NICU)的醫護人員照顧嬰兒。」

以往,新生嬰兒深切治療部需要人量人手,全天候監察嬰兒的健康狀況。透過IBM的InfoSphere Streams,配合DB2數據庫,醫護人員可以運用儀器,實時監測嬰兒的維生指數及其他臨床健康狀況。系統處理大量結構性及非結構性數據,並即時深入分析,預測身體狀況的變化。一旦情況有機會惡化,系統會發出警告,讓醫護人員可以比現行模式早24小時掌握狀況,及早調動人手和資源,縮短病人等候的時間,大大提高嬰兒的存活率。

Paris稱,企業可以化零為整,把現有的市場數據、營運數據和客戶數據,與其他大數據統一分析和比較,去蕪存菁,利用數據的精髓,作為業務決策的重要參考資料,達到最大成本效益。

沒有留言:

發佈留言