2013年2月27日星期三

數碼宇宙呈爆炸性增長 不足1%數據被用作分析

全球設備如個人電腦和智能手機電話激增,加上雲運算、流動化、電子商貿和IT消費化(Consumerization of IT)的推動,令全球數據量增長驚人。EMC早前委託IDC進行的「Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East」(海量數據、更龐大的數據影子及遠東地區最大的數據增長)研究結果,更顯示大量由人類及機器產生的數據,令「數碼宇宙」創下史無前例的增長,然而IDC估計,全球僅0.5%數據被用作分析,而受保護的數據亦低於兩成。

若只為遵從法規,儲存大量數據而不加以利用分析,只會為企業營運徒添成本;但若能分析處理,將海量數據化為可用資訊,助企業提升生產力或降低成本,則可將成本轉化作商機、創造收入。

「數碼宇宙」的數據量,在過去2年間倍增至2.8ZB。IDC預計,「數碼宇宙」在2020年,將會達到40ZB,即相等於全球每人平均擁有5,247 GB數據;此數量遠高於過往所預測的14%。研究又揭示,由今年至2020年,「數碼宇宙」將每兩年翻一倍;其中,膨脹的主因是由機器產生的數據增長,上升幅度由2005年僅佔11%,增至2020年超過40%。研究另指出,大量有用數據正在流失。海量數據提供的機遇,體現於從大量、未被開發的數據之中摘取價值。不過,大多數新數據很大程度上未被標籤,屬以檔案為基礎的非結構性數據。
數據潛在價值未被體現

報告續指,在2012年,「數碼宇宙」的23% (643 exabytes)數據,若被標籤及分析的話,將對海量數據十分有用。但目前僅3%有潛在價值的數據被標籤,而有被分析的數據更少。而有用數據的數量,將會隨著「數碼宇宙」的增長而遞增。到了2020年,「數碼宇宙」中33%的數據 (13,000+ exabytes ),若被有效標籤及分析,將可擁有海量數據的價值。

EMC香港及澳門區總經理梁成琯引述IDC的調查結果,指本港雲運算採用率,於亞洲區僅第6位,大感詫異。「香港作為亞洲金融中心,雲運算採用率竟遜於第一位的新加坡、第二位的澳洲、第三位的日本、第四位的韓國,甚至不及中國大陸,這是令人震驚的。不過對我們來說亦是好消息,這意味著本地其實市場尚有很大發展空間,對儲存的需求未來將進一步體現。因為據研究調查指,目前企業最關注的3個IT項目,分別是海量數據、雲運算和保安。」

他續稱,海量數據的價值,在於分析後得出對企業決策有用的實時資訊。比方說,當在Amazon購入一本書時,系統已能實時據用戶的購物喜好和記錄,推介相關的產品。「海量數據分析和數據採挖的最大分別,在於前者具備內嵌式的預測。以信用卡為例,卡公司會以不同方式對用戶進行信用評估以防壞帳。據悉離婚用戶涉及壞帳的機會較高,但如何預測哪些用戶會離婚?原來系統會按用戶的簽帳記錄進行分析,譬如說以往常常到玩具反斗城購物,最近不但次數減少,更偶然出現酒店房間簽帳,該用戶的信用評級便可能亮起紅燈。」

梁成琯續指,目前大部分數碼宇宙未受保護,而應獲得保護的資訊增長,比數碼宇宙的增長為快。他引述報告指,去年「數碼宇宙」中有大約35%的資訊需要某程度上的保護,惟大部分來自新興市場的數據均未受保護。而更高層次的保安威脅、保安技術的落差,和缺乏可給依從的最佳保安實務,將繼續對消費者和企業構成挑戰。

沒有留言:

發佈留言