2014年2月19日星期三

微軟推Power BI for Office 365 Excel建立數據倉庫 大數據自助分析

微軟的商業智能(Business Intelligence,BI)策略,是推動所謂「自助商業智能」(Self-service BI),用戶最清楚本身要求;如果他們可自行建立數據分析,可以省卻不少時間金錢。

傳統上,BI均由IT系統同事負責,大數據分析通常動用數據庫;而建立專業數據庫,不單須專門開發知識,設定也不容易。商業智能一直昂貴,幾乎必須數百萬元預算,幾乎只有大企業會考慮。

大幅降低BI門檻

不少市場研究,都想找出不同數據之間關係,這些數據不一定在公司內,甚至可能在公開或社交網站上,資料也有各自格式,必須整理和重新定義屬性。
微軟推出Power BI for Office 365,以Excel作為前端功能,內建強大的資料整合、分析和報表工具。

以往,或作預測商業分析(Business Analytic),幾乎非「關聯式數據庫」不可,但隨著Excel功能提高,風險分析人員只用Excel,也可分析大量數據。最著名例子莫過於採用蒙地卡羅模擬(Monte Carlo Simulation)的@RISK架構,只用Excel預估各種投資可能出現的情況;包括風險等因素。蒙地卡羅已普遍用於分析金融工具回報各種可能性。

微軟的技術發展,就是針對毋須專業訓練,也可以掌握複雜分析,為Excel注入新的生命。Excel是最常用數據處理前端和報表工具;Excel作為資料統計;Pivot table更是財務上作「處境分析」(Scenario analysis)最常用工具,分析人員可建立不同的數據模型,以不同方式過濾資料。

Excel作為建立報表最普遍前端工具,也可通過SharePoint的Excel Services,發佈不同數據模型建立的分析,同時又保護資料內容。Power BI for Office 365則可在建立雲端的報表網站,快速分享各種分析結果。

Excel用途極廣,Power BI for Office 365的Power Query可快速尋找相關數據,並載入數據到活頁,再經篩選過濾,並重新定義數據輪廓(Schema),不同活頁可建立關聯,並根據SQL撰寫詢問(Query),可過濾不同數據,甚至能比較不同數據,並計算出彼此「相關系數」(Correlation Coefficient),作用類似統計工具SPSS。

數年前,微軟已推出了Power Pivot,Excel可處理資料量大幅增加,支援記憶體壓縮,並可從外部載入數據,稱為Data Explorer。

微軟不斷改善Excel載入數據種類,除了支援不同格式,也可從不同來源載入不同數據,還具備清理(Cleanup)和功能,,並且不同活頁(Worksheet)自動配對資料,完成建立數據倉庫(Extract, transform, load)過程,Data Explorer的功能不斷提昇,去年易名為Power Query。

過去一年,微軟不斷開發Excel的Power Query功能,令Excel可從不同的來源;包括Office檔(Excel、Word、PowerPoint),不同的SQL數據庫(MS SQL、Oracle、MySQL、Sybase IQ)、CSV、XML、Hadoop數據檔、甚至公共和社交網站、Azure,取得不同數據,並混合作BI分析用途。

Power Query迅速作出整理和對應不同活頁內數據,建立活頁之間的查詢關係,作用類似關聯式數據庫,載入Power Pivot數據模型(Data model)作多維分析。

利用Excel建立數據倉庫

值得關注的是,Power Pivot支援OData數據來源,包括了微軟Exchange和SharePoint和CRM的紀錄檔,也支援連接JSON和MS SQL。Power Pivot支援的數據來源愈來愈多,未來可作為監察系統的工具。

微軟Power Query可結合不同數據來源,自動化更新,作用類似Splunk的統計數據分析。但Excel本身又可處理不少重要數學統計模型,除了利用PowerPivot作多維分析,可利用Power View,以不同準則迅速過濾資訊,再利用HTML 5,建立不同形態報表呈現,如顯示不同時期數據動態變化,Power View可支援在瀏覽器內分享報表, 也可設定不同權限。

Excel也可製作出不同報表(Reporting),甚至是KPI數碼儀表(Digital Dashboard)。Power BI for Office 365也支援SharePoint Online,雲端上建立分享報表的BI網站,Power Query建立動態載入從不同數據來源後,自動定時更新網站。Power Query支援不作全面下載資料,只直接更新數據模型內資料,以節省檔案的空間。但動態更新資料來源,只是集中支援於MS SQL和不同平台產生的OData。

建立動態更新網站

毋論如何,Power Query可說是Excel近年最重要功能改善,支援數據來源和整理數據,可以說是BI系統,以往難普及的最大障礙。估計不少用戶,會利用Power Query建立不同數據來源,建立分析和報表,甚至直接監察不同系統和業務表現。

如果資料內有地理資料,報表也可通過Power Map,地圖上標示出三維報表。Power BI 也支援以自然語言檢索,自動化建立不同查詢。不過這些項功能處於初階,其實用價值仍有待驗證。

Power BI for Office 365功能強大,唯一令人詬病是授權模式混亂。Office 365本身有眾多不同版本,微軟又不願雙手奉送所有額外功能,因此Office內Power BI不同功能授權,如何取得相關功能,有時令人無所適從。而要取得大部分性能,幾乎必須Office 2013 Professional Plus(或具Professional Plus授權的365版本),意味用戶可能要重新購買授權,因此不如獨立發售還要好。Power BI for Office 365性能不俗,授權混亂卻是主要敗筆。

沒有留言:

發佈留言