2011年11月16日星期三

SQL 2012數據庫機器整合SharePoint ─商業智能自助化 提昇視覺效果

企業數據愈來愈多,建立「數據倉庫」(Data Warehousing)作為報告分析,幾乎必須另建一個平台。原因是OLTP和OLAP所需的企業有所不同。OLTP,也就是交易處理的I/O要求甚高,OLAP則涉及複雜和快速的查詢功能;故此Teradata的數據機器早已利用MPP平行架構,建立大規模數據倉庫,IBM亦收購了Netezza,市場上的數據庫機器,頓如雨後春筍。

自Oracle推出Exadata數據庫機器,聲稱可同時應付OLTP線上交易和OLAP報告分析,陸續推出了多部不同的中間件及商業智能機器,優化與硬件整合。上述專門設備可免除用戶花上大量精力,整合和優化軟硬件,作數據倉庫和商業智能,漸為市場所接受,而微軟亦夥拍HP推出多部數據庫機器。

去年,微軟宣佈推出多部數據倉庫機器;例如Business Data Warehouse設備和 HP的Fast Track Data Warehouse。但最令市場感興趣,為最高階的平行數據倉庫「PDW」 設備,也利用MPP技術建立數據倉庫。二OO八年,微軟收購專攻MPP的Datallegro,成為其PDW設備基礎,然後再加上SharePoint和PowerPivot,推出新一代商業智能機器PDW設備。

高度整合SharePoint協作

SQL數據庫機器的高級項目經理Eric Kramer表示,微軟不會跟Oracle一樣,推出同時用於OLTP和OLAP機器,而會稍後再推出專用於OLTP的機器;他對於ExaData聲稱同時處理OLTP和OLAP,更不以為然。「因為兩者操作上要求完全不同。」

Kramer指出,Oracle出售的Exadata,大部分也並非同一規格,往往要根據客戶要求而個別調整─所謂「同一機器整合OLTP和OLAP」,不過文字遊戲而已。PDW除了支援MPP技術快速查詢,也可以外接Hadoop平台,令PDW可處理海量非結構數據的能力。

但微軟的核心策略,則是自助(Self–service)商業智能。下一版本的SQL 2012,加入了更強勁的視覺化分析工具,以Silverlight為基礎Power View工具,整合 SharePoint和PowerPivot,甚至取代以往ETL工具和MDX 語言存取多維數據的OLAP,大幅減輕IT人員的負擔。

高度視覺化的BI前端

MDX是微軟用於查詢多維數據庫專用語言,類似以T-SQL語言用於查詢SQL數據庫;但MDX始終比較專門深奧;而Excel 2010的PowerPivot功能,則只消掌握類似Excel公式的DAX,用戶已可自行建立龐複的數據模型,分析處理數以億計的記錄,而且完全在記憶體內(In-Memory)執行,反應幾乎毫秒之間;原理類似SAP的HANA和Oracle的Exalytic,同樣利用了記憶體運算技術。

SQL 2012最大特色,為完全結合了SharePoint 2010為前端協作工具,簡化了處理數據過程,用戶幾乎可以完全「自助」做分析數據,毋須複雜的語法。Silverlight高度視覺化能力,更令人眼前一亮,媲美Flash效果。
傳統上,IT人員必須以ETL數據裝載工具,從不同來源載入數據,轉換格式為不同Schema並統一化,打造多維OLAP數據,再利用SSAS內的MDX語言,製作不同報表供用戶分析比較。

Office 2010的PowerPivot技術,可從SQL數據庫的數據倉庫,甚至網上的不同來源,迅速混成數據模型,擴充能力極高,甚至可省卻建立數據倉庫,直接從PowerPivot作商業智能。

據SQL的數據設備區域總監Dan Kogon表示,DAX語言很類似 Excel,較高階用戶可行自行建立數據模型,通過SharePoint分享。其他人只要通過瀏覽器,連接上PowerPivot資料源,再選取資料類別,拖曳經由SharePoint組態的Metadata呈現出來,以類似Office 2010的Ribbon功能欄,選取圖像表現方式,以不同方式,馬上產生報表作分析比較,甚至加入時間因素,以動畫方式檢視變化。

OLAP的終結者 PowerPivot

Power View利用Silverlight平台,不單支援一般的瀏覽器,也可從流動設備;如Windows Phone、Android ,甚至未來於iOS上檢視,馬上進行查詢和商業智能分析,Power View可於瀏覽器內馬上拖曳數據作不同顯示,製作報表,甚至以Storyboarding功能,馬上輸出作為PowerPoint,將視覺化影像輸出作為簡報。

Kramer表示:「SharePoint的功能極多,包括文件管理和流程管理等,利用SharePoint作商業智能令工作負荷更難以估計。微軟數據庫機器則已經優化了SharePoint平台,專門作商業智能的用途,安裝一小時內即可運作,並支援數以千計用戶產生報表。」

事實上,利用了PowerPivot,日後IT人員毋須再花大量時間製作OLAP,節省大量支援時間。PowerPivot技術全以Excel為基礎,全部皆運作於記憶體上,成本較SAP、IBM和Oracle低得多。

Kramer舉例:「美國的Mediterranean航運公司三小時內,從內部SQL伺服器和美國海關網站,下載了三千三百萬行資料,高度壓縮成1.7GB的數據模型,並作實時分析,全部由用戶自行完成,毋須IT人員協助。」

儘管說,微軟宣佈SQL 2012支援的商業智能數據語法模型BISM亦支援以其MDX語法來存取,普遍以為PowerPivot遲早替代OLAP,成為微軟BI日常主流工具,而OLAP則作更深度的分析。

Kramer表示:「利用 SharePoint,只要授權少數人熟悉Excel語法的用戶,在數據庫機器上的SharePoint,建立PowerPivot數據模型,再利用PowerView供一般用戶使用,就可普及化BI,更多用戶洞悉更多數據內涵和意義。」

沒有留言:

發佈留言