2012年11月14日星期三

IBM推出PureSystems新成員 PureData針對大數據應用

有關大數據的報導不絕如縷,為了更快從大數據改善營運,不同廠商推出多款結合軟硬件的數據庫機器,以加快部署過程。BM剛推出了三款不同數據庫機器,針對不同的工作負荷;其中作分析用途的兩部,加入了其收購Netezza的獨家技術。

IBM最早提出「大數據」觀念,「大數據」跟「智慧地球」(Smart Planet)關係密不可分,因為從城市管理、交通運輸、再生能源,甚至醫療衛生,都有可資利用大數據的空間。

數據庫應用,包括了多種不同負荷,不少企業考慮集中數據庫,至一些所謂數據庫機器上;數據庫機器非新鮮事物,著名的數據庫機器可數TeraData和Netezza,均以數據倉庫(Data warehousing)為主。Oracle的 ExaData,則可說更進一步,據稱可適應不同數據庫的應用。

Patterns高速部署應用

數月前,IBM推出了「專家集成系統」(Expert Integrated Systems)PureSystems家族,這些系統集合了系統管理、交換器和Storwize V7000儲存系統,集快速部署和簡易管理一身。四月份,IBM先推出了虛擬化硬件的Pureflex,支援x86和Power處理器。至於PureApps,則為可快速部署雲運算,支援以「預設格式」(Pattern)作快速安裝,整合所有軟硬件、網絡、儲存,一次過部署整個運算環境。今月,IBM推出針對數據庫PureData,針對處理大數據的數據庫應用,也同樣支援以Pattern的快速部署。

PureData是PureSystem最新家族成員,IBM軟件部資訊管理技術經理董群領說,PureSystem的設計重點,是為了減低管理和營運數據庫成本。過去一年,Big Data成長驚人,實踐個案相對較少。據統計,五個IT專案之中,四個仍是升級工程,耗去大部分時間。「PureSystems可縮短系統安裝管理的時間,騰出更多精力開發新應用。」

預設格式一次設定

「舉例說,有家南韓公司,每次升級SAP NetWeaver數據倉庫應用前,必須要先改變網絡設定,再重新接駁,又得重新編配儲存位置,然後才升級伺服器,涉及長時間的多個步驟。採用PureData之後,以Pattern一次過,設定整個系統軟硬件,毋須再像似往般,逐個環節設定。」

PureData也可一次過升級更新作業系統、數據庫版本、系統Firmware;完全毋須停頓,以同一介面管理所有元件,毋須任何佈線安裝,升級和更新,也毋須事前轉移系統,至另一部機器上。

PureApps和PureData引進了Patterns技術;仿如智能電話Apps的概念。也就是說,設定一次過自動化裝組。IBM與多家應用廠商合作,為PureApps和PureData預製了Patterns;包括了佈局設定(Typology)和數據庫Patterns。Pattern有如智能電話的Apps;下載後,自動按既定的格式安裝妥當,然後直接執行,縮短設定時間,可從數十小時減至十數分鐘。

「目前已經有超過二百種應用,支援PureSystems,陸續支援更多不同範圍應用。」

三種型號針對不同負荷

不過,PureData跟Oracle的 ExaData較大分別, IBM不強調同一部數據庫機器,整合多種不同負荷;PureData分開了三種不同系統;分別為Transaction(OLTP)、Operational Analytics和Analytics。

OLTP特點為讀寫次數頻繁,存取位置隨機多變;如購票和銀行收支系統,都屬OLTP。「同一機器整合一百個OLTP數據庫。大量查詢可令處理器負擔極大,記憶體存取的 hot pages,則決定了能否快速回應。「PureData優化了記憶體應用,比對手只使用SSD更快速,不單讀快,寫也更快。」Transaction版的PureData支援384個處理核心,記憶體可達6.2TB;運算能力和記憶體均十分驚人。

Operational Analytics則針對集中短促的查詢動作,大量連續位置讀取(Sequential Read),須快速製作臨時報表,即時作出判斷;應用範圍包括了客服中心,即時分析消費模式,向顧客提出建議;信用卡中心則從不尋常交易,偵察出可能的詐騙個案。此外,愈來愈多再生能源,如風力發電亦以大量數據,根據即時數據來,調整電力採集過程。

Analytic則可應付海量級數據分析,以AMPP技術加速分析龐大數據,上述兩種分析機器,均結合Netezza關鍵技術。Netezza可是說是一體機的先驅,靠緊密結合軟硬件,以加快數據庫效率的最佳例子。董群領說,IBM的PureSystems不少概念,均來自Netezza。

「例如Netezza獨家技術,可從高速旋轉的硬盤,快速過濾走達九成半多餘數據,又毋須建立索引(Index),也毋須調校優化、不要畫分和管理儲存,免除大部分DBA的管理工作,可自動處理複雜查詢。」Netezza通過數據庫內,直接進行查詢,免除數據來回的傳送,進一步加快數據倉庫效率。

董群領指出,PureData另一個最與別不同之處,為採用了大型主機System z技術,容錯和高可用性能,無出其右。跟較早前推出的pureScale系統一樣,所有元件均有多重後備,即使一個節點完全失效,也不會停頓或效能下降。

沒有留言:

發佈留言