我們都知道“瞎子摸象”的故事,。不同的瞎子對(duì)大象的認(rèn)識(shí)不同,因?yàn)樗麄冎徽J(rèn)識(shí)了自己摸到的地方,。而企業(yè)如果要避免重犯這樣的錯(cuò)誤,,那就離不開商務(wù)智能(BI)。專家認(rèn)為,,BI對(duì)于企業(yè)的重要性就像聰明才智對(duì)于個(gè)人的重要性,。歐美企業(yè)的經(jīng)驗(yàn)也證明,企業(yè)避免無知和一知半解危險(xiǎn)的有效手段就是商務(wù)智能。商務(wù)智能旨在充分利用企業(yè)在日常經(jīng)營(yíng)過程中收集的大量數(shù)據(jù)和資料,,并將它們轉(zhuǎn)化為信息和知識(shí)來免除各種無知狀態(tài)和瞎猜行為,。
支持BI的開源工具數(shù)量眾多,但是大多數(shù)的工具都是偏重某方面的,。例如,,CloverETL偏重ETL,JPivot偏重多維分析展現(xiàn),,Mondrian是OLAP服務(wù)器,。而Bee、Pentaho和SpagoBI等項(xiàng)目則針對(duì)商務(wù)智能問題提供了完整的解決方案,。
ETL 工具
ETL開源工具主要包括CloverETL和Octupus等,。
(1)CloverETL是一個(gè)Java的ETL框架,用來轉(zhuǎn)換結(jié)構(gòu)化的數(shù)據(jù),,支持多種字符集之間的轉(zhuǎn)換(如ASCII,、UTF-8和ISO-8859-1等);支持JDBC,,同時(shí)支持dBase和FoxPro數(shù)據(jù)文件;支持基于XML的轉(zhuǎn)換描述,。
(2)Octupus是一個(gè)基于Java的ETL工具,,它也支持JDBC數(shù)據(jù)源和基于XML的轉(zhuǎn)換定義。Octupus提供通用的方法進(jìn)行數(shù)據(jù)轉(zhuǎn)換,,用戶可以通過實(shí)現(xiàn)轉(zhuǎn)換接口或者使用Jscript代碼來定義轉(zhuǎn)換流程,。
OLAP服務(wù)器
(1)Lemur主要面向HOLAP,雖然采用C++編寫,,但是可以被其他語(yǔ)言的程序所調(diào)用,。Lemur支持基本的操作,如切片,、切塊和旋轉(zhuǎn)等基本操作,。
(2)Mondrian面向ROLAP包含4層:表示層、計(jì)算層,、聚集層,、存儲(chǔ)層。
● 表示層:指最終呈現(xiàn)在用戶顯示器上的以及與用戶之間的交互,,有許多方法來展現(xiàn)多維數(shù)據(jù),,包括數(shù)據(jù)透視表、餅,、柱,、線狀圖。
● 計(jì)算層:分析,、驗(yàn)證,、執(zhí)行MDX查詢,。
● 聚集層:一個(gè)聚集指內(nèi)存中一組計(jì)算值(cell),這些值通過維列來限制,。計(jì)算層發(fā)送單元請(qǐng)求,,如果請(qǐng)求不在緩存中,或者不能通過旋轉(zhuǎn)聚集導(dǎo)出的話,,那么聚集層向存儲(chǔ)層發(fā)送請(qǐng)求,。聚合層是一個(gè)數(shù)據(jù)緩沖層,從數(shù)據(jù)庫(kù)來的單元數(shù)據(jù),,聚合后提供給計(jì)算層,。聚合層的主要作用是提高系統(tǒng)的性能。
● 存儲(chǔ)層:提供聚集單元數(shù)據(jù)和維表的成員,。包括三種需要存儲(chǔ)的數(shù)據(jù),,分別是事實(shí)數(shù)據(jù)、聚集和維,。
OLAP客戶端
JPivot是JSP風(fēng)格的標(biāo)簽庫(kù),,用來支持OLAP表,使用戶可以執(zhí)行典型的OLAP操作,,如切片,、切塊、上鉆,、下鉆等,。JPivot使用Mondrian服務(wù)器,分析結(jié)果可以導(dǎo)出為Excel或PDF文件格式,。
數(shù)據(jù)庫(kù)管理系統(tǒng)
主要的開源工具包括MonetDB,、MySQL、MaxDB和PostgreSQL等,。這些數(shù)據(jù)庫(kù)都被設(shè)計(jì)用來支持BI環(huán)境,。MySQL、MaxDB和PostgreSQL均支持單向的數(shù)據(jù)復(fù)制,。BizGres項(xiàng)目的目的在于使PostgreSQL成為數(shù)據(jù)倉(cāng)庫(kù)和BI的開源標(biāo)準(zhǔn),。BizGres為BI環(huán)境構(gòu)建專用的完整數(shù)據(jù)庫(kù)平臺(tái)。
完整的BI開源解決方案
1.Pentaho 公司的Pentaho BI 平臺(tái)
它是一個(gè)以流程為中心的,、面向解決方案的框架,,具有商務(wù)智能組件。BI 平臺(tái)是以流程為中心的,,其中樞控制器是一個(gè)工作流引擎,。工作流引擎使用流程定義來定義在 BI 平臺(tái)上執(zhí)行的商務(wù)智能流程。流程可以很容易被定制,也可以添加新的流程,。BI 平臺(tái)包含組件和報(bào)表,,用以分析這些流程的性能。BI 平臺(tái)是面向解決方案的,,平臺(tái)的操作是定義在流程定義和指定每個(gè)活動(dòng)的 action 文檔里,。這些流程和操作共同定義了一個(gè)商務(wù)智能問題的解決方案。這個(gè) BI 解決方案可以很容易地集成到平臺(tái)外部的商業(yè)流程,。一個(gè)解決方案的定義可以包含任意數(shù)量的流程和操作,。
BI平臺(tái)包括一個(gè) BI 框架、BI 組件,、一個(gè) BI 工作臺(tái)和桌面收件箱,。BI 工作臺(tái)是一套設(shè)計(jì)和管理工具,集成到Eclipse環(huán)境,。這些工具允許商業(yè)分析人員或開發(fā)人員創(chuàng)建報(bào)表,、儀表盤、分析模型,、商業(yè)規(guī)則和 BI 流程,。Pentaho BI 平臺(tái)構(gòu)建于服務(wù)器、引擎和組件的基礎(chǔ)之上,,包括J2EE 服務(wù)器,、安全與權(quán)限控制、portal,、工作流、規(guī)則引擎,、圖表,、協(xié)作、內(nèi)容管理,、數(shù)據(jù)集成,、多維分析和系統(tǒng)建模等功能。這些組件的大部分是基于標(biāo)準(zhǔn)的,,可使用其他產(chǎn)品替換之,。
2.ObjectWeb
該項(xiàng)目近日發(fā)布了SpagoBi 1.8版本。SpagoBi 是一款基于Mondrain+JProvit的BI方案,,能夠通過OpenLaszlo產(chǎn)生實(shí)時(shí)報(bào)表,,為商務(wù)智能項(xiàng)目提供了一個(gè)完整開源的解決方案,它涵蓋了一個(gè)BI系統(tǒng)所有方面的功能,,包括:數(shù)據(jù)挖掘,、查詢、分析、報(bào)告,、Dashboard儀表板等等,。SpagoBI使用核心系統(tǒng)與功能模塊集成的架構(gòu),這樣在確保平臺(tái)穩(wěn)定性與協(xié)調(diào)性的基礎(chǔ)上又保證了系統(tǒng)具有很強(qiáng)的擴(kuò)展能力,。用戶無需使用SpagoBI的所有模塊,,而是可以只利用其中的一些模塊。
SpagoBI使用了許多已有的開源軟件,,如Spago和Spagosi等,。因此,SpagoBI集成了Spago的特征和技術(shù)特點(diǎn),,使用它們管理商務(wù)智能對(duì)象,,如報(bào)表、OLAP分析,、儀表盤,、記分卡以及數(shù)據(jù)挖掘模型等。SpagoBI支持BI系統(tǒng)的監(jiān)控管理,,包括商務(wù)智能對(duì)象的控制,、校驗(yàn)、認(rèn)證和分配流程,。SpagoBI采用Portalet技術(shù)將所有的BI對(duì)象發(fā)布到終端用戶,,因此BI對(duì)象就可以集成到為特定的企業(yè)需求而已經(jīng)選擇好的Portal系統(tǒng)中去。
3.Bee項(xiàng)目
該項(xiàng)目是一套支持商務(wù)智能項(xiàng)目實(shí)施的工具套件,,包括ETL工具和OLAP 服務(wù)器,。Bee的ETL工具使用基于Perl的BEI,通過界面描述流程,,以XML形式進(jìn)行存儲(chǔ),。用戶必須對(duì)轉(zhuǎn)換過程進(jìn)行編碼。Bee的ROLAP 服務(wù)器保證多通SQL 生成和強(qiáng)有力的高速緩存管理(使用MySQL數(shù)據(jù)庫(kù)管理系統(tǒng)),。ROLAP服務(wù)器通過SOAP應(yīng)用接口提供豐富的客戶應(yīng)用,。Web Portal作為主要的用戶接口,通過Web瀏覽器進(jìn)行報(bào)表設(shè)計(jì),、展示和管理控制,,分析結(jié)果可以以Excel、PDF,、PNG,、PowerPoint、text和XML等多種形式導(dǎo)出,。
Bee項(xiàng)目的特點(diǎn)在于:
● 簡(jiǎn)單快捷的數(shù)據(jù)訪問,;
● 支持預(yù)先定義報(bào)表和實(shí)時(shí)查詢,;
● 通過拖拽方式輕松實(shí)現(xiàn)報(bào)表定制;
● 完整報(bào)表的輕松控制,;
● 以表和圖進(jìn)行高質(zhì)量的數(shù)據(jù)展示,。
■ 喬曉強(qiáng) 魏峻