很多人學(xué)習(xí)了一段時間,,可是依然不清楚如何將Power BI用于實踐,或者只接觸了其中的某個模塊,,認(rèn)為她只是一個分析工具或者可視化工具,,對PowerBI沒有一個整體的認(rèn)識。 本文利用一個實例,,來梳理一下PowerBI數(shù)據(jù)分析的步驟和流程,,以及各個模塊的主要功能,幫你認(rèn)識一個全面的PowerBI,。 先看一個高德地圖發(fā)布的中國主要城市交通健康排行榜,,網(wǎng)址如下, https://trp./diagnosis/index.do 下面就利用PowerBI提取該頁面數(shù)據(jù),,并用她進(jìn)行數(shù)據(jù)清洗和數(shù)據(jù)建模,,然后制作一個類似的可視化分析報告。 一,,獲取網(wǎng)頁數(shù)據(jù) 數(shù)據(jù)分析的第一步是獲取數(shù)據(jù),,在PowerBI中,可以連接各種形式,、各種來源的數(shù)據(jù),,無論是Excel、txt文件,,還是各種數(shù)據(jù)庫,、云服務(wù),甚至是網(wǎng)頁數(shù)據(jù),。 在PowerBI Desktop中,,選擇從web獲取數(shù)據(jù),并輸入網(wǎng)址: 在彈出的窗口中點擊"使用示例添加表": 該頁面數(shù)據(jù)有很多,我們以抓取城市排行榜數(shù)據(jù)為例,,來看看PowerBI是如何獲取這些數(shù)據(jù)的。 先看一下前兩名的城市分別是哪個,,然后輸入這兩個城市名,,并選擇需要的數(shù)據(jù),系統(tǒng)就會自動識別剩余的數(shù)據(jù),, 以同樣的方式,,可以提取出該頁面的刷新時間、TOP3的城市名稱等數(shù)據(jù),。 二,數(shù)據(jù)清洗 從各種來源獲取的數(shù)據(jù)很可能不能直接用于數(shù)據(jù)分析,,需要進(jìn)行一系列的整理,,這個過程稱為數(shù)據(jù)清洗,如果數(shù)據(jù)源不夠規(guī)范,,這個過程也會非常耗時耗力,,而利用PowerQuery,可以幫你快速清洗數(shù)據(jù),。 第一步從高德網(wǎng)站獲取到的排行榜數(shù)據(jù)是這樣的,, 所有的數(shù)據(jù)都擠在一列,需要想辦法把這些數(shù)據(jù)分開,。仔細(xì)觀察這些數(shù)據(jù),,其實很有規(guī)律,只需要用幾個分列技巧就可以完成,。 1,,按字符數(shù)分列 2,對第一列按從數(shù)字到非數(shù)字的轉(zhuǎn)換分列 3,,對最后一列按位置分列,,如下圖所示, 到這里基本上就是我們需要的數(shù)據(jù)結(jié)構(gòu)了,,然后調(diào)整一下數(shù)據(jù)格式和字段標(biāo)題,,清洗完成。 抓取的其他數(shù)據(jù)同樣根據(jù)需要整理成需要的樣子,。 三、數(shù)據(jù)建模 需要分析的數(shù)據(jù),,往往并不是只有一張表,而這些不同的表,,需要協(xié)同配合才能更好的使用,,協(xié)同配合依靠表與表之間的邏輯關(guān)系,這個建立關(guān)系的過程就稱為數(shù)據(jù)建模,。 一個良好的數(shù)據(jù)模型是數(shù)據(jù)分析的基礎(chǔ),,也是一個良好的可視化報告的基礎(chǔ),建立一個優(yōu)秀的模型,,可以更簡單的實現(xiàn)分析目的,。 在PowerQuery中清洗后的數(shù)據(jù)上載進(jìn)來后,根據(jù)需要添加計算列,、度量值或者維度表,,比如在排行榜表中增加一個城市健康類型,以便與其他表建立關(guān)系: 增加一個健康類型維度表,, 為了實現(xiàn)動態(tài)配色,,建立一個配色的度量值, 配色 = IF(SELECTEDVALUE('健康分類表'[健康類型])="健康","#00BAFF","#AB7EFE") 這個簡單的數(shù)據(jù)模型如下,, 四,、數(shù)據(jù)可視化 數(shù)據(jù)清洗,、數(shù)據(jù)建模的結(jié)果將會以圖表來展現(xiàn),可視化的方式讓數(shù)據(jù)更易于理解,! 高德的這個"交通健康榜",,主要是一個城市分布地圖和一個排行榜表格,我們用PowerBI的圖表來模擬制作一下,。 地圖可以使用China scatterMap,,效果如下, 表格比較簡單,,關(guān)鍵是格式的細(xì)節(jié)設(shè)置,, 左側(cè)也可以根據(jù)高德的報告,添加個環(huán)形圖和排名前三的城市,, 這個報告也是可以根據(jù)高德數(shù)據(jù)進(jìn)行刷新的,,每次打開該文件,點擊刷新,就是最新的實時報告,。 五,、發(fā)布分享 通過多種設(shè)備查看分析報告不再是夢想,PowerBI讓數(shù)據(jù)變得觸手可及,,任何人都可以隨時隨地查看分析報告,。 前面幾步生成的PowerBI報告,不僅可以在本機查看,,還可以更方便的發(fā)布到web上與他人共享,。 1,在PowerBI Desktop中"發(fā)布"到服務(wù) 2,,在PowerBI服務(wù)中發(fā)布到web 進(jìn)入PowerBI服務(wù)(app.powerbi.cn)中,,找到剛才發(fā)布的報表,發(fā)布到web,,如下圖所示: 然后會生成一串網(wǎng)址,,利用它就可以隨時隨地查看了,在移動端同樣可以查看,。 報告網(wǎng)址:https:///K6Pa1jjU |
|