大概率每天早8點(diǎn)25更新 今天來聊聊數(shù)據(jù)分析都會(huì)用到的工具,,你都在用什么呢,? 數(shù)據(jù)分析的工具有很多,從數(shù)據(jù)分析崗位的描述里其實(shí)就能發(fā)現(xiàn)企業(yè)都需要會(huì)哪些工具的人,,這里我分成了4類來聊聊,。分別是基礎(chǔ)、可視化,、專業(yè)的統(tǒng)計(jì)分析以及編程語(yǔ)言,。 說到數(shù)據(jù)分析的基礎(chǔ)的工具,非Excel莫屬,。Excel微軟辦公系列的重要組成之一,,任何辦公人員都會(huì)用到的神器,不得不說它的體系太龐大了,,在人力,、金融、管理等多個(gè)領(lǐng)域都會(huì)應(yīng)用,,同樣對(duì)數(shù)據(jù)分析人員來說,,也可以進(jìn)行各種數(shù)據(jù)處理和分析。
表格制作:簡(jiǎn)單的表格錄入,、制作,、美化。 透視表:實(shí)現(xiàn)數(shù)據(jù)透視的效果,,可以說學(xué)會(huì)數(shù)據(jù)透視表,,基本可以解決80%的工作。 公式:通過公式可以進(jìn)行數(shù)學(xué)計(jì)算,。 統(tǒng)計(jì)分析:Excel里的 數(shù)據(jù)分析 可以實(shí)現(xiàn)描述統(tǒng)計(jì),、假設(shè)檢驗(yàn)、抽樣等統(tǒng)計(jì)分析的功能,,只要用的好,,不遜色于專業(yè)的統(tǒng)計(jì)分析軟件。 圖表:用Excel作圖操作簡(jiǎn)單,。簡(jiǎn)單的日?qǐng)?bào)/月報(bào)中以及自己分析時(shí)Excel的圖表完全可以滿足我們的需求,。但是當(dāng)要進(jìn)行專業(yè)的展示時(shí),圖表的美化就顯得尤為重要,,而用Excel去美化圖表,,也不是不行,只是要用到很多偏門的小技巧,,沒必要花那么多時(shí)間,,現(xiàn)成有可用的工具,。 VBA:還可以用VBA編程實(shí)現(xiàn)更高級(jí)復(fù)雜的需求,。 插件:Excel還能承載很多有用的插件,,比如PowerQuery、PowerMap,、PowerView等,,來輔助我們實(shí)現(xiàn)更為強(qiáng)大的數(shù)據(jù)分析功能。 總的來說,,Excel可以說是數(shù)據(jù)分析基礎(chǔ)以及必備的工具,,可以不用Power BI,但你一定不能沒有Excel,。Tableau對(duì),,Tableau就是可替代Excel進(jìn)行圖表美化工作的一個(gè)工具。它將數(shù)據(jù)計(jì)算和美觀的圖表完美地融合在一起,,可以在幾分鐘內(nèi)生成美觀的圖表,、坐標(biāo)圖、儀表盤與報(bào)告,。是用來快速分析,、可視化的強(qiáng)大工具,偏向商業(yè)分析,。
輕松整合,,易上手。 交互性,,類似于Excel數(shù)據(jù)透視表/圖的功能,,可進(jìn)行交互。 美觀的圖表,,輕松制作美觀的儀表盤,、坐標(biāo)圖。
Power BI作為Excel的一個(gè)插件,,后來獨(dú)立門戶的軟件,,它的可視化效果非常強(qiáng)大。首先要理解什么是BI,,商業(yè)智能(Business Intelligence,,簡(jiǎn)稱:BI),又稱商業(yè)智慧或商務(wù)智能,,指用現(xiàn)代數(shù)據(jù)倉(cāng)庫(kù)技術(shù),、線上分析處理技術(shù)、數(shù)據(jù)挖掘和數(shù)據(jù)展現(xiàn)技術(shù)進(jìn)行數(shù)據(jù)分析以實(shí)現(xiàn)商業(yè)價(jià)值,。所以Power BI就是將數(shù)據(jù)分析的流程展示出來以便提供科學(xué)決策的工具先用PowerQuery處理和清洗數(shù)據(jù),,再用PowerPivot建模,最后用Power BI的圖表庫(kù)作圖,。
同Tableau一樣,,都是基于Excel的數(shù)據(jù)透視圖的功能和效果來完成的,。 和Excel無(wú)縫對(duì)接,創(chuàng)建個(gè)性化的數(shù)據(jù)看板,。 總的來說,,BI類的工具是把將數(shù)據(jù)和業(yè)務(wù)聯(lián)系在一起,為了更好的決策誕生的,,這一點(diǎn)就和Excel非常了不同了,。SPSSSPSS是統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案的軟件,著重在于統(tǒng)計(jì)分析運(yùn)算,、數(shù)據(jù)挖掘,、預(yù)測(cè)分析等功能的實(shí)現(xiàn)。SPSS可以在不需要編程語(yǔ)言的情況下,,很好地進(jìn)行回歸分析,、方差分析、多變量分析等的研究,。界面簡(jiǎn)單,,SPSS采用類似Excel表格的方式讀入與管理數(shù)據(jù)。 功能強(qiáng)大,,集數(shù)據(jù)錄入,、整理、分析功能于一身,,能夠進(jìn)行相關(guān)分析,、回歸分析、聚類分析,、時(shí)間序列分析等,。 上手有一定的門檻,需要使用者有一些統(tǒng)計(jì)學(xué)基礎(chǔ),,能夠?qū)y(tǒng)計(jì)分析模型有一定的理解,。 有專門的繪圖系統(tǒng),可繪制圖形,,但相對(duì)于其他可視化軟件來說,,它的圖形就單調(diào)許多了。
SASSAS同SPSS一樣,,是一個(gè)做專業(yè)統(tǒng)計(jì)分析的軟件,。
功能更強(qiáng)大,統(tǒng)計(jì)方法齊,、全,、新。相對(duì)SPSS來說,功能更強(qiáng)大,,相對(duì)來講,,SAS比較難學(xué)些,但如果掌握了SAS會(huì)更有價(jià)值,,比如離散選擇模型,,抽樣問題,正交實(shí)驗(yàn)設(shè)計(jì)等還是SAS比較好用 主流的數(shù)據(jù)分析編程語(yǔ)言莫過于R和Python了。和可視化工具不同的是,,PB和Tableau有可視化界面,,而R和Python是純代碼RR是用于統(tǒng)計(jì)分析、繪圖的語(yǔ)言和操作環(huán)境,。在數(shù)據(jù)處理、分析、計(jì)算和制圖等功能上都非常優(yōu)秀,,可以理解為加強(qiáng)編程版的SPSS/SAS。
R的思想是:它可以提供一些集成的統(tǒng)計(jì)工具,,但更大量的是它提供各種數(shù)學(xué)計(jì)算,、統(tǒng)計(jì)計(jì)算的函數(shù),從而使使用者能靈活機(jī)動(dòng)的進(jìn)行數(shù)據(jù)分析,,甚至創(chuàng)造出符合需要的新的統(tǒng)計(jì)計(jì)算方法,。強(qiáng)大的統(tǒng)計(jì)分析程序包,內(nèi)建多種統(tǒng)計(jì)學(xué)及數(shù)字分析功能,。R比其他統(tǒng)計(jì)學(xué)或數(shù)學(xué)專用的編程語(yǔ)言有更強(qiáng)的物件導(dǎo)向(面向?qū)ο蟪绦蛟O(shè)計(jì))功能,。 高質(zhì)量的矢量圖,ggplot2可以快速創(chuàng)建各種統(tǒng)計(jì)圖表,。
PythonR更專注于統(tǒng)計(jì)數(shù)據(jù)分析領(lǐng)域,,而Python則應(yīng)用更為廣泛和全面,所以Python也被稱作膠水語(yǔ)言,,學(xué)習(xí)時(shí)要有所取舍,。
語(yǔ)法簡(jiǎn)單,Python語(yǔ)法簡(jiǎn)單,, 高質(zhì)量的數(shù)據(jù)科學(xué)計(jì)算包,, 可移植性強(qiáng),由于它的開源本質(zhì),,Python已經(jīng)被移植在許多平臺(tái)上(經(jīng)過改動(dòng)使它能夠工作在不同平臺(tái)上),。 總的來說,Excel是通用工具,,而Power BI/Tableau一類如果屬于初級(jí)的操作工具的話,,那么SPSS/SAS就應(yīng)該是中級(jí),而R/Python屬于高級(jí),這里的級(jí)別并非是功能的強(qiáng)大與否,,而是指學(xué)習(xí)和上手的難以程度,。
|