關(guān)于轉(zhuǎn)載授權(quán)
引言 藝術(shù)之美根植于其所傳達(dá)的信息。有時候,,現(xiàn)實并非我們所看到或感知到的,。達(dá)芬奇(Da Vinci)和畢加索(Picasso)等藝術(shù)家都通過其具有特定主題的非凡藝術(shù)品,試圖讓人們更加接近現(xiàn)實,。 數(shù)據(jù)科學(xué)家并不遜色于藝術(shù)家,。他們用數(shù)據(jù)可視化的方式繪畫,試圖展現(xiàn)數(shù)據(jù)內(nèi)隱藏的模式或表達(dá)對數(shù)據(jù)的見解,。更有趣的是,,一旦接觸到任何可視化的內(nèi)容、數(shù)據(jù)時,,人類會有更強烈的知覺、認(rèn)知和交流,。 在數(shù)據(jù)科學(xué)中,,有多種工具可以進(jìn)行可視化。在本文中,,我展示了使用Python來實現(xiàn)的各種可視化圖表,。
涉及到的東西并不多,!Python已經(jīng)讓你很容易就能實現(xiàn)可視化——只需借助可視化的兩個專屬庫(libraries),,俗稱matplotlib和seaborn。聽說過嗎,? Matplotlib:基于Python的繪圖庫為matplotlib提供了完整的2D和有限3D圖形支持,。這對在跨平臺互動環(huán)境中發(fā)布高質(zhì)量圖片很有用。它也可用于動畫,。 Seaborn:Seaborn是一個Python中用于創(chuàng)建信息豐富和有吸引力的統(tǒng)計圖形庫,。這個庫是基于matplotlib的。Seaborn提供多種功能,,如內(nèi)置主題,、調(diào)色板、函數(shù)和工具,,來實現(xiàn)單因素,、雙因素、線性回歸,、數(shù)據(jù)矩陣,、統(tǒng)計時間序列等的可視化,以讓我們來進(jìn)一步構(gòu)建復(fù)雜的可視化,。
剛出版不久的《A comprehensive guide on Data Visualization》中,,介紹了最常用的可視化技術(shù)。在進(jìn)一步深入學(xué)習(xí)前,,如果你尚未閱讀此書,,我們建議你參考此書。 以下是Python代碼與其輸出結(jié)果,。我就是用下面的數(shù)據(jù)集來創(chuàng)建這些可視化的,。
你可以嘗試?yán)L制基于兩個變量的熱圖,如X軸為性別,,Y軸為BMI,,數(shù)據(jù)點為銷售值。
現(xiàn)在,,你肯定已經(jīng)意識到了數(shù)據(jù)可視化的美妙,,為什么不自己動手試試呢?在以后的文章中,,我們還將探討用Python實現(xiàn)地圖可視化和詞云,。 大數(shù)據(jù)文摘也曾經(jīng)發(fā)布過用R進(jìn)行數(shù)據(jù)可視化的文章,《用R語言進(jìn)行數(shù)據(jù)可視化的綜合指南(一)》和《用R語言進(jìn)行數(shù)據(jù)可視化的綜合指南(二)》,。大家可以參考一下,,做個對比。 用R語言進(jìn)行數(shù)據(jù)可視化的綜合指南(一) 用R語言進(jìn)行數(shù)據(jù)可視化的綜合指南(二) |
|