Python作為一門優(yōu)秀的編程語言,近年來受到很多編程愛好者的青睞,。 一是因?yàn)镻ython本身具有簡捷優(yōu)美,、易學(xué)易用的特點(diǎn);二是由于互聯(lián)網(wǎng)的飛速發(fā)展,,我們正迎來大數(shù)據(jù)的時代,,而Python無論是在數(shù)據(jù)的采集與處理方面,還是在數(shù)據(jù)分析與可視化方面都有獨(dú)特的優(yōu)勢,。我們可以利用Python便捷地開展與數(shù)據(jù)相關(guān)的項(xiàng)目,,以很低的學(xué)習(xí)成本快速完成項(xiàng)目的研究。 Python被大量應(yīng)用在數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域,,其中使用極其廣泛的是IPython、Numpy,、pandas,、Matplotlib等庫。對于希望使用Python來完成數(shù)據(jù)分析工作的人來說,,學(xué)習(xí)IPython,、Numpy、pandas,、Matplotlib這個組合是目前看來不錯的方向,。
(圖源:ipython.org) IPython是Python的加強(qiáng)型交互式解釋器,。 IPython是使用Python進(jìn)行數(shù)據(jù)分析、處理,、呈現(xiàn)的重要選擇之一,。它是一個與Python科學(xué)計(jì)算包(主要包括Numpy、pandas,、Matplotlib等)緊密聯(lián)系的交互式開發(fā)環(huán)境,,它同時也是Python科學(xué)計(jì)算包的一部分。 主要特點(diǎn)包括:
IPython加上一個文本編輯器是科學(xué)計(jì)算者使用Python進(jìn)行數(shù)據(jù)分析、處理,、呈現(xiàn)的最佳選擇之一,。 IPython主要包括:
IPyton殼 2017年最新發(fā)布的IPython殼以及內(nèi)核具有以下這些重要的特性:
(圖源:numpy.org) Numpy是Python科學(xué)計(jì)算庫的基礎(chǔ),。 主要包括:
Numpy提供了一個簡潔的C語言接口,,可以非常方便地使用C語言編寫的代碼操作Numpy數(shù)組對象,反過來使用C語言生成的數(shù)組也可以輕松的轉(zhuǎn)化成Numpy數(shù)組對象,;這一特性使得Python輕松地與其他編程語言C/C 粘結(jié)在一起,。Numpy除了用作科學(xué)計(jì)算,,也可以用作多維度普通數(shù)據(jù)的容器;并且可以定義任何類型的數(shù)據(jù),,使得Numpy高效,、無縫地與各種類型的數(shù)據(jù)分析庫連接起來。 Numpy的主要對象是一個多維度的,、均勻的多維數(shù)組,。Numpy提供了各種函數(shù)方法可以非常方便靈活的操作數(shù)組,熟練掌握數(shù)組的基本概念是使用數(shù)組這種數(shù)據(jù)結(jié)構(gòu)的基本要求,。
(圖源:pandas.pydata.org) pandas是建立在Numpy基礎(chǔ)上的高效數(shù)據(jù)分析處理庫,,是Python的重要數(shù)據(jù)分析庫。 pandas提供了眾多的高級函數(shù),,極大地簡化了數(shù)據(jù)處理的流程,,尤其是被廣泛地應(yīng)用于金融領(lǐng)域的數(shù)據(jù)分析。 pandas主要包括:
(圖源:matplotlib.org) Matplotlib是一個主要用于繪制二維圖形的Python庫,。 數(shù)據(jù)可視化是數(shù)據(jù)分析的重要環(huán)節(jié),借助圖形能夠幫助更加直觀地表達(dá)出數(shù)據(jù)背后的”東西”,。 Matplolib最初主要模仿Matlab的畫圖命令,,但是它是獨(dú)立于Matlab的,可以自由,、免費(fèi)使用的繪圖包,。Matplotlib依賴于之前介紹的Numpy庫來提供出色的繪圖能力。Matplotlib項(xiàng)目是John Hunter在2002年發(fā)起的,,目標(biāo)是建立一個具備以下特點(diǎn)的Python繪圖工具包:
經(jīng)過社區(qū)多年以來的努力,,Matplotlib已經(jīng)具備了上面列出的所有特點(diǎn)。現(xiàn)在Matplotlib被廣泛地應(yīng)用于各種生產(chǎn),、科學(xué)研究等環(huán)境中,,比如在網(wǎng)絡(luò)服務(wù)中動態(tài)生成圖形、在IPython殼下交互使用Matplotlib繪圖等,。 Matplotlib從概念上可以分為三層: matplotlib.pylab,,這一層給主要給用戶提供一些簡單的命令來生成圖形,語法風(fēng)格和Matlab非常接近,。Matplotlib的API,,這一層主要給用戶提供了直接創(chuàng)建圖形、線條,、文本等的功能,。這是一個抽象層,它并不關(guān)心圖形的輸出,。最后一層是后端,,主要是管理圖形的輸出等其他一些功能。 如果你已經(jīng)決定學(xué)習(xí)Python數(shù)據(jù)分析,,但是之前沒有編程經(jīng)驗(yàn),,那《Python數(shù)據(jù)分析從入門到精通》你絕不能錯過。Python數(shù)據(jù)分析“四劍客”在本書上會進(jìn)行詳細(xì)深入的介紹,。 本書詳細(xì)地介紹了IPython,、Numpy、pandas,、Matplotlib庫的組成與使用,,為科學(xué)計(jì)算相關(guān)人員提供了有用的參考資料。采取循序漸進(jìn)的寫作風(fēng)格,,對于工具的安裝,、使用步驟、方法技巧逐步展開,,加以圖解和應(yīng)用場景,,即使完全不懂Python和數(shù)據(jù)分析的人員,也可以流暢地讀完本書,。 無論哪種語言,,編程的方法、模式,、數(shù)據(jù)結(jié)構(gòu),、算法都是相通的。本書將科學(xué)計(jì)算,、數(shù)據(jù)結(jié)構(gòu)與各種工具和方法完美結(jié)合,,讓非Python讀者也能融會貫通,,讓學(xué)習(xí)統(tǒng)計(jì)的人能找到更適合的統(tǒng)計(jì)方法和數(shù)據(jù)分析處理方法。 本書最后的兩個實(shí)戰(zhàn)案例適合數(shù)據(jù)分析入門者,,案例的步驟詳細(xì),、分析到位,能為讀者入手真實(shí)項(xiàng)目打下良好的基礎(chǔ),。 進(jìn)入小程序參與抽獎,,3月22日自動開獎。 本書目錄結(jié)構(gòu) 第1篇 Python數(shù)據(jù)分析語法入門 第1章 初識Python 1
第2章 Python起步必備 27
第3章 Python的數(shù)據(jù)類型與流程控制語句 41
第4章 可復(fù)用的函數(shù)與模塊 64
第5章 數(shù)據(jù)結(jié)構(gòu)與算法 82
第6章 面向?qū)ο蟮腜ython 101
第7章 異常處理與程序調(diào)試 120
第8章 pip軟件包管理 137
第2篇 Python數(shù)據(jù)分析工具入門 第9章 IPython科學(xué)計(jì)算庫 142
第10章 Numpy科學(xué)計(jì)算庫 174
第11章 pandas數(shù)據(jù)分析處理庫 216
第12章 Matplotlib數(shù)據(jù)可視化 260
第3篇 Python數(shù)據(jù)分析案例實(shí)戰(zhàn) 第13章 案例1:數(shù)據(jù)挖掘 288
第14章 案例2:玩轉(zhuǎn)大數(shù)據(jù) 305
博文視點(diǎn)您閱讀的專業(yè)智庫 喜歡請分享至朋友圈 |
|