久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

【數(shù)據(jù)分析丨主題周】Python數(shù)據(jù)分析四劍客:IPython、Numpy,、pandas,、Matpl...

 CHOK2620 2018-03-21

Python作為一門優(yōu)秀的編程語言,近年來受到很多編程愛好者的青睞,。

一是因?yàn)镻ython本身具有簡捷優(yōu)美,、易學(xué)易用的特點(diǎn);二是由于互聯(lián)網(wǎng)的飛速發(fā)展,,我們正迎來大數(shù)據(jù)的時代,,而Python無論是在數(shù)據(jù)的采集與處理方面,還是在數(shù)據(jù)分析與可視化方面都有獨(dú)特的優(yōu)勢,。我們可以利用Python便捷地開展與數(shù)據(jù)相關(guān)的項(xiàng)目,,以很低的學(xué)習(xí)成本快速完成項(xiàng)目的研究。

Python被大量應(yīng)用在數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域,,其中使用極其廣泛的是IPython、Numpy,、pandas,、Matplotlib等庫。對于希望使用Python來完成數(shù)據(jù)分析工作的人來說,,學(xué)習(xí)IPython,、Numpy、pandas,、Matplotlib這個組合是目前看來不錯的方向,。

  • IPython

(圖源:ipython.org)

IPython是Python的加強(qiáng)型交互式解釋器,。

IPython是使用Python進(jìn)行數(shù)據(jù)分析、處理,、呈現(xiàn)的重要選擇之一,。它是一個與Python科學(xué)計(jì)算包(主要包括Numpy、pandas,、Matplotlib等)緊密聯(lián)系的交互式開發(fā)環(huán)境,,它同時也是Python科學(xué)計(jì)算包的一部分。

主要特點(diǎn)包括:

  • 提供給用戶一個強(qiáng)大的交互界面,。

  • Jupter Notebook的內(nèi)核,。

  • 高效的交互式處理、呈現(xiàn)數(shù)據(jù)(特別是與Matplotlib一起使用),。

  • 適合并行處理計(jì)算,。

IPython加上一個文本編輯器是科學(xué)計(jì)算者使用Python進(jìn)行數(shù)據(jù)分析、處理,、呈現(xiàn)的最佳選擇之一,。

IPython主要包括:

  • 一個強(qiáng)大的、交互式的Python殼

  • Jupyter內(nèi)核,,支持用戶在Jupyter Notebook以及其他終端與IPython的交互

IPyton殼

2017年最新發(fā)布的IPython殼以及內(nèi)核具有以下這些重要的特性:

  • 全面的對象檢查,。

  • 記錄輸入歷史。

  • 緩存輸出結(jié)果,。

  • 擴(kuò)展的<Tab>代碼補(bǔ)全功能,,可以補(bǔ)全變量、關(guān)鍵字,、文件名,、函數(shù)名等。

  • 對系統(tǒng)“魔法”方法的擴(kuò)展,,可以處理與操作系統(tǒng)相關(guān)的任務(wù),。

  • 豐富的配置系統(tǒng)支持不同狀態(tài)的切換。

  • 歷史信息登錄與重載,。

  • 支持不同語法,。

  • 輕松嵌入到其他Python程序中。

  • 對pdb調(diào)試器和Python測試工具的集成,。

  • Numpy 

(圖源:numpy.org)

Numpy是Python科學(xué)計(jì)算庫的基礎(chǔ),。

主要包括:

  • 強(qiáng)大的N維數(shù)組對象和向量運(yùn)算

  • 一些復(fù)雜的功能

  • 與C/C 和Fortran代碼的集成

  • 實(shí)用的線形代數(shù)運(yùn)算、傅立葉變換,、隨機(jī)數(shù)生產(chǎn)等

Numpy提供了一個簡潔的C語言接口,,可以非常方便地使用C語言編寫的代碼操作Numpy數(shù)組對象,反過來使用C語言生成的數(shù)組也可以輕松的轉(zhuǎn)化成Numpy數(shù)組對象,;這一特性使得Python輕松地與其他編程語言C/C 粘結(jié)在一起,。Numpy除了用作科學(xué)計(jì)算,,也可以用作多維度普通數(shù)據(jù)的容器;并且可以定義任何類型的數(shù)據(jù),,使得Numpy高效,、無縫地與各種類型的數(shù)據(jù)分析庫連接起來。

Numpy的主要對象是一個多維度的,、均勻的多維數(shù)組,。Numpy提供了各種函數(shù)方法可以非常方便靈活的操作數(shù)組,熟練掌握數(shù)組的基本概念是使用數(shù)組這種數(shù)據(jù)結(jié)構(gòu)的基本要求,。

  • pandas

(圖源:pandas.pydata.org)

pandas是建立在Numpy基礎(chǔ)上的高效數(shù)據(jù)分析處理庫,,是Python的重要數(shù)據(jù)分析庫。

pandas提供了眾多的高級函數(shù),,極大地簡化了數(shù)據(jù)處理的流程,,尤其是被廣泛地應(yīng)用于金融領(lǐng)域的數(shù)據(jù)分析。

pandas主要包括:

  • 帶有標(biāo)簽的數(shù)據(jù)結(jié)構(gòu),,主要包括序列(Series)和數(shù)據(jù)框(DataFrame)等,。

  • 允許簡單索引和多級索引。

  • 整合了對數(shù)據(jù)集的集合和轉(zhuǎn)換功能,。

  • 生成特定類型的數(shù)據(jù),。

  • 支持從Excel、CSV等文本格式中文導(dǎo)入數(shù)據(jù),,以Pytables/HDF5格式高效地讀/寫數(shù)據(jù),。

  • 能夠高效地處理帶有默認(rèn)值的數(shù)據(jù)集。

  • 能夠直接進(jìn)行常規(guī)的統(tǒng)計(jì)回歸分析,。

  • Matplotlib

(圖源:matplotlib.org)

Matplotlib是一個主要用于繪制二維圖形的Python庫,。

數(shù)據(jù)可視化是數(shù)據(jù)分析的重要環(huán)節(jié),借助圖形能夠幫助更加直觀地表達(dá)出數(shù)據(jù)背后的”東西”,。

Matplolib最初主要模仿Matlab的畫圖命令,,但是它是獨(dú)立于Matlab的,可以自由,、免費(fèi)使用的繪圖包,。Matplotlib依賴于之前介紹的Numpy庫來提供出色的繪圖能力。Matplotlib項(xiàng)目是John Hunter在2002年發(fā)起的,,目標(biāo)是建立一個具備以下特點(diǎn)的Python繪圖工具包:

  • 能夠繪制出高質(zhì)量的圖形,,并且圖形里面的鑲嵌的文本必需足夠美觀。

  • 能夠和Tex文檔一起輸出,。

  • 能夠嵌入到GUI(圖形用戶界面)應(yīng)用程序中。

  • 代碼足夠簡潔并且可擴(kuò)展性強(qiáng),。

  • 繪圖命令足夠方便,。

經(jīng)過社區(qū)多年以來的努力,,Matplotlib已經(jīng)具備了上面列出的所有特點(diǎn)。現(xiàn)在Matplotlib被廣泛地應(yīng)用于各種生產(chǎn),、科學(xué)研究等環(huán)境中,,比如在網(wǎng)絡(luò)服務(wù)中動態(tài)生成圖形、在IPython殼下交互使用Matplotlib繪圖等,。

Matplotlib從概念上可以分為三層:

matplotlib.pylab,,這一層給主要給用戶提供一些簡單的命令來生成圖形,語法風(fēng)格和Matlab非常接近,。Matplotlib的API,,這一層主要給用戶提供了直接創(chuàng)建圖形、線條,、文本等的功能,。這是一個抽象層,它并不關(guān)心圖形的輸出,。最后一層是后端,,主要是管理圖形的輸出等其他一些功能。

如果你已經(jīng)決定學(xué)習(xí)Python數(shù)據(jù)分析,,但是之前沒有編程經(jīng)驗(yàn),,那《Python數(shù)據(jù)分析從入門到精通》你絕不能錯過。Python數(shù)據(jù)分析“四劍客”在本書上會進(jìn)行詳細(xì)深入的介紹,。

本書詳細(xì)地介紹了IPython,、Numpy、pandas,、Matplotlib庫的組成與使用,,為科學(xué)計(jì)算相關(guān)人員提供了有用的參考資料。采取循序漸進(jìn)的寫作風(fēng)格,,對于工具的安裝,、使用步驟、方法技巧逐步展開,,加以圖解和應(yīng)用場景,,即使完全不懂Python和數(shù)據(jù)分析的人員,也可以流暢地讀完本書,。

無論哪種語言,,編程的方法、模式,、數(shù)據(jù)結(jié)構(gòu),、算法都是相通的。本書將科學(xué)計(jì)算,、數(shù)據(jù)結(jié)構(gòu)與各種工具和方法完美結(jié)合,,讓非Python讀者也能融會貫通,,讓學(xué)習(xí)統(tǒng)計(jì)的人能找到更適合的統(tǒng)計(jì)方法和數(shù)據(jù)分析處理方法。

本書最后的兩個實(shí)戰(zhàn)案例適合數(shù)據(jù)分析入門者,,案例的步驟詳細(xì),、分析到位,能為讀者入手真實(shí)項(xiàng)目打下良好的基礎(chǔ),。

進(jìn)入小程序參與抽獎,,3月22日自動開獎。


本書目錄結(jié)構(gòu)


第1篇  Python數(shù)據(jù)分析語法入門

第1章  初識Python  1

  • 1.1  Python是什么  2

  • 1.2  Python有什么優(yōu)點(diǎn)  3

  • 1.3  其他程序設(shè)計(jì)語言中的Python  5

  • 1.4  快速搭建Python開發(fā)環(huán)境  7

  • 1.5  第一個Python程序  22

第2章  Python起步必備  27

  • 2.1  Python代碼的組織形式和注釋方式  27

  • 2.2  Python的基本輸入/輸出函數(shù)  31

  • 2.3  Python對中文的支持  33

  • 2.4  簡單實(shí)用的Python計(jì)算器  37

第3章  Python的數(shù)據(jù)類型與流程控制語句  41

  • 3.1  Python數(shù)據(jù)類型:數(shù)字  42

  • 3.2  Python數(shù)據(jù)類型:字符串  45

  • 3.3  Python數(shù)據(jù)類型:列表和元組  52

  • 3.4  Python數(shù)據(jù)類型:字典  54

  • 3.5  Python數(shù)據(jù)類型:文件  55

  • 3.6  Python數(shù)據(jù)類型:布爾值  56

  • 3.7  Python的流程控制語句  56

第4章  可復(fù)用的函數(shù)與模塊  64

  • 4.1  Python自定義函數(shù)  65

  • 4.2  參數(shù)讓函數(shù)更有價(jià)值  67

  • 4.3  變量的作用域  71

  • 4.4  最簡單的函數(shù):使用lambda表達(dá)式定義函數(shù)  72

  • 4.5  可重用結(jié)構(gòu):Python模塊  73

  • 4.6  用包來管理多個模塊  80

第5章  數(shù)據(jù)結(jié)構(gòu)與算法  82

  • 5.1  表,、棧和隊(duì)列  82

  • 5.2  樹和圖  88

  • 5.3  查找與排序  95

第6章  面向?qū)ο蟮腜ython  101

  • 6.1  面向?qū)ο缶幊谈攀? 101

  • 6.2  在Python中定義和使用類  103

  • 6.3  類的屬性和方法  106

  • 6.4  類的繼承  111

  • 6.5  在類中重載方法和運(yùn)算符  114

  • 6.6  在模塊中定義類  117

第7章  異常處理與程序調(diào)試  120

  • 7.1  異常的處理  120

  • 7.2  用代碼引發(fā)異常  125

  • 7.3  使用pdb模塊調(diào)試Python腳本  128

  • 7.4  在PythonWin中調(diào)試腳本  134

第8章  pip軟件包管理  137

  • 8.1  安裝pip  137

  • 8.2  更新pip  138

  • 8.3  pip常用操作  138

  • 8.4  本章小結(jié)  141


第2篇  Python數(shù)據(jù)分析工具入門

第9章  IPython科學(xué)計(jì)算庫  142

  • 9.1  IPython簡介  143

  • 9.2  安裝IPython及其他相關(guān)庫  144

  • 9.3  IPython殼基礎(chǔ)  146

  • 9.4  融合Matplotlib庫和Pylab模型  156

  • 9.5  輸入和輸出變量  157

  • 9.6  交互式調(diào)試器  158

  • 9.7  計(jì)時功能  159

  • 9.8  重新載入模塊  160

  • 9.9  配置IPython  161

  • 9.10  Jupyter  162

  • 9.11  IPython和Jupyter Notebook的關(guān)系  170

第10章  Numpy科學(xué)計(jì)算庫  174

  • 10.1  Numpy基礎(chǔ)  174

  • 10.2  數(shù)組的基本操作  184

  • 10.3  基本的分片和索引操作  186

  • 10.4  高級索引  189

  • 10.5  改變數(shù)組的形狀  193

  • 10.6  組裝,、分割數(shù)組  195

  • 10.7  數(shù)組的基本函數(shù)  196

  • 10.8  復(fù)制和指代  198

  • 10.9  線性代數(shù)  199

  • 10.10  使用數(shù)組來處理數(shù)據(jù)  201

  • 10.11  Numpy的where()函數(shù)和統(tǒng)計(jì)函數(shù)  203

  • 10.12  輸入與輸出  206

  • 10.13  生成隨機(jī)數(shù)  208

  • 10.14  數(shù)組的排序和查找  210

  • 10.15  擴(kuò)充轉(zhuǎn)換  213

第11章  pandas數(shù)據(jù)分析處理庫  216

  • 11.1  pandas數(shù)據(jù)結(jié)構(gòu)介紹  217

  • 11.2  索引對象  226

  • 11.3  核心的基本函數(shù)  227

  • 11.4  索引和旋轉(zhuǎn)  229

  • 11.5  算術(shù)運(yùn)算與對齊  232

  • 11.6  處理默認(rèn)值  233

  • 11.7  多級索引  237

  • 11.8  讀/寫數(shù)據(jù)  239

  • 11.9  組合數(shù)據(jù)  243

  • 11.10  數(shù)據(jù)分組操作  247

  • 11.11  時間序列  249

第12章  Matplotlib數(shù)據(jù)可視化  260

  • 12.1  Pyplot模塊介紹  261

  • 12.2  應(yīng)用Pyplot模塊  269

  • 12.3  Artist模塊  275

  • 12.4  使用pandas繪圖  283


第3篇  Python數(shù)據(jù)分析案例實(shí)戰(zhàn)

第13章  案例1:數(shù)據(jù)挖掘  288

  • 13.1  貝葉斯理論介紹  288

  • 13.2  貝葉斯分類器的實(shí)現(xiàn)  290

  • 13.3  協(xié)同過濾推薦系統(tǒng)  295

第14章  案例2:玩轉(zhuǎn)大數(shù)據(jù)  305

  • 14.1  案例概述  306

  • 14.2  日志文件的分割  309

  • 14.3  編寫Map()函數(shù)處理小文件  311

  • 14.4  編寫Reduce()函數(shù)  313



 

博文視點(diǎn)

您閱讀的專業(yè)智庫

喜歡請分享至朋友圈

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn),。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多