堅(jiān)持把簡單的事情做好就是不簡單,。 今天我們給大家?guī)怼犊焖偃腴Tpandas》,。還有很多有價(jià)值的內(nèi)容可以關(guān)注我們的網(wǎng)站: 數(shù)據(jù)極客|數(shù)據(jù)科學(xué)交流社區(qū) 干貨滿滿,就等您的加入,! 學(xué)習(xí)一個(gè)開源工具包,最快的方式是閱讀官方文檔,,提煉文檔精華,,并靈活應(yīng)用到自己的項(xiàng)目中。本文是pandas系列的第一篇blog,,總結(jié)翻譯來自:《10 minutes to pandas》,。希望幫助更多的朋友,,進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域,熟悉常用的工具包,。 pandas介紹:pandas是python的一個(gè)數(shù)據(jù)分析包,,提供了大量能幫助我們快速處理數(shù)據(jù)的函數(shù)和方法,是數(shù)據(jù)科學(xué)家必備的工具包。做數(shù)據(jù)分析,、數(shù)據(jù)挖掘,、機(jī)器學(xué)習(xí)前期的數(shù)據(jù)預(yù)處理工作非常方便。 安裝pandas包:pipinstall pandas 啟動(dòng)ipython&導(dǎo)入pandas包ipython 常用的數(shù)據(jù)結(jié)構(gòu)Series和DataFrameSeries是一個(gè)一維的數(shù)組結(jié)構(gòu),,包含一個(gè)數(shù)組的數(shù)據(jù)和一個(gè)與數(shù)組關(guān)聯(lián)的數(shù)據(jù)標(biāo)簽,。 DataFrame是一個(gè)二維的數(shù)據(jù)結(jié)構(gòu),類似電子表格,,它有行和列的索引,。 對(duì)象創(chuàng)建傳遞一個(gè)數(shù)組給Series,索引使用默認(rèn)的(0開始)
傳遞一個(gè)np.random生成的隨機(jī)數(shù),,行索引是日期,,列索引是list(‘ABCD’) 傳遞一個(gè)dic給DataFrame,列索引是dic中的key,每一行元素是dic中的value.列和列之間允許不同的數(shù)值類型,。 查看數(shù)據(jù)查看前面幾行/最后幾行的數(shù)據(jù)元素 查看索引,、列、表格中的數(shù)據(jù) 查看統(tǒng)計(jì)數(shù)據(jù),,比如平均數(shù)/方差等 反轉(zhuǎn)表格,,行/列的轉(zhuǎn)換 根據(jù)軸排序,axis指定軸,,ascending指定是升序還是降序 根據(jù)值排序,,by指定哪一列 獲取數(shù)據(jù)獲取列數(shù)據(jù) 通過slice操作,獲取行數(shù)據(jù) 通過,,坐標(biāo)位置來獲取數(shù)據(jù) 讀數(shù)據(jù)/寫數(shù)據(jù)到csv和excel寫數(shù)據(jù)到csv文件 讀取數(shù)據(jù)從csv文件(每一行的數(shù)值,,是以逗號(hào)分隔) 寫數(shù)據(jù)到excel文件 讀數(shù)據(jù)從excel文件 數(shù)據(jù)展示繪制曲線圖 各列數(shù)據(jù),曲線圖對(duì)比 |
|