Pandas 描述Pandas 是 Python 語言的一個(gè)擴(kuò)展程序庫(kù),,用于數(shù)據(jù)分析。 Pandas 是一個(gè)開放源碼,、BSD 許可的庫(kù),,提供高性能、易于使用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具,。 Pandas 名字衍生自術(shù)語 'panel data'(面板數(shù)據(jù))和 'Python data analysis'(Python 數(shù)據(jù)分析),。 Pandas 一個(gè)強(qiáng)大的分析結(jié)構(gòu)化數(shù)據(jù)的工具集,基礎(chǔ)是 Numpy(提供高性能的矩陣運(yùn)算),。 Pandas 可以從各種文件格式比如 CSV,、JSON、SQL,、Microsoft Excel 導(dǎo)入數(shù)據(jù),。 Pandas 可以對(duì)各種數(shù)據(jù)進(jìn)行運(yùn)算操作,比如歸并,、再成形,、選擇,還有數(shù)據(jù)清洗和數(shù)據(jù)加工特征,。 Pandas 廣泛應(yīng)用在學(xué)術(shù),、金融、統(tǒng)計(jì)學(xué)等各個(gè)數(shù)據(jù)分析領(lǐng)域,。 Pandas 應(yīng)用Pandas 的主要數(shù)據(jù)結(jié)構(gòu)是 Series (一維數(shù)據(jù))與 DataFrame(二維數(shù)據(jù)),,這兩種數(shù)據(jù)結(jié)構(gòu)足以處理金融、統(tǒng)計(jì),、社會(huì)科學(xué),、工程等領(lǐng)域里的大多數(shù)典型用例。 數(shù)據(jù)結(jié)構(gòu)Series 是一種類似于一維數(shù)組的對(duì)象,,它由一組數(shù)據(jù)(各種Numpy數(shù)據(jù)類型)以及一組與之相關(guān)的數(shù)據(jù)標(biāo)簽(即索引)組成,。 DataFrame 是一個(gè)表格型的數(shù)據(jù)結(jié)構(gòu),它含有一組有序的列,,每列可以是不同的值類型(數(shù)值,、字符串,、布爾型值)。DataFrame 既有行索引也有列索引,,它可以被看做由 Series 組成的字典(共同用一個(gè)索引),。 |
|