這個(gè)非常簡(jiǎn)單,,pandas內(nèi)置了大量函數(shù)和類型,可以快速處理日常各種文件,,下面我以txt,,excel,csv,,json和mysql這5種類型文件為例,,簡(jiǎn)單介紹一下pandas是如何快速讀取這些文件的: txt文件這是最常見的一種文本文件格式,讀取的話,,直接使用read_table函數(shù)就行,,測(cè)試代碼如下,,這里必須保證txt文件是格式化的,不然讀取的結(jié)果會(huì)有誤,,filename是文件名,,header是否包含列標(biāo)題,sep是每行數(shù)據(jù)的分隔符,,最終讀取的數(shù)據(jù)類型是DataFrame,,方便后面程序進(jìn)行處理: excel文件這也是一種比較常見的文件格式,讀取的話,,直接使用read_excel函數(shù)就行,,測(cè)試代碼如下,非常簡(jiǎn)單,,直接傳入文件名就行,,最終返回結(jié)果也是DataFrame類型: csv文件這也是一種比較常見的文件格式,讀取的話,,直接使用read_csv函數(shù)就行,,測(cè)試代碼如下,也非常簡(jiǎn)單,,filename為文件名,,header為是否包含列標(biāo)題,最終返回結(jié)果也是DataFrame類型: json文件這也是一種比較常用的數(shù)據(jù)存儲(chǔ)格式,,讀取的話,,直接使用read_json函數(shù)就行,測(cè)試代碼如下,,filename為文件名,,如果出現(xiàn)中文亂碼的話,,設(shè)置encoding編碼為uft-8就行,,最終結(jié)果也是DataFrame類型: mysql這里首先需要安裝sqlalchemy框架,之后才能借助read_sql_query函數(shù)直接從mysql數(shù)據(jù)庫(kù)讀取數(shù)據(jù),,安裝的話,,直接輸入命令“pip install sqlalchemy”就行,測(cè)試代碼如下,,也非常簡(jiǎn)單,,先創(chuàng)建一個(gè)connect連接,然后根據(jù)sql查詢語(yǔ)句,,直接從數(shù)據(jù)庫(kù)中讀取數(shù)據(jù)就行: 至此,,我們就完成了利用python的pandas模塊來(lái)讀取txt,excel,,csv,,json和mysql這5種類型文件的數(shù)據(jù),。總的來(lái)說(shuō),,pandas這個(gè)模塊功能非常強(qiáng)大,,尤其對(duì)于數(shù)據(jù)處理來(lái)說(shuō),可以說(shuō)是一個(gè)利器,,在數(shù)據(jù)分析與處理中經(jīng)常會(huì)用到,,只要你熟悉一下相關(guān)文檔和示例,很快就能掌握的,,網(wǎng)上也有相關(guān)資料和教程,,介紹的非常詳細(xì),感興趣的話,,可以搜一下,,希望以上分享的內(nèi)容能對(duì)你有所幫助吧,也歡迎大家評(píng)論,、留言進(jìn)行補(bǔ)充,。 |
|
來(lái)自: 星光閃亮圖書館 > 《Python學(xué)習(xí)》