目錄 real talk數(shù)據(jù)分析現(xiàn)在各行各業(yè)基本都要加一點(diǎn),,畢竟現(xiàn)在人人都說大數(shù)據(jù)hh,,學(xué)生的話你可能不是統(tǒng)計(jì)或者計(jì)算機(jī)專業(yè),員工的話你可能只是銷售或者做報(bào)表,。很多人為了過考試,、畢業(yè)、完成工作不得已從零學(xué)習(xí),,可能專業(yè)不相關(guān)或者沒接觸過,,但數(shù)據(jù)分析沒有你想象那么難的。 Python應(yīng)該是熱度高一些的語言吧,,開源的而且越來越受歡迎,。有人說它是“膠水語言”,就是萬能好用唄,。它既可以為C++,,Java開發(fā)語言的落地先做準(zhǔn)備(之前實(shí)習(xí)的工作有先拿Python做然后轉(zhuǎn)為C++),也可以與R,,MATLAB等數(shù)學(xué)統(tǒng)計(jì)軟件有相同分析邏輯進(jìn)行轉(zhuǎn)化,。 我只是一個(gè)統(tǒng)計(jì)專業(yè)的研究生,面臨畢業(yè),,從入門到獨(dú)立完成報(bào)告,,有一套自己的套路和思考方式,也是僅僅兩年時(shí)間。我算一個(gè)不太白的小白吧,,想用最容易理解的方式和語言與你一起學(xué)習(xí),。之前用的一直是R語言,,Python自學(xué)過一點(diǎn)基礎(chǔ),,但以后走向工作的話Python應(yīng)該用的多些,而且多會門語言多條路嘛,。 我跟的是封面的《Python數(shù)據(jù)分析》清華大學(xué)出版社這本書,,這里沒有打廣告哦。當(dāng)然之前我也看過其他Python的一些書籍,,當(dāng)然你也可以選擇一本你喜歡的理論書跟,,無所謂的,主要是跟下去,,現(xiàn)在這個(gè)信息開放的年代,,你想要搜尋知識總有方法的,而且大差不差,。一起學(xué)習(xí),,從書本到代碼,從理論到實(shí)踐,。我行,,你也行! 一,、Python軟件Python的軟件用的較多的應(yīng)該就是pycharm和anaconda,,具體來說是anaconda里的jupyter。其實(shí)他們都是Python語言,,代碼是相同的,,不是兩種語言還需要翻譯,你可以理解為兩家子公司在為總部做相同的工作,,但子公司的環(huán)境和風(fēng)格不同,。 具體的安裝教程網(wǎng)上已經(jīng)有很多,此處不再贅述,。重點(diǎn)是快速理解代碼和做數(shù)據(jù)分析,。 二、pycharm1.界面pycharm主要是三個(gè)區(qū),,左上角是文件區(qū),,你可以先建一個(gè)文件夾然后在pycharm“文件”中打開,然后在這個(gè)文件夾里建代碼文件,,pycharm中代碼文件后綴是.py 打開py文件后便出現(xiàn)右上角的的代碼區(qū),,你可以在這里寫入代碼,切換不同py文件,當(dāng)你關(guān)閉py文件時(shí)會自動保存的,。 下面的區(qū)是結(jié)果區(qū),,即運(yùn)行代碼后的結(jié)果在這里展示(當(dāng)你沒有運(yùn)行代碼時(shí)不會出現(xiàn)這個(gè)區(qū),只有上面兩個(gè)區(qū)),,一般出現(xiàn)“退出代碼0”是我們樂意看到的,,這說明代碼沒有報(bào)錯。如果報(bào)錯時(shí)會出現(xiàn)紅色或者出現(xiàn)“1”,。但報(bào)錯是常事,,不要害怕,有報(bào)錯改就好了,,尤其是改寫別人代碼或者寫復(fù)雜的函數(shù)時(shí),,會經(jīng)常報(bào)錯,我們要逮住詭計(jì)多端的“0”,,誰不希望代碼順利運(yùn)行呢hh,。 2.創(chuàng)建文件按照下面順序可以創(chuàng)建py文件: 文件夾下面點(diǎn)擊右鍵,新建,,Python文件,,然后命名。 3.運(yùn)行文件有兩種運(yùn)行方式,,一是右鍵點(diǎn)擊py文件,,然后點(diǎn)擊“運(yùn)行......”。而是右上角紅框里的綠色運(yùn)行鍵,,下三角可以選擇運(yùn)行的文件,,但這種方式只能運(yùn)行已經(jīng)運(yùn)行的文件。有點(diǎn)繞,,你多打開兩個(gè)py文件然后不運(yùn)行,,看這個(gè)下三角的文件,然后運(yùn)行這幾個(gè)py文件再看下三角的文件就明白了,。
4.下載庫Python中各種庫,,各種函數(shù)已經(jīng)很成熟了。我們可以調(diào)用不同庫的函數(shù)進(jìn)行操作,,這是最方便的,,我們不可能從0寫一個(gè)算法或者函數(shù),這樣太費(fèi)時(shí)間了,,人家已經(jīng)寫好的函數(shù)直接調(diào)用不香嗎,。但庫是要下載才能調(diào)用的,有兩種下載庫的方式: 一是文件,,設(shè)置,,Python解釋器,,然后+號是下載庫,-是卸載庫,。 二是下方欄里有個(gè)“終端”,,點(diǎn)進(jìn)去下載,這個(gè)方式和anaconda下載庫的方式很相似,。 三,、jupyter1.界面,創(chuàng)建文件打開jupyter是網(wǎng)頁形式,,里面是各種文件夾和文件,,jupyter對應(yīng)的文件后綴是.ipynb,,你如果想創(chuàng)建一個(gè)新的文件,,點(diǎn)擊“new”,然后點(diǎn)擊“Python3”,。 2.打開文件,,運(yùn)行文件如果已有ipynb文件直接找到然后雙擊打開。文件打開后是這樣: 最上面的紅色框是文件名,,這里未命名所以是untitled,,點(diǎn)擊便可以修改名字。 下面的小框分別是“保存”,,“添加模塊”,,“刪去模塊”,“運(yùn)行”,,“終止運(yùn)行”,。 jupyter比較方便的就是可以添加多個(gè)模塊,然后分開運(yùn)行輸出結(jié)果,,pycharm中點(diǎn)運(yùn)行必須運(yùn)行整個(gè)py文件然后輸出結(jié)果,。 3.下載庫jupyter中調(diào)用函數(shù)也需要下載庫,但不在jupyter中下載,,而是在prompt命令行里下載,,一般是pip install +“名字” 進(jìn)行下載。 再說兩句主要說了一些pycharm和jupyter的不同,,和操作界面等基本操作,。就是因?yàn)閖upyter能夠分塊運(yùn)行,所以在學(xué)術(shù)中用的較多,,統(tǒng)計(jì)分析,,建模等,比較好查找哪塊報(bào)錯然后改錯,。py文件必須整個(gè)文件運(yùn)行下來才能出結(jié)果,,有些計(jì)算機(jī)大佬也能調(diào)試py文件分塊運(yùn)行,然后查bug。這里提供一個(gè)小技巧,,就是在py中可以選定行然后crtl鍵加"/",,使這些行變成注釋,變相的分塊運(yùn)行,。注釋恢復(fù)成代碼的話依然是這個(gè)操作,,即可變回來。 |
|