大家好哈,最近博主在學(xué)習(xí)Python,,學(xué)習(xí)期間也遇到一些問題,,獲得了一些經(jīng)驗(yàn),在此將自己的學(xué)習(xí)系統(tǒng)地整理下來,,如果大家有興趣學(xué)習(xí)爬蟲的話,,可以將這些文章作為參考,也歡迎大家一共分享學(xué)習(xí)經(jīng)驗(yàn),。 Python版本:2.7,,Python 3請(qǐng)另尋其他博文。 首先爬蟲是什么,?
根據(jù)我的經(jīng)驗(yàn),,要學(xué)習(xí)Python爬蟲,我們要學(xué)習(xí)的共有以下幾點(diǎn):
1.Python基礎(chǔ)學(xué)習(xí)首先,,我們要用Python寫爬蟲,,肯定要了解Python的基礎(chǔ)吧,萬丈高樓平地起,不能忘啦那地基,,哈哈,,那么我就分享一下自己曾經(jīng)看過的一些Python教程,小伙伴們可以作為參考,。 1) 慕課網(wǎng)Python教程曾經(jīng)有一些基礎(chǔ)的語法是在慕課網(wǎng)上看的,,上面附有一些練習(xí),學(xué)習(xí)完之后可以作為練習(xí),,感覺效果還是蠻不錯(cuò)的,,不過稍微遺憾的是內(nèi)容基本上都是最基礎(chǔ)的,入門開始的話,,就這個(gè)吧 學(xué)習(xí)網(wǎng)址:慕課網(wǎng)Python教程 2) 廖雪峰Python教程后來,,我發(fā)現(xiàn)了廖老師的Python教程,講的那是非常通俗易懂哪,,感覺也是非常不錯(cuò),,大家如果想進(jìn)一步了解Python就看一下這個(gè)吧。 學(xué)習(xí)網(wǎng)址:廖雪峰Python教程 3) 簡(jiǎn)明Python教程還有一個(gè)我看過的,,簡(jiǎn)明Python教程,,感覺講的也不錯(cuò) 學(xué)習(xí)網(wǎng)址:簡(jiǎn)明Python教程 2.Python urllib和urllib2 庫的用法urllib和urllib2庫是學(xué)習(xí)Python爬蟲最基本的庫,利用這個(gè)庫我們可以得到網(wǎng)頁的內(nèi)容,,并對(duì)內(nèi)容用正則表達(dá)式提取分析,得到我們想要的結(jié)果,。這個(gè)在學(xué)習(xí)過程中我會(huì)和大家分享的,。 3.Python 正則表達(dá)式Python正則表達(dá)式是一種用來匹配字符串的強(qiáng)有力的武器。它的設(shè)計(jì)思想是用一種描述性的語言來給字符串定義一個(gè)規(guī)則,,凡是符合規(guī)則的字符串,,我們就認(rèn)為它“匹配”了,否則,,該字符串就是不合法的,。這個(gè)在后面的博文會(huì)分享的。 4.爬蟲框架Scrapy如果你是一個(gè)Python高手,,基本的爬蟲知識(shí)都已經(jīng)掌握了,,那么就尋覓一下Python框架吧,我選擇的框架是Scrapy框架,。這個(gè)框架有什么強(qiáng)大的功能呢,?下面是它的官方介紹:
|
|