作者:Pranav Dar 翻譯:季洋 校對(duì):張玲 本文約6000字,,建議閱讀10分鐘。 本文為你介紹了27本有關(guān)數(shù)據(jù)科學(xué)方面的精彩書籍,。 引言每個(gè)人都有自己的學(xué)習(xí)方法,,而助我闖入數(shù)據(jù)科學(xué)領(lǐng)域的則是書籍。書籍將知識(shí)世界壓縮成幾百頁,,沒有什么能像它一樣打開你的思維,,我從未在其他任何學(xué)習(xí)方法中發(fā)現(xiàn)這種魔力和魅力。 “如果你只是閱讀人人都在閱讀的書,,你可能只能想到人人都在想的東西,。” —— 村上春樹 靠自己來學(xué)習(xí)數(shù)據(jù)科學(xué)可能是一項(xiàng)非常艱巨的任務(wù)!現(xiàn)在有許多方法來學(xué)習(xí) – 網(wǎng)絡(luò)公開課,、研討會(huì),、學(xué)位、文憑和文章,,諸如此類,。但是,,系統(tǒng)化安排它們,致力于形成一條結(jié)構(gòu)化的學(xué)習(xí)路線,,以成為一名數(shù)據(jù)科學(xué)家,,是至關(guān)重要的。 一條結(jié)構(gòu)化的學(xué)習(xí)路線:https://trainings./courses/coursev1:AnalyticsVidhya+LPDS2019+LPDS2019_T1/info?utm_source=booksarticle&utm_medium=blog 成為一名數(shù)據(jù)科學(xué)家,,是:https://trainings./courses/coursev1:AnalyticsVidhya+LPDS2019+LPDS2019_T1/info?utm_source=booksarticle&utm_medium=blog 關(guān)于數(shù)據(jù)科學(xué)的書,,已經(jīng)有了成百上千本,你該如何選擇開始之處呢,?怎么選擇適合學(xué)習(xí)某種技術(shù)或領(lǐng)域的書呢,?盡管對(duì)于這個(gè)問題沒有一刀切的答案,我已經(jīng)竭盡所能,,精減書單,,得到一份只有27本的簡(jiǎn)短書單。 將這些書分成不同的領(lǐng)域,,以易于你理解,。
福利: 在這篇文章底部,你將會(huì)發(fā)現(xiàn)一個(gè)極好的說明圖表,,涵蓋上述提及的每一本書,。你可以將它作為一個(gè)“待讀”書單,當(dāng)你讀完一本書時(shí),,可從單子上將它們一一劃去,!你也可以下載這個(gè)圖表的一個(gè)高分辨率版本,打印出來非常完美,,因?yàn)樗荘DF格式,。 好了,讓我們現(xiàn)在就進(jìn)入正題,。 這個(gè)圖表的一個(gè)高分辨率版本:https://discuss./t/download-hd-infographic-27-essential-data-science-books/75604 統(tǒng)計(jì)學(xué)書籍《白話統(tǒng)計(jì)學(xué)》 https://www./Statistics-Plain-English-Third-1/dp/041587291X 作者:蒂莫西·C·烏爾單(Timothy C. Urdan) 正是這本美好的書,,開始了我在統(tǒng)計(jì)學(xué)世界的旅程。它完全是為初學(xué)者寫的,,總能吸引你回來以查找更多的內(nèi)容,,而且寫作風(fēng)格和解釋內(nèi)容恰到好處地呼應(yīng)書名-白話統(tǒng)計(jì)學(xué)。你可以推薦這本書給任何一位非技術(shù)人員,,他們應(yīng)該能夠掌握這些原理,,因?yàn)樗褪沁@么出色! 《思考統(tǒng)計(jì): 程序員的概率學(xué)和統(tǒng)計(jì)學(xué)》 http:///thinkstats/thinkstats.pdf 作者:艾倫·B·唐尼(Allen B. Downey) 在大多數(shù)的數(shù)據(jù)科學(xué)書單中,,你都可以發(fā)現(xiàn)這本書位列第一。這本書有大量的資源,,點(diǎn)擊上面鏈接,,進(jìn)入這本書的主頁,你將看到數(shù)據(jù)文件,、代碼,、解決方案等資料。對(duì)于已經(jīng)了解Python基礎(chǔ)知識(shí)的人來說,,它是特別有用的,,因?yàn)樵谶@本書中,用來演示實(shí)例的正是python語言,。 《統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論》 作者:加雷思·詹姆斯(Gareth James), 達(dá)尼埃拉·威滕(Daniela Witten), 特雷弗·哈西蒂(Trevor Hastie)和 羅布·蒂布里亞尼(Robert Tibshirani) 這是一本經(jīng)典之作,,大多數(shù)我看過的機(jī)器學(xué)習(xí)課程都推薦或引用了這本書,,當(dāng)然是因?yàn)樗鼘懙暮玫木壒省Kw了基礎(chǔ)的統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)技術(shù),,最棒的是,,每個(gè)觀點(diǎn)都會(huì)用R語言的案例分析來說明。一旦你學(xué)會(huì)編程,,就來回反復(fù)驗(yàn)證每個(gè)觀點(diǎn),,還有什么方法比多次練習(xí)能更好地鞏固一個(gè)觀點(diǎn)呢? 概率學(xué)書籍《概率學(xué):給熱情的初學(xué)者》 https://www./Probability-Enthusiastic-Beginner-David-Morin/dp/1523318678 作者:大衛(wèi)·莫林(David Morin) 這是一本針對(duì)初學(xué)者的完美書籍。這本書是為學(xué)院學(xué)生們而寫的,,所以,,所有傾向于從零開始學(xué)習(xí)概率學(xué)的同學(xué)們都很會(huì)很欣賞這本書的寫作方式。它涵蓋了所有的基礎(chǔ)內(nèi)容-組合數(shù)學(xué),、概率學(xué)規(guī)則,、貝葉斯定理、期望值,、偏差,、概率密度、常見概率分布,、大數(shù)定律,、中心極限定理、相關(guān)性和回歸分析,。 概率學(xué)導(dǎo)論《概率學(xué)導(dǎo)論》 https://www.math./~prob/prob/prob.pdf 作者:J·勞里·斯內(nèi)爾(J. Laurie Snell)和 查爾斯·米勒·格里斯(Charles Miller Grinstead) 這是另一本入門級(jí)的書籍,涵蓋了基礎(chǔ)的概率學(xué)概念,。像上本書一樣,,這本書是針對(duì)大學(xué)畢業(yè)生而寫的,因而進(jìn)行了詳盡的文字描述,。你可能會(huì)奇怪為什么我一直重復(fù)這一點(diǎn),,這是因?yàn)槲蚁霃?qiáng)調(diào):總有一個(gè)地方是可以讓我們從零開始學(xué)習(xí)的,它是一本為那些從未探索進(jìn)入這個(gè)領(lǐng)域的學(xué)生而寫的書,。 《概率論及其應(yīng)用概論》 作者:威廉·費(fèi)勒(William Feller) 正如這本書的描述所說的,,它完全是一本關(guān)于概率論及其應(yīng)用的入門指導(dǎo)書,。如果你真的想深深地扎入概率學(xué)的世界,我推薦你讀這本書,,因?yàn)樗且槐痉浅T敿?xì)的教科書,,但可能不符合一個(gè)初學(xué)者的口味。如果你學(xué)習(xí)概率學(xué)只是為了進(jìn)入數(shù)據(jù)科學(xué),,你可以避開這本,,只閱讀上面提到的兩本概率學(xué)書籍中的任意一本就好了。 機(jī)器學(xué)習(xí)書籍《機(jī)器學(xué)習(xí)百頁書》 http://www./ 作者:安德里·布爾科夫(Andriy Burkov) 閱讀了大量試圖從不同的角度和觀點(diǎn)來教授機(jī)器學(xué)習(xí)的書籍,我努力想要找尋能夠一本能夠簡(jiǎn)明地歸納費(fèi)解的原理和方程式的書,。直到安德里·布爾科夫用100多頁設(shè)法做到了這點(diǎn),,我喜歡上了這本書。它寫得很出色,,易于理解,,而且還有彼德·諾維格(Peter Norvig)等思想領(lǐng)袖為其背書。還需要我說更多嗎,?初學(xué)者也許已經(jīng)成名,,因此,每個(gè)數(shù)據(jù)科學(xué)家都應(yīng)該擁有這本書,。 機(jī)器學(xué)習(xí)《機(jī)器學(xué)習(xí)》 https://www./Machine-Learning-Tom-M-Mitchell/dp/1259096955 作者:湯姆·米切爾(Tom Mitchell) 在所有機(jī)器學(xué)習(xí)書大肆宣傳之前,,湯姆·米切爾關(guān)于機(jī)器學(xué)習(xí)的書是理解各種技術(shù)和算法背后數(shù)學(xué)原理的首要選擇。我會(huì)建議在拿起這本書之前先復(fù)習(xí)一下數(shù)學(xué),,但你并不需要有任何人工智能和統(tǒng)計(jì)學(xué)的背景來理解這些概念,。它是我機(jī)器學(xué)習(xí)的第一本書,! 它售價(jià)不高,因此它絕對(duì)值得加入你們的收藏,。 統(tǒng)計(jì)學(xué)學(xué)習(xí)要素《統(tǒng)計(jì)學(xué)學(xué)習(xí)要素》 https://web./~hastie/Papers/ESLII.pdf 作者:特雷弗·哈西蒂(Trevor Hastie),,羅布·蒂布里亞尼(Robert Tibshirani)和 耶羅梅·弗里德曼(Jerome Friedman) 現(xiàn)在我們回到哈西蒂和蒂布里亞尼的另一本經(jīng)典!它是我們之前提到的《統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論》自然續(xù)篇,。盡管和那本書有一些重復(fù),,但這本書更進(jìn)一步地分析了我們所說的機(jī)器學(xué)習(xí)算法。除了一般的機(jī)器學(xué)習(xí)技術(shù),,它還涵蓋其他機(jī)器學(xué)習(xí)技術(shù),,諸如神經(jīng)網(wǎng)絡(luò)、矩陣分解法,、譜聚類法這些內(nèi)容,。 深度學(xué)習(xí)書籍《深度學(xué)習(xí)》 https://www./ 作者:伊恩·古德費(fèi)羅(Ian Goodfellow),,義華·本焦(Yoshua Bengio)和阿倫·考維爾(Aaron Courville) 這本書的作者們都是巨星級(jí)的!《深度學(xué)習(xí)》這本書被廣泛地認(rèn)為是初學(xué)者最好的學(xué)習(xí)資源,。它分為三個(gè)章節(jié):應(yīng)用數(shù)學(xué)和機(jī)器學(xué)習(xí)基礎(chǔ),、現(xiàn)代深度學(xué)習(xí)實(shí)踐框架和深度學(xué)習(xí)研究。迄今為止,,它是深度學(xué)習(xí)社區(qū)引用最多的一本書,。床邊放一本,膜拜它并經(jīng)常查閱它 –無論什么時(shí)候你開始深度學(xué)習(xí)旅程,,這種情形將一直伴隨著你,。 《和Python一起深度學(xué)習(xí)》 https://www.amazon.com/Deep-Learning-Python-Francois-Chollet/dp/1617294438 作者:弗朗索瓦·喬萊(Francois Chollet) 通過編程和理論并行學(xué)習(xí)深度學(xué)習(xí)(或機(jī)器學(xué)習(xí)),,真的很酷,這也是弗朗索瓦·喬萊在《和Python一起深度學(xué)習(xí)》書中所遵循的方法,。常用的Keras庫可以幫助你學(xué)習(xí)深度學(xué)習(xí)概念,,而弗朗索瓦是Keras的創(chuàng)建者,所以,,還會(huì)有誰比他更適合來教這個(gè)領(lǐng)域的知識(shí)呢,?我也建議在推特上關(guān)注一下弗朗索瓦 – 那里有很多我們學(xué)習(xí)的東西。 《神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)》 http:/// 作者:邁克爾·尼爾森(Michael Nielsen) 這是一本免費(fèi)的在線書籍,以幫助學(xué)習(xí)為深度學(xué)習(xí)賦能的核心組件 – 神經(jīng)網(wǎng)絡(luò),。我很喜歡這本書的寫作方式,,它采用一種實(shí)踐的方式來教授基本概念,,還從初學(xué)者的視角來看待深度學(xué)習(xí)的研究課題。在這本書里,,你學(xué)不到任何一種編程語言,,因?yàn)樗且槐窘忉屔窠?jīng)網(wǎng)絡(luò)背后基礎(chǔ)概念的教科書,偏老式風(fēng)格但很好,。 自然語言處理(NLP)書籍《用Python自然語言處理》 https://www./book/ 作者:斯蒂文·伯德(Steven Bird),,伊旺·克萊恩(Ewan Klein)和 愛德華·洛珀(Edward Loper) 這是另外一本堅(jiān)持邊做邊學(xué)原則的書,,你將學(xué)到一些在其他地方學(xué)不到的python概念知識(shí),這樣才能利用NLTK(Natural Language Toolkit自然語言工具)庫在NLP(Natural Language Processing自然語言處理)的世界里暢游,。盡管這本書不是你學(xué)習(xí)NLP唯一參考的資源(NLP太復(fù)雜了,,不是一下能說清楚的),但它還是在這一課題上提供一個(gè)相當(dāng)不錯(cuò)的介紹,。 《統(tǒng)計(jì)學(xué)自然語言處理基礎(chǔ)》 https://www.cs./~cs366/docs/Manning_Schuetze_StatisticalNLP.pdf 作者:克里斯多夫·曼寧(Christopher Manning)和 欣里奇·舒埃策(Hinrich Schutze) 這本書已經(jīng)出版了20年,,依然能夠作為一本優(yōu)秀的自然語言處理入門書,。它對(duì)NLP下廣泛的子課題對(duì)非常詳盡的指引,如文本分類,、詞性標(biāo)注,、概率句法分析和其它內(nèi)容。作者在數(shù)學(xué)和語言的基礎(chǔ)上對(duì)這些課題做了非常嚴(yán)謹(jǐn)而且十分詳細(xì)的分析,,我們要謹(jǐn)記這一點(diǎn),。 《語音和語言處理》 https://web./~jurafsky/slp3/ed3book.pdf 作者:丹尼爾·尤拉夫斯基(Daniel Jurafsky)和 詹姆斯·H·馬?。↗ames H. Martin) 這本書著重介紹的是,自然語言和語音的實(shí)際應(yīng)用和科學(xué)評(píng)估,。我將這本書列入書單是為了開闊我們?cè)谖谋咎幚硪酝獾难劢?– 也來看一看語音識(shí)別,。為什么不呢?每天都有不計(jì)其數(shù)的語音識(shí)別應(yīng)用出現(xiàn),,可見,,它是一個(gè)日益繁榮的研究領(lǐng)域。尤拉夫斯基和馬丁合著的這本書是自然語言處理領(lǐng)域和計(jì)算機(jī)語言學(xué)非常有深度的一本書,。同樣,,這也是一本大師們自己寫的書。 計(jì)算機(jī)視覺書籍《計(jì)算機(jī)視覺:算法和應(yīng)用》 http:///Book/ 作者:理查德·謝利斯基(Richard Szeliski) 這本書中探討了很多常見的計(jì)算機(jī)視覺技術(shù),尤其是那些用來分析和解析圖像的技術(shù),。雖然這本書大在約九年前出版,,但理查德·謝利斯基舉例說明所用的例子和方法學(xué)在當(dāng)今還是很實(shí)用的。它是一本教科書,,詳細(xì)介紹了如何采用科學(xué)方法來解決計(jì)算機(jī)視覺領(lǐng)域中的基本挑戰(zhàn),。點(diǎn)擊上面書名,就可以免費(fèi)獲得這本書的PDF版本,。 《用Python編程計(jì)算機(jī)視覺》 http:/// 作者:揚(yáng)·埃里克·索勒姆(Jan Erik Solem) 在你探究這本令人驚嘆的書之前,,點(diǎn)擊書名,,進(jìn)入網(wǎng)站,下載數(shù)據(jù)包,、代碼以及從Github目錄上復(fù)制下來的資源庫,。這本書是一本真正具有實(shí)踐指導(dǎo)意義的計(jì)算機(jī)視覺導(dǎo)論書,而這些豐富的學(xué)習(xí)資源則有助于你有效地閱讀它,,正如作者所說的,,“當(dāng)你練習(xí)這些用Python編寫的例子時(shí),你將學(xué)會(huì)一些技術(shù)如物體識(shí)別,、3D重建,、立體成像、增強(qiáng)現(xiàn)實(shí)和其它的計(jì)算機(jī)視覺應(yīng)用,?!?/p> 《計(jì)算機(jī)視覺:建模,學(xué)習(xí),,和推理》 http://www./ 作者:西蒙·J·D·普林斯博士(Dr. Simon J.D. Prince) 這本書從最基本的概率學(xué)基本概念開始介紹,,然后非??斓匾源饲腥胝}。盡管書里介紹的有些框架出現(xiàn)更新版本,,但這本書在當(dāng)今的大環(huán)境中還是有價(jià)值的,。它介紹了70多個(gè)算法,而且完美地補(bǔ)充了350多個(gè)示例說明,。如果你喜歡幻燈片的學(xué)習(xí)方式,,那么請(qǐng)點(diǎn)擊書名鏈接,進(jìn)入網(wǎng)站下載。 人工智能書籍《人工智能:一種現(xiàn)代的方法》 http://aima.cs./ 作者:斯圖爾特·羅素(Stuart Russell)和 彼德·諾維格(Peter Norvig) 這是一本斯圖爾特·羅素和彼德·諾維格寫的書,是人工智能界首屈一指的好書,,100多個(gè)國(guó)家,、超過1300個(gè)高等學(xué)府在他們的課程中參考或引用了這本書。提到作者是誰,,就不會(huì)驚訝于書的厚度 – 1100頁,,涵蓋了人工智能的方方面面 – 語音識(shí)別、自動(dòng)駕駛,、機(jī)器翻譯和計(jì)算機(jī)視覺等其他內(nèi)容,,這本書可以認(rèn)為是人工智能界的圣經(jīng)。 《人工智能》 https://www./Artificial-Intelligence-Humans-Fundamental-Algorithms-ebook/dp/B00HAT0APE 作者:杰夫·西頓(Jeff Heaton) 人工智能的基本算法是什么?這本書打包了大量的技術(shù)知識(shí),,僅編成區(qū)區(qū)222頁,。這還只是人工智能技術(shù)系列書籍的第一卷(維度、距離度量,、聚類,、誤差計(jì)算、爬山算法,、內(nèi)爾德·米德算法以及線性回歸),。此外,還有一個(gè)伴生網(wǎng)站包含了這本書引用的范例和一個(gè)包含其代碼的GitHub資源庫,。 伴生網(wǎng)站:https://www./aifh/vol1/GitHub資源庫:https://github.com/jeffheaton/aifh 《終極算法》 作者:佩德羅·多明戈斯(Pedro Domingos) 如果你想找一本人工智能方面的技術(shù)書,,這本不是,。但它是什么呢?它用極具說服性的文字闡述了機(jī)器學(xué)習(xí)是如何改變商業(yè),、政治,、科學(xué)和戰(zhàn)爭(zhēng)的書,是一本討論人工智能現(xiàn)在在哪里以及未來可能帶領(lǐng)人類去哪里的書,,論證深入而且發(fā)人深省,。我們將有可能找到有能力通過數(shù)據(jù)推進(jìn)所有知識(shí)的唯一一個(gè)算法(或“主算法”)嗎?加入佩德羅·多明戈斯的探索來一起找出答案,。 Python工具/語言書籍《流暢的Python:清晰,、簡(jiǎn)練以及高效編程》 https://www./Fluent-Python-Concise-Effective-Programming-ebook/dp/B0131L3PW4 作者:盧西亞諾·拉馬爾霍(Luciano Ramalho) 有很多資源可以用來學(xué)習(xí)Python,,但是沒有能夠像這本優(yōu)秀的教科書一樣教你如何編程,。就如你渴望從一本編程書上得到的一樣,它是一本具有操作性的指導(dǎo)書,,可以幫助你理解Python是如何工作的以及怎樣寫出精彩且高效的Python代碼,。盧西亞諾·拉馬爾霍還網(wǎng)羅了一些流行的代碼庫,你會(huì)發(fā)現(xiàn)自己經(jīng)常在數(shù)據(jù)科學(xué)項(xiàng)目中用到這些庫,。有足足794頁的長(zhǎng)度,這本書真是物有所值,。 《Python編程:強(qiáng)大的面向?qū)ο缶幊獭?/strong> https://www./Programming-Python-4e-Mark-Lutz/dp/0596158106 作者:馬克·盧茨(Mark Lutz) 如果你認(rèn)為上本書已經(jīng)教會(huì)你所有需要了解的Python知識(shí),,那么請(qǐng)?jiān)倏紤]考慮這部書,。畢竟,Python是一個(gè)龐大的編程語言,,還有很多其它內(nèi)容沒有覆蓋,。一旦你從上面那本盧西亞諾·拉馬爾霍的書中掌握了基本原理,就可以來看看馬克·盧茨的這本書,。它在很多研究問題上都有深入詳盡的教程:數(shù)據(jù)庫,、網(wǎng)絡(luò)、文本處理和圖形用戶界面(GUIs)等等,,書中有大量例子,,是代碼迷必須讀的一本書。 《數(shù)據(jù)科學(xué)Python手冊(cè)》 作者:薩米爾·馬達(dá)文(Samir Madhavan) 目前為止,前面介紹的兩本書都是從編程語言角度來學(xué)習(xí)Python,,現(xiàn)在是時(shí)候從數(shù)據(jù)科學(xué)的角度來學(xué)習(xí)它了,。哪些數(shù)據(jù)科學(xué)庫正被普遍使用,并且怎么用,?你如何能在Python中創(chuàng)建數(shù)據(jù)可視化并按圖表挖掘數(shù)據(jù),?并且你如何能將高級(jí)的數(shù)據(jù)科學(xué)/機(jī)器學(xué)習(xí)技術(shù)編成代碼從而建立數(shù)據(jù)模型?薩米爾·馬達(dá)文在這本精心著作的書中回答了這些以及其他更多的問題,。 R工具/語言書籍《數(shù)據(jù)科學(xué)的R編程》 https://r4ds./ 作者:加勒特·格羅勒蒙德(Garrett Grolemund)和 哈德利·韋翰(Hadley Wickham) 只要是稍稍聽說過R編程的人都將會(huì)接觸到哈德利·韋翰的成果,,他在這個(gè)語言的成就是舉世無雙的 – 關(guān)于他我可以滔滔不絕,,怎么極力推薦這本書都不為過,。你將學(xué)會(huì)如何導(dǎo)入不同種類的數(shù)據(jù)進(jìn)R和不同的數(shù)據(jù)結(jié)構(gòu)以及如何轉(zhuǎn)變、可視化與建模你的數(shù)據(jù),。因此,,這是一本通過R編程學(xué)習(xí)數(shù)據(jù)科學(xué)的書,特別好,。 《大家來學(xué)R》 https://www./R-Everyone-Advanced-Analytics-Graphics/dp/9332539243 作者:賈里德·蘭德(Jared P. Lander) 我在聽說Python之前就已經(jīng)學(xué)習(xí)R了,,因此在我心中,,它占據(jù)了一個(gè)特殊的位置,而賈里德·蘭德的《大家來學(xué)R》在其中起了很大的作用,。我從一個(gè)朋友那里得到了這本書,,并且很快被它精彩的寫作所吸引了。它聲稱是寫給“大家”的,,實(shí)至名歸,。如果你沒有技術(shù)和統(tǒng)計(jì)學(xué)背景的話,這是一本很好的書,。 《R學(xué)習(xí)書》 https://www./Cookbook-Recipes-Analysis-Statistics-Graphics/dp/9350233797?tag=googinhydr18418-21&tag=googinkenshoo-21&ascsubtag=_k_EAIaIQobChMIqZ3q0uvy3wIV2SMrCh0M3w3nEAYYASABEgJmJ_D_BwE_k_&gclid=EAIaIQobChMIqZ3q0uvy3wIV2SMrCh0M3w3nEAYYASABEgJmJ_D_BwE |
|