本人準(zhǔn)備市場營銷研究生畢業(yè),以前有學(xué)過sql,也懂一丟丟sas,,現(xiàn)在想往數(shù)據(jù)分析的方向轉(zhuǎn),,長期想偏data science,,目前準(zhǔn)備學(xué)習(xí)下python和R,,另外也想再補(bǔ)補(bǔ)統(tǒng)計(jì)的知識(shí),,我知道coursera,,udemy,,edx這些平臺(tái),,但是課程類型太多了~~~~大家有上過的嗎,?,?求各位大神推薦下(希望能把課名列出來哈),。另外如果你有學(xué)習(xí)方案推薦,也想一睹為快哈,!我大概有一年時(shí)間去準(zhǔn)備~~ 先射射各位了?。。海?br style="box-sizing: border-box;"> 在我看來, Data Science/Analytics 大致需要掌握以下幾方面的技能: 1. SQL, 數(shù)據(jù)庫相關(guān)的技能 這個(gè)是所有從事數(shù)據(jù)分析的第一步:獲取數(shù)據(jù),,而絕大部分的數(shù)據(jù)儲(chǔ)存在數(shù)據(jù)庫中,,所以SQL的技能很關(guān)鍵,事實(shí)上也是以后也會(huì)占用你工作的大部分時(shí)間,。 SQL不難,,但是想要快速熟練的掌握光靠背幾個(gè) select, from, where, group by 是遠(yuǎn)遠(yuǎn)不夠的,最好的聯(lián)系方法是能一邊寫一邊看得出的結(jié)果,,從而搞清楚每條語句實(shí)際在背后對(duì)數(shù)據(jù)做了什么操作,,邏輯是什么。 SQL也是數(shù)據(jù)分析面試時(shí)重點(diǎn)考察的方面,,Google, Facebook, Uber, Slack等等這些大的科技公司都會(huì)去著重考察,,不需要你會(huì)很fancy的命令語句,但是會(huì)讓你利用簡單的命令語句去實(shí)現(xiàn)很復(fù)雜的邏輯關(guān)系,, 這方面的資源比較入門級(jí)的有 SQLZOO 和 W3 School的SQL部分,,這兩個(gè)相對(duì)來說好快速上手,而且都是我前面說的可以讓你一邊寫SQL一邊看你query出來的結(jié)果,, 這樣會(huì)讓你對(duì)命令語句具體對(duì)數(shù)據(jù)本身做了什么,。 https:/// https://www./sql/ 進(jìn)階的資源有微軟在edx上的一門MOOC:Querying with Transact-SQL, 這門課也適用于初學(xué)者,不過學(xué)習(xí)的時(shí)間要長一些,,因?yàn)閮?nèi)容會(huì)講的深一些(比如window function 和 table expression) https://www./course/querying-transact-sql-microsoft-dat201x-7 2. 統(tǒng)計(jì)的基本原理 大部分傳統(tǒng)的機(jī)器學(xué)習(xí)的算法來自于統(tǒng)計(jì)學(xué),,而且統(tǒng)計(jì)學(xué)的知識(shí)也被大量的用在了數(shù)據(jù)探索階段(Explanatory Data Analysis) 和工作中各種各樣的Statistical Testing上面 這方面就是傳統(tǒng)的統(tǒng)計(jì)知識(shí),,盡量選一些名牌大學(xué)的通俗易懂的基礎(chǔ)統(tǒng)計(jì)課即可。 3. Data Science/Machine Learning Modeling 這塊的課程最多,,但也最難選,,因?yàn)楹芏嗾n程要么太注重理論,需要有很好的數(shù)學(xué)基礎(chǔ)才能理解,,要么就是相對(duì)來說太過簡單,,下面是我覺得蠻好的課程,兼顧了理論深度,,理解難度和實(shí)踐程度,。 Udemy: Python for Data Science and Machine Learning Bootcamp https://www./python-for-data-science-and-machine-learningbootcamp/ 這門課的特點(diǎn)是講解很清晰,信息量很大,,講師既講了Python編程也講了些ML的算法知識(shí),,不過相對(duì)來說不是很深。 Edx: Analytic Edge https://www./course/analytics-edge-mitx-15-071x-3 如果你是個(gè)對(duì)理論數(shù)學(xué)化的東西不大感興趣,,只注重怎么把ML的算法應(yīng)用在實(shí)際中,,那這門課是很好的入門課。 這門來自MIT的神課介紹每個(gè)算法時(shí)都是通過一個(gè)相應(yīng)的現(xiàn)實(shí)中真實(shí)應(yīng)用的案例來講的,,而且講的通俗易懂,,全部課程的語言為,也很容易上手 Udacity: Intro to Machine Learning https://www./course/intro-to-machine-learning–ud120 這門課是Google X 實(shí)驗(yàn)室的創(chuàng)始人 Sebastian Thrun (同時(shí)也是Udacity的創(chuàng)始人)講授的,,全面的涵蓋了主流ML的算法,,中間每講一個(gè)新的算法,都會(huì)穿插了很多小練習(xí)幫助你鞏固新學(xué)到的知識(shí),,而且Sebastian作為業(yè)界大牛,,對(duì)ML的講解也很清晰直白易懂。 Stanford Online: Statistical Learning http://online./course/statistical-learning-self-paced 如果你想探究ML算法背后的數(shù)學(xué)理論基礎(chǔ),,那這門來自斯坦福的神課就是你的不二選擇,,雖然課程的數(shù)學(xué)理論涉及較多,但是只要跟著兩位教授(兩位大牛,,其中一位發(fā)明了大名鼎鼎的LASSO Regression)一步步來,,還是比較容易懂的,本課程也采用了較易上手的R作為編程語言 以上這些都是Data Science/Analytics 的入門課,,歡迎各位大牛繼續(xù)補(bǔ)充,! 當(dāng)然還有很有名的coursea上的JHU的data science系列,我在這里就不多描述了,。 希望能幫到你,! Bobby |
|