SQL存在已經(jīng)有半個世紀的歷史了,,在今天它仍然被很多商業(yè)界所選用,。其最主要原因是SQL的數(shù)據(jù)查詢語言易操作。當SQL被建立在IBM上,,他們的目標是創(chuàng)建一種能識別英語的語言,。對于新用戶來說,一旦你掌握了每個關鍵詞的命令和意義,,那么SQL會變得非常簡單易讀,。 SQL允許更快和更容易的訪問數(shù)據(jù),而不是創(chuàng)建一個Python腳本或Excel電子表格,。然而,,經(jīng)常被忽視的一個好處是,一旦你知道一個迭代的SQL,,那么在撿起其他的迭代就變得微不足道,,它打開了各種數(shù)據(jù)管理技術。接下來,,我將在下文詳細分析各個職位的好處和原因:產(chǎn)品經(jīng)理,、數(shù)據(jù)分析師,、數(shù)據(jù)科學家和數(shù)據(jù)工程師。 產(chǎn)品經(jīng)理 產(chǎn)品經(jīng)理主要負責其產(chǎn)品的成功,,并要了解用戶與產(chǎn)品在各個領域的使用情況,。但能夠詳細回答這些問題往往是很困難的一件事,我們常常必須要依靠數(shù)據(jù)分析師,,才能得到這些答案,。雖然有分析工具,如Mixpanel和谷歌分析,,但這些不能捕獲所有產(chǎn)品的相關細節(jié),。因此,學習SQL會讓你花最少的開銷,,獲得更多的關于產(chǎn)品的一些細節(jié),。 數(shù)據(jù)分析師 許多數(shù)據(jù)分析師最初使用Excel進行數(shù)據(jù)管理和分析。這絕對是沒錯的,,因為Excel比SQL迭代分析更加靈活,。Excel在可伸縮性領域中表現(xiàn)的并不擅長。而所有的Excel的用戶都會遇到可伸縮性的問題,,并且當遇到較大的CSV文件時,,容易導致Excel的崩潰。那么,,當使用SQL后,,你就不必擔心伸縮性問題了,并且你將有能力分析比以前更大的數(shù)據(jù)集,。 數(shù)據(jù)科學家 數(shù)據(jù)科學家花90%的時間來清理數(shù)據(jù)和10%的時間分析數(shù)據(jù)。數(shù)據(jù)科學家最大的問題不是算法或缺乏領域知識,,而是需要快速獲得干凈的數(shù)據(jù),。新的數(shù)據(jù)科學家,特別是有計算機科學背景的,,更傾向于使用多種腳本語言來獲取和處理數(shù)據(jù),。這種方法往往比使用專門為數(shù)據(jù)訪問和操作的工具使用起來更加繁瑣,、費時、易碎,。學習SQL,,讓你成為更加自力更生的數(shù)據(jù)科學家,,并允許你擴大可訪問數(shù)據(jù)源的范圍以及它可以更輕松的迭代。 數(shù)據(jù)工程師 數(shù)據(jù)工程師是每個數(shù)據(jù)管道的骨干,。他們在每個數(shù)據(jù)管道中進行對數(shù)據(jù)的收集、攝取,、存儲、加工,,他們好比是建筑師、建設者和維護者,。數(shù)據(jù)工程師擔負著所有的繁重工作,讓其他人都能安全,、高效的訪問數(shù)據(jù),。對于工程師來說,,掌握SQL是非常有必要的,因為關系和分析數(shù)據(jù)庫與SQL接口將繼續(xù)成為最受歡迎的,。MySQL,、PostgreSQL、Redshift,、BigQuery,、DashDB 和Hive都屬于這一類。不同于其他三組,,數(shù)據(jù)工程師不僅需要掌握寫查詢,他們還需要知道如何通過SQL來管理數(shù)據(jù)庫,。由于數(shù)據(jù)工程師往往被看做系統(tǒng)專家,,所以還需要知道如何優(yōu)化查詢性能。 |
|