久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

入門AI的數學圖譜 | 機器學習涉及的數學知識 | 入門AI系列

 ZZvvh2vjnmrpl4 2019-06-03

在過去幾個月里,,有幾個人聯(lián)系過我,,說他們渴望進軍數據科學領域,使用機器學習 (ML) 技術探索統(tǒng)計規(guī)律,,并打造數據驅動的完美產品,。但是,據我觀察,一些人缺乏必要的數學直覺和框架,,無法獲得有用的結果,。這是我決定寫這篇博客文章的主要原因。最近,,易用的機器學習和深度學習工具包急劇增加,,比如scikit-learn、Weka,、Tensorflow、R-caret等,。機器學習理論是一個涵蓋統(tǒng)計,、概率、計算機科學和算法方面的領域,,該理論的初衷是以迭代方式從數據中學習,,找到可用于構建智能應用程序的隱藏洞察。盡管機器學習和深度學習有巨大的發(fā)展?jié)摿?,但要深入掌握算法的內部工作原理并獲得良好的結果,,就必須透徹地了解許多技術的數學原理。

為什么擔憂數學,?

出于許多原因,,機器學習的數學原理很重要,下面重點介紹部分原因:

  1. 選擇正確的算法,,這涉及到考慮準確率,、訓練時間、模型復雜性,、參數數量和特征數量,。

  2. 選擇參數設置和驗證策略。

  3. 通過理解偏差-方差權衡,,識別欠擬合和過擬合,。

  4. 估算正確的置信區(qū)間和不確定性。

您需要多高的數學知識水平,?

       在嘗試理解諸如機器學習這樣的跨學科領域時,,需要考慮的主要問題是,理解這些技術需要多大的數學知識量和多高的數學知識水平,。此問題的答案涉及多個維度,,而且取決于個人的知識水平和興趣。對機器學習的數學公式和理論發(fā)展的研究從未間斷過,,一些研究人員正在研究更高級的技術,。我將介紹我認為成為機器學習科學家/工程師所需的最低數學知識水平,以及每個數學概念的重要性。

  1. 線性代數:同事 Skyler Speakman 最近說“線性代數是 21 世紀的數學”,,我完全同意這種說法,。在機器學習中,線性代數無處不在,。要理解用于機器學習的優(yōu)化方法,,需要掌握許多主題,比如主成份分析(PCA),、奇異值分解 (SVD),、矩陣特征分解、LU 分解,、QR 分解/因式分解,、對稱矩陣、正交化/標準正交化,、矩陣運算,、投影、特征值和特征矢量,、矢量空間,,以及范數。關于線性代數,,令人驚奇的是網上有如此多的資源,。我總是說,由于互聯(lián)網上存在大量資源,,傳統(tǒng)的課堂教學正在消亡,。我最喜歡MIT Courseware(Gilbert Strang 教授)提供的線性代數課。

  2. 概率論和統(tǒng)計學:機器學習與統(tǒng)計學并不是完全不同的領域,。實際上,,有人最近將機器學習定義為‘在Mac 上實踐統(tǒng)計學’。機器學習需要的一些基本的統(tǒng)計和概率理論包括組合學,、概率規(guī)則和公理,、貝葉斯定理、隨機變量,、方差和預期,、條件和聯(lián)合分布、標準分布(伯努利,、二項式,、多項式、均勻和高斯分布),、矩母函數,、最大似然估計 (MLE)、先驗和后驗、最大后驗概率估計 (MAP),,以及采樣方法,。

  3. 多變量微積分:一些必要的主題包括微積分、偏微分,、矢量-值函數,、方向梯度、海賽函數,、雅可比行列式,、拉普拉斯算子和拉格朗日分布。

  4. 算法和復雜優(yōu)化:這對理解機器學習算法的計算效率和可伸縮性,,以及利用數據集的稀疏性都很重要,。需要數據結構(二叉樹、哈希運算,、堆、堆棧等),、動態(tài)編程,、隨機化和次線性算法、圖表,、梯度/隨機下降,,以及原對偶方法的知識。

  5. 其他:包括上述 4 個主要領域未涵蓋的其他數學主題,。這些主題包括實數和復數分析(集合和數列,、拓撲、度量空間,、單值和連續(xù)函數,、極限、柯西核,、傅里葉變換),,信息論(熵、信息增益),,函數空間和數集,。

一些研究機器學習中需要的部分數學主題的在線 MOOC 和材料包括:

  • Khan Academy 的線性代數、概率論和統(tǒng)計學,、多變量微積分,,以及優(yōu)化。

  • 矩陣編碼:線性代數在計算機科學中的應用,,由布朗大學的 Philip Klein 提供,。

  • 線性代數 - 前沿科學的基礎,由德克薩斯大學的 Robert van de Geijn 提供。

  • 線性代數應用,,第 1 部分和第 2 部分,。戴維森學院 Tim Chartier 開設的一門新課。

  • Joseph Blitzstein - 哈佛大學統(tǒng)計學 110 講稿,。

  • Larry Wasserman 的著作 - 統(tǒng)計學完全教程:統(tǒng)計推斷簡明課程,。

  • Boyd 和 Vandenberghe 在斯坦福大學的凸優(yōu)化課程。

  • edX 上的“線性代數 - 前沿科學的基礎”,。

  • Udacity 的統(tǒng)計學介紹,。

      最后,,本博客的主要目的是提供有關數學在機器學習中的重要性的善意建議,,以及必要的主題和掌握這些主題所需的有用資源,。但是,,一些機器學習愛好者不懂數學,,很可能發(fā)現(xiàn)本文讓人感到泄氣(老實講,,這不是我的初衷),。對于初學者,,不需要大量數學知識即可開始從事機器學習工作,。正如這篇博客中介紹的,,基本前提是數據分析,您可以不斷學習數學知識,,掌握更多技術和算法,。

來源  | The Mathematics of Machine Learning(博客地址:https://datascience.ibm.com/blog/the-mathematics-of-machine-learning/)

出處 | IBM Community

翻譯 | dwchina_community 

    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,,不代表本站觀點,。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,,謹防詐騙,。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報,。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多