人工智能(AI)和機器學習(ML)是目前最熱門的話題。 術語“AI”每天無處不在,。經常聽到有抱負的開發(fā)者說他們想要學習人工智能,。還聽到高管們說他們希望在他們的服務中實施AI。但很多時候,,很多人都不明白AI是什么,。 閱讀完本文后,您將了解AI和ML的基礎知識,。更重要的是,,您將了解最受歡迎的ML類型深度學習是如何工作的。 背景 了解深度學習如何運作的第一步是掌握重要術語之間的差異,。 人工智能與機器學習
當AI研究首次開始時,研究人員正試圖復制人類智能以執(zhí)行特定任務 - 比如玩游戲,。 他們介紹了計算機需要尊重的大量規(guī)則,。計算機有一個特定的可能操作列表,并根據(jù)這些規(guī)則做出決策,。
ML允許計算機自己學習,。這種類型的學習利用了現(xiàn)代計算機的處理能力,可以輕松處理大型數(shù)據(jù)集,。 監(jiān)督學習與無監(jiān)督學習
當您使用監(jiān)督學習訓練AI時,您可以給它一個輸入并告訴它預期的輸出,。 如果AI生成的輸出錯誤,,則會重新調整其計算結果。這個過程在數(shù)據(jù)集上迭代完成,,直到AI不再犯錯誤為止,。 監(jiān)督學習的一個例子是天氣預測AI。它學會使用歷史數(shù)據(jù)預測天氣,。該訓練數(shù)據(jù)具有輸入(壓力,,濕度,風速)和輸出(溫度),。
當您使用無監(jiān)督學習訓練AI時,,您可以讓AI對數(shù)據(jù)進行邏輯分類,。 無監(jiān)督學習的一個例子是電子商務網(wǎng)站的行為預測AI。它不會通過使用標記的輸入和輸出數(shù)據(jù)集來學習,。 相反,,它將創(chuàng)建自己的輸入數(shù)據(jù)分類。它會告訴您哪種用戶最有可能購買不同的產品,。 現(xiàn)在,,深度學習如何運作? 您現(xiàn)在已準備好了解深度學習是什么以及它是如何工作的,。 深度學習是一種機器學習方法,。它允許我們在給定一組輸入的情況下訓練AI來預測輸出。有監(jiān)督和無監(jiān)督學習都可以用來訓練AI,。 我們將通過建立假設的機票價格估算服務來了解深度學習的工作原理,。我們將使用有監(jiān)督的學習方法對其進行訓練。 我們希望我們的機票價格估算器使用以下輸入預測價格(為簡單起見,,我們不包括退票):
神經網(wǎng)絡 讓我們看看人工智能的大腦內部,。 像動物一樣,我們的估算器AI的大腦有神經元,。它們由圓圈表示,。這些神經元是相互連接的。 神經元被分為三種不同類型的層:
在輸入層接收輸入數(shù)據(jù),。在我們的例子中,,我們在輸入層有四個神經元:Origin機場,,目的地機場,出發(fā)日期和航空公司,。輸入層將輸入傳遞給第一個隱藏層,。 在隱藏圖層上我們投入的數(shù)學計算。創(chuàng)建神經網(wǎng)絡的挑戰(zhàn)之一是決定隱藏層的數(shù)量,,以及每層的神經元數(shù)量,。 深度學習中的“ 深層”是指具有多個隱藏層。 在輸出層返回的輸出數(shù)據(jù),。在我們的例子中,,它給了我們價格預測。 那么它如何計算價格預測呢,? 這就是深度學習的魔力所在,。 神經元之間的每個連接與權重相關聯(lián)。這個權重決定了輸入值的重要性,。初始權重是隨機設置的,。 在預測機票價格時,出發(fā)日期是較重的因素之一,。因此,,出發(fā)日期神經元連接將具有很大的權重。 每個神經元都有一個激活功能,。沒有數(shù)學推理,,這些函數(shù)很難理解。 簡而言之,,其目的之一是“標準化”神經元的輸出,。 一旦輸入數(shù)據(jù)集通過神經網(wǎng)絡的所有層,它就會通過輸出層返回輸出數(shù)據(jù),。 沒什么復雜的吧,? 訓練神經網(wǎng)絡 培訓AI是深度學習中最難的部分。為什么,?
對于我們的機票價格估算器,,我們需要查找機票價格的歷史數(shù)據(jù),。由于大量可能的機場和出發(fā)日期組合,我們需要一個非常大的票價列表,。 為了訓練AI,,我們需要從數(shù)據(jù)集中提供輸入,并將其輸出與數(shù)據(jù)集的輸出進行比較,。由于人工智能尚未經過培訓,,其產出將是錯誤的,。 一旦我們完成整個數(shù)據(jù)集,我們就可以創(chuàng)建一個函數(shù),,向我們展示AI輸出與實際輸出的錯誤,。此功能稱為成本函數(shù)。 理想情況下,,我們希望我們的成本函數(shù)為零,。那時我們的AI輸出與數(shù)據(jù)集輸出相同。 我們如何降低成本函數(shù),? 我們改變神經元之間的權重,。我們可以隨機更改它們直到我們的成本函數(shù)很低,但這不是很有效,。 相反,,我們將使用一種名為Gradient Descent的技術。 Gradient Descent是一種允許我們找到函數(shù)最小值的技術,。在我們的例子中,,我們正在尋找最低成本函數(shù)。 它的工作原理是在每次數(shù)據(jù)集迭代后以小增量改變權重,。通過計算成本函數(shù)在某一組權重下的導數(shù)(或梯度),,我們能夠看出最小值的方向。 要最小化成本函數(shù),,您需要多次遍歷數(shù)據(jù)集。這就是您需要大量計算能力的原因,。 使用梯度下降更新權重是自動完成的,。這就是深度學習的魔力! 一旦我們訓練了我們的機票價格估算器AI,,我們就可以用它來預測未來的價格,。 綜上所述…
自然語言處理 (Natural Language Processing,,NLP) 是計算機科學領域與人工智能領域中的一個重要方向。它研究能夠實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法,。 目前市面上非常缺乏自然語言處理方面的人才,,對應的薪水也要高于其他崗位1倍以上,甚至更高,。有2,,3年經驗的人才要價50-60萬年薪是很正常的一件事情! |
|