科技行者報道 來源:MIT Technology Review 編譯:科技行者 嚴格的說,,Scot Barton似乎不像是一名人工智能先驅(qū)。他并沒有在建造自動駕駛車輛,,也沒有訓(xùn)練電腦如何在電腦游戲中擊敗人類,。但是值得注意的是,在其所就職的農(nóng)夫保險公司(Farmers Insurance)里,,他正在為某技術(shù)開創(chuàng)道路,。 Barton領(lǐng)導(dǎo)著一個分析數(shù)據(jù)的團隊,主要回答關(guān)于客戶行為和不同政策設(shè)計等問題,。從深層神經(jīng)網(wǎng)絡(luò)到?jīng)Q策樹,,他的團隊現(xiàn)在正在使用各種尖端的機器學(xué)習(xí)技術(shù)。但是Barton并沒有雇用一批人工智能魔法師來實現(xiàn)這一點,。他的團隊使用了一個被稱為DataRobot的平臺,,它可以將所涉及的很多困難工作自動化。 未來幾年人工智能會如何發(fā)展,。除了阿爾法狗令人嘆為觀止的表現(xiàn),,人工智能確實也正在改變整個行業(yè)。但有一點我們是需要注意的,,有必要讓AI從總體上變得更加易于使用,。 問題是,現(xiàn)有的人工智能技術(shù)涉及到的許多步驟目前都需要大量的專業(yè)知識,。而且,,這不像是在表面上搭建一個友好的界面那么簡單,因為工程師們在編寫和調(diào)整代碼的時候經(jīng)常需要進行判斷并需要使用到專門的技術(shù),。 但是,,人工智能研究人員和公司正在通過將這項技術(shù)應(yīng)用于自身來解決這個問題,利用機器學(xué)習(xí)將人工智能算法開發(fā)中棘手的問題自動化,。一些專家甚至建立了相當于人工智能支持的操作系統(tǒng),,旨在使該技術(shù)的應(yīng)用程序與今天的微軟Excel一樣簡單易用。 DataRobot是朝著這個方向邁出的一步,。你提供原始數(shù)據(jù),,平臺對其進行自動清理并重新格式化。然后,,它一次運行數(shù)十種不同的算法,,并對其性能進行排名。與標準的手工統(tǒng)計方法相比,,所選擇的模型的錯誤率降低了20%,。他表示,“開箱即用,,按一個按鈕,;這實在是非常令人印象深刻?!?/span> DataRobot是一家把建立機器學(xué)習(xí)模式的過程變成自動化的平臺公司,。在DataRobot平臺上有數(shù)百個開源機器學(xué)習(xí)算法。通過提供快速,、準確和自動化的程序,,DataRobot可幫助企業(yè)級用戶做出更智能、更快速的商業(yè)決策,。DataRobot通過改變預(yù)測分析的速度和經(jīng)濟學(xué),,解決了數(shù)據(jù)科學(xué)家嚴重短缺的問題。 通過自動化的機器學(xué)習(xí)工具成為一家AI驅(qū)動的企業(yè)(圖片來自DataRobot官網(wǎng)) DataRobot致力于……(圖片來自DataRobot官網(wǎng)) 人工智能技能缺口 今年六月,,咨詢公司麥肯錫發(fā)布了一份報告,,披露了人工智能應(yīng)用的現(xiàn)實。這份報告的結(jié)論是,,人工智能——特別是機器學(xué)習(xí),,可能會徹底改變包括制造業(yè)、金融業(yè)和醫(yī)療保健行業(yè)在內(nèi)的大型行業(yè),,到2025年可能會在美國經(jīng)濟中總共占到1260億美元的規(guī)模,。但是,,報告有一個嚴重的警告:關(guān)鍵人才的短缺。 培養(yǎng)盡可能多的人使用人工智能當然是非常有幫助的,。但是這需要時間,,而且不是每個人都能成為人工智能大師的。對于任何一種技術(shù)來說,,要想最大限度地發(fā)揮它的影響,,就要讓它能夠盡可能方便地被使用。只有當人工智能能夠滲透進入普通的辦公室和工作場所,,才能實現(xiàn)這一點,。DataRobot已經(jīng)被用于一些這樣的場合了。 一天下午,,坐落于波士頓金融區(qū)的DataRobot辦公室空蕩蕩的,,一大批工程師圍著一臺大型顯示器亂轉(zhuǎn)。該公司的咨詢師Jonathan Dahlberg給我做了一個演示,,該公司的解決方案真的是令人印象深刻,。他加載了一個貸款申請和付款的公共數(shù)據(jù)集,然后他讓系統(tǒng)開發(fā)出一堆模型,,看看關(guān)于為什么人們會違約是否有什么模式,。 幾秒鐘后,屏幕上出現(xiàn)了數(shù)十種競爭算法,;在頂部是一種被稱為XGBoost的,、相對無趣但被廣泛使用的梯度提升技術(shù)。很快,,屏幕上就顯示申請人的收入特別重要,,但他們想要貸款的原因也是如此。它發(fā)現(xiàn),,在申請中提及“創(chuàng)辦企業(yè)”的人是一個特別糟糕的群體,。 Dahlberg表示,DataRobot可能會在專業(yè)知識和技能方面,,與一個非常好的數(shù)據(jù)科學(xué)家旗鼓相當,,但它可以提供更廣泛的視角。一個人可能會太依賴某種技術(shù),,而DataRobot可以自動地找到一種從根本上更好的方法,。用戶還可以使用Python或R編程語言手動修改底層算法。不經(jīng)過仔細的檢查,,很難知道該系統(tǒng)在自動化數(shù)據(jù)科學(xué)的一些棘手問題方面到底做得如何,,如數(shù)據(jù)清理和功能工程,但它似乎對付了一個驚人的數(shù)量,。 該公司的首席執(zhí)行官Jeremy Achin在觀看了《社交網(wǎng)絡(luò)》(《The Social Network》)之后備受激勵,,萌生了想要創(chuàng)辦一家企業(yè)的想法,,當我們在麻省理工學(xué)院附近的咖啡館會面時,他承認當時還有點懦弱,。但是,,他在數(shù)據(jù)科學(xué)比賽中獲得了DataRobot的靈感,這些競賽是由眾包平臺Kaggle舉辦的,,該平臺在今年早些時候被谷歌收購了。Kaggle為從大型數(shù)據(jù)集中進行特定預(yù)測時表現(xiàn)最佳的算法提供獎品,。這一任務(wù)通常涉及開發(fā)一種機器學(xué)習(xí)算法,,用于對數(shù)據(jù)進行處理。作為Kaggle最早的參賽選手之一,,Achin意識到自己已經(jīng)在每場比賽中自動化了很多步驟,。 他表示,“我認為,,如果我們收集了足夠多的數(shù)據(jù)集,,足夠多的問題,并且運行了足夠多的實驗,,我們就可以在機器學(xué)習(xí)上進行機器學(xué)習(xí),。這是就是最初的想法?!?/span> 這個想法顯然引發(fā)了投資者的共鳴,。DataRobot自2012年創(chuàng)辦開始,已經(jīng)籌集了超過1億美元,,其中包括今年3月份籌集到的5400萬美元,,與此同時,Kaggle被谷歌收購了,。該公司表示目前已經(jīng)擁有一百多個客戶,。Achin表示,這個概念在很多數(shù)據(jù)科學(xué)家那里并不是那么受歡迎,,他們要么認為自己的技能無法被自動化,,要么則是擔心這些技能會被自動化。但是他相信,,對絕大部分企業(yè)來說,,如果想要使用人工智能,就沒有別的選擇,。他表示,,“我不在乎有多少人在LinkedIn上將他們的頭銜改為‘數(shù)據(jù)科學(xué)家’”。他表示,,“你不會有很大改觀,?!?/span> 自我學(xué)習(xí)系統(tǒng) 數(shù)據(jù)科學(xué)家的短缺激發(fā)了許多其他的人開始致力于自動化機器學(xué)習(xí)方面的工作。越來越多的研究論文正在使用技術(shù)將越來越多人工智能方面的工作自動化,。 谷歌是全球最大的玩家之一,,該公司也將注意力轉(zhuǎn)向了這個想法。谷歌已經(jīng)大筆投入,,開發(fā)了強大的人工智能算法并將其部署到其服務(wù)中,。但該公司也熱衷于為其云服務(wù)添加更多的人工智能。除了簡單的圖像或文本分類工具之外,,還意味將更多機器學(xué)習(xí)模型訓(xùn)練工作自動化,。 負責(zé)領(lǐng)導(dǎo)谷歌人工智能工作的計算機工程師John Giannandrea表示:“目標是使這項技術(shù)更易于使用” 。他表示,,“然后任何人都可以說‘為我建立一個預(yù)測模型’,,然后它就會去做一個模型?!?/span> 今年早些時候,,該公司宣布了圍繞著這一目標的一些重大進展,展示了一種能自動化地調(diào)整深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的實驗性的方式,。 這些可能是最強大的機器學(xué)習(xí)算法,,它們顯著提高了圖像和語音識別領(lǐng)域的最高技術(shù)水平。但它們也很難工程化,。Giannandrea表示,,這項工作正在產(chǎn)生一些非常有希望的結(jié)果,在某些情況下與手動開發(fā)的系統(tǒng)的性能不相上下,。 而且他希望谷歌能夠在未來幾個月內(nèi)發(fā)布更多的結(jié)果,。 其他人甚至還做出了更宏大的設(shè)計。例如,,卡內(nèi)基梅隆大學(xué)教授Eric Xing正在開發(fā)相當于是由不同機器學(xué)習(xí)組件構(gòu)建的操作系統(tǒng),。該操作系統(tǒng)使用虛擬化和機器學(xué)習(xí)來抽象設(shè)計和訓(xùn)練人工智能工作中的大部分復(fù)雜性。它甚至配備了一個圖形用戶界面,,可用于訓(xùn)練特定數(shù)據(jù)集上的機器學(xué)習(xí)模型,。 Eric Xing在中國受過教育,并在加州大學(xué)伯克利分校(UC Berkeley)與Andrew Ng一起學(xué)習(xí),,他現(xiàn)在是世界知名人士的知名人物,。他非常有禮貌,而且令人意外的是,,他想要改變?nèi)藗兪褂秒娔X的方式,。Eric Xing設(shè)想他的人工智能操作系統(tǒng)會非常簡單易用,就像微軟的電子表格軟件——Excel一樣。他表示,,“這是整個人工智能行業(yè)的核心問題”,。他表示,“進入的門檻太高了,?!?/span> Eric Xing已經(jīng)創(chuàng)辦了一家公司——Petuum,來開發(fā)這個操作系統(tǒng),,并且已經(jīng)開發(fā)了一系列工具,,旨在將機器學(xué)習(xí)引入醫(yī)學(xué)領(lǐng)域。他表示,,“醫(yī)生需要一個界面和醫(yī)療記錄,、圖像——每一種圖像都需要不同的機器學(xué)習(xí)方法?!?Petuum正在加緊準備發(fā)布平臺。 Petuum目前正在針對深度學(xué)習(xí)(如CNN/RNN),、預(yù)測性分析(如回歸分析),、知識萃取(如主題模型) ,、內(nèi)容概括(如稀疏編碼)和集成方法(如梯度增長樹狀圖)創(chuàng)建一個新一代人工智能和機器學(xué)習(xí)平臺,。平臺可適用于于多種不同應(yīng)用,比如自然語言處理,、圖片和視頻分析以及交易數(shù)據(jù)中的異常檢測,。 圖片來自Petuum官網(wǎng) Petuum的操作系統(tǒng)和其他一些人工智能自動化工具將面臨一些獨特的挑戰(zhàn)。已經(jīng)有關(guān)于機器學(xué)習(xí)算法無意中吸收了訓(xùn)練數(shù)據(jù)的偏差的擔心出現(xiàn),,而有些模型太不透明,,無法進行仔細檢查(參見《人工智能核心中的黑暗秘密》“The Dark Secret at the Heart of AI”)。如果人工智能變得更加容易使用,,這些問題可能會變得更加廣泛和更加根深蒂固,。 微軟高級研究員Rich Caruana表示:“要想把機器學(xué)習(xí)做得很好,你需要博士學(xué)位和大約五年的經(jīng)驗,?!彼硎荆坝泻芏嘞葳?。您的算法是否在六個月后過期,,它是否可以解釋?” 數(shù)據(jù)科學(xué)家為防范這些問題而必須采取一些步驟,,Caruana相信這些步驟中的一部分應(yīng)該是有可能自動化的——這類似于飛行員在飛行前的檢查清單,。但是他對于過分地信任承諾自動化一切的系統(tǒng)心存警惕。他表示,“我知道這一點是因為一路走來,,我一直磕磕絆絆,。” |
|