重磅干貨,第一時(shí)間送達(dá),! 譯者 | Shawn Lee 編輯 | Jane 來源 | AI科技大本營(ID: rgznai100) 在過去的幾年里,,機(jī)器學(xué)習(xí)為各行各業(yè)開創(chuàng)了新紀(jì)元,誕生了許多成功的案例: Facebook 的面部識(shí)別,,Netflix 的智能電影推薦系統(tǒng),,PrimaAI 的圖像風(fēng)格轉(zhuǎn)換,Siri 的語音識(shí)別,,Google Allo 的自然語言處理,及其他很多開發(fā)中的項(xiàng)目,。 除了這些案例以外,,GitHub 上有大量托管的開源機(jī)器學(xué)習(xí)項(xiàng)目。我們挑選了最受大家歡迎的項(xiàng)目,,這些項(xiàng)目涵蓋 CV,、NLP 及語音三大領(lǐng)域的 25 個(gè)開源項(xiàng)目,包括:如何讓機(jī)器學(xué)習(xí)創(chuàng)作音樂,、歌曲,;如何為草圖、灰度圖像上色,;圖片風(fēng)格轉(zhuǎn)換,;語音風(fēng)格遷移;在 IOS 或 Android 上進(jìn)行面部檢測與情感分類,;提供游戲研究平臺(tái),;最先進(jìn)的物體檢測算法的實(shí)現(xiàn);無人機(jī)與汽車的模擬器,;損毀圖像的恢復(fù)工具,、人體關(guān)鍵點(diǎn)檢測等內(nèi)容。希望大家能從中學(xué)到新的知識(shí)并得到啟發(fā),。 ▌TensorFlow
TensorFlow 由 Google Brain 團(tuán)隊(duì)開發(fā),,最初僅供 Google 內(nèi)部使用,。2015年11月 9 日,,TensorFlow 在 Apache 2.0 開源許可下發(fā)布。最新版本的 TensorFlow 支持 Keras,,它是一種用 Python 編寫的高級(jí)神經(jīng)網(wǎng)絡(luò) API,,能夠在 TensorFlow, CNTK 或 Theano 之上運(yùn)行,。Keras 也包含 Javascript 和 Swift 的接口,。 ▌Scikit-learn Scikit-learn 是基于 NumPy、SciPy 和 Matplotlib 的一款簡單有效的數(shù)據(jù)挖掘和數(shù)據(jù)分析工具,。 由于其簡單和便捷的功能,,它常與 TensorFlow 一起使用。 ▌MXNet 除了 TensorFlow ,、Keras 和 Scikit-learn 之外,,Apache 的 MXNet 也是一款深度學(xué)習(xí)的框架工具。 它專為提高效率和靈活性而設(shè)計(jì),,允許混合使用符號(hào)和命令式編程,,以最大限度地提高效率和生產(chǎn)力。 ▌PyTorch PyTorch 絕對是這個(gè)列表里一定要提到的一款應(yīng)用,,它在機(jī)器學(xué)習(xí)愛好者里享有很高的知名度,。 PyTorch 基于 Torch ,并由 Facebook 作為其機(jī)器學(xué)習(xí)的框架發(fā)布,。 PyTorch 是一個(gè) Python 包,,它提供兩個(gè)高級(jí)功能:由強(qiáng) GPU 支持的加速張量計(jì)算(如 NumPy ),其深度神經(jīng)網(wǎng)絡(luò)是建立在基于磁盤的 autograd 包上,。 (來源:https://twitter.com/pytorch/status/966324198758006784) ▌magenta
它主要的庫適配于 python ,,除此之外也有 Javascript 的版本 — magenta.js 。 在藝術(shù)創(chuàng)作里,,大部分人可能從未想過高級(jí)機(jī)器學(xué)習(xí)可以使用在這個(gè)領(lǐng)域,,但 Megenta 向人們完美地展示了應(yīng)用的可能性。點(diǎn)擊這里觀看這些令人驚嘆的聲音和繪圖生成器的演示吧,。 ▌style2paints 該項(xiàng)目旨在為線稿著色,。 AI 可以根據(jù)既定的顏色樣式在草圖上繪制,、或在草圖上創(chuàng)建繪制自己的顏色風(fēng)格、亦或者將現(xiàn)有的風(fēng)格轉(zhuǎn)換至另一種風(fēng)格,。 有一些值得一看的新的功能,,例如色彩錨和圖像過渡。 ▌Image-to-image translation in PyTorch 該項(xiàng)目有兩個(gè)組成部分,,CycleGAN 和 pix2pix ,。基于 PyTorch ,,它們可以實(shí)現(xiàn)用于未配對和成對的圖像到圖像轉(zhuǎn)換,。 乍看之下,它仿佛只是一種相當(dāng)普通的風(fēng)格轉(zhuǎn)移解決方案,,事實(shí)上,,它跟其他應(yīng)用不一樣。比如它能將圖片里普通的馬轉(zhuǎn)換為斑馬或從實(shí)景照片轉(zhuǎn)換為莫奈風(fēng)格的畫作,。并且它的處理速度快到足以在實(shí)時(shí)視頻上應(yīng)用,。 ▌Deep voice conversion 列表上已經(jīng)羅列了一些用于圖像和視頻的風(fēng)格轉(zhuǎn)換工具了,但是語音呢,? 深度語音轉(zhuǎn)換便是此功能的完美示例。
▌StarGAN in PyTorch StarGAN 是這篇文章中提到的一個(gè) PyTorch 應(yīng)用:Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation,。它可以將源圖像轉(zhuǎn)換成不同的發(fā)型、皮膚類型,、年齡,、性別和不同的情緒。 ▌Face detection 面部檢測聽起來不太吸引人,,因?yàn)槲覀兛梢栽?iOS 和 Android 上使用 Core ML 或 ML Kit 輕松地完成這項(xiàng)工作,。 但是隨著深入了解,你會(huì)發(fā)現(xiàn)它不僅可以檢測面部,,還可以檢測情緒和性別,。
▌Deep universal probabilistic programming Uber AI Labs 構(gòu)建了這個(gè)深度概率編程庫,,用于簡化其運(yùn)輸服務(wù)的預(yù)測和優(yōu)化收益,。 任何處理概率建模的人都會(huì)對這個(gè)庫感興趣,。
▌ParlAI 作為 Facebook 研究項(xiàng)目的一部分,,ParlAI 是一個(gè)用于在各種公開可用的對話數(shù)據(jù)集上訓(xùn)練和評(píng)估 AI 模型的框架,。 ParlAI 是一個(gè)在為研究人員提供訪問許多流行數(shù)據(jù)集的權(quán)限的同時(shí),也可以共享和測試對話模型的統(tǒng)一框架,。 ▌Facets Facets 一種可視化機(jī)器學(xué)習(xí)數(shù)據(jù)集的工具,。
▌ELF with AlphaGoZero ELF 是 AlphaGoZero / AlphaZero 實(shí)現(xiàn)的游戲研究平臺(tái),。 ELF 為游戲研究提供端到端解決方案,。 它包括微型實(shí)時(shí)戰(zhàn)略游戲環(huán)境,并發(fā)模擬,,數(shù)千臺(tái)機(jī)器的分布式培訓(xùn),,直觀的 API ,基于 Web 的可視化以及由 PyTorch 提供支持的強(qiáng)化學(xué)習(xí)框架,。 ▌Detectron Detectron 是 Facebook AI Research 的軟件系統(tǒng),,它實(shí)現(xiàn)了最先進(jìn)的物體檢測算法,包括 Mask R-CNN ,。 它是用 Python 編寫的,,由 Caffe2 深度學(xué)習(xí)框架提供支持。 ▌Fast Style Transfer 使用 TensorFlow CNN 實(shí)現(xiàn),,這可能是圖像樣式傳輸?shù)淖罴咽纠?,顧名思義,它的完成速度非常快,。 該項(xiàng)目基于 Gatys 的藝術(shù)風(fēng)格的神經(jīng)算法,, Johnson 對實(shí)時(shí)樣式轉(zhuǎn)換和超分辨率的感知損失以及 Ulyanov 的實(shí)例規(guī)范化的組合 。 ▌Face recognition 此工具提供簡單的面部識(shí)別 API ,。 它可以找到面部特征,,并猜出照片中的人物。
▌Deep photo style transfer 另一個(gè)十分好用的圖片風(fēng)格轉(zhuǎn)換工具。 這篇文章里包含本應(yīng)用的代碼和研究論文: Deep Photo Style Transfer ,。 它提供了簡單的API來合并樣式和源圖像,。 令人印象深刻的圖像樣式轉(zhuǎn)移工具。 ▌Fast Text FastText 是一個(gè)有效學(xué)習(xí)單詞意思和句子分類的庫,。 為了更好地了解這個(gè)項(xiàng)目,,請轉(zhuǎn)到他們的文本分類教程,該教程展示了如何在監(jiān)督學(xué)習(xí)中使用該庫,。 文本分類的目標(biāo)是將文檔(例如電子郵件,,帖子,文本消息,,產(chǎn)品評(píng)論等)分配給一個(gè)或多個(gè)類別,。 ▌AirSim AirSim 是一款基于 Unreal Engine 的無人機(jī),汽車的模擬器,。 它是開源的,,跨平臺(tái)的,,它支持硬件在環(huán),,并支持市面上流行的飛行控制器(如 PX4 )用于物理和視覺逼真的模擬。 這是一個(gè) Unreal 插件,,可以簡單地插入到你想要的任何 Unreal 的環(huán)境中,。 ▌Image restoration 機(jī)器學(xué)習(xí)可以做的比我們想象的要多。 Deep Image Prior 是基于神經(jīng)網(wǎng)絡(luò)的修復(fù)圖像工具 – 并不是機(jī)器學(xué)習(xí),。 此工具可以恢復(fù)帶有劃痕,、壞點(diǎn)和/或不需要的文本標(biāo)記的損壞圖像。 ▌Open Pose Open Pose 代表了第一個(gè)在單個(gè)圖像上聯(lián)合檢測人體,、手,、面部和足部關(guān)鍵點(diǎn)(總共 135 個(gè)關(guān)鍵點(diǎn))的實(shí)時(shí)多人系統(tǒng)。 ▌PirateAT PirateAI 在模擬環(huán)境(島嶼)中訓(xùn)練自主代理(海盜)。 這個(gè)倉庫運(yùn)行一個(gè)訓(xùn)練管道,,在游戲(尋找寶藏)和模型訓(xùn)練課程( Keras + hyperopt )之間交替,。 ▌EmojiIntelligence 與此列表中的許多項(xiàng)目相比,這個(gè)項(xiàng)目相當(dāng)簡單,,但它是學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)如何工作的良好起點(diǎn),。 項(xiàng)目實(shí)現(xiàn)是在沒有任何庫的純 Swift 中,并且很容易模仿,。 ▌Deep Exemplar-Based Colorization 它是第一個(gè)使用深度學(xué)習(xí)的基于樣本的局部著色工具,。 給定參考的彩色圖像后,我們的卷積神經(jīng)網(wǎng)絡(luò)直接將灰度圖像映射到輸出彩色圖像,。 這是基于 Deep Exemplar-based Colorization 論文的實(shí)現(xiàn),。 |
|