久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

最全數(shù)據(jù)科學(xué)C/C++機器學(xué)習(xí)庫整理,,再也不用百度搜了

 高山流韻 2020-10-23

C++在數(shù)據(jù)科學(xué)及大數(shù)據(jù)中到底有多重要,?

引言和動機--為什么是C++?

C++是動態(tài)負(fù)載平衡,、自適應(yīng)緩存、開發(fā)大型數(shù)據(jù)框架和庫的理想選擇,。谷歌的MapReduce,,MunGDB,下面列出的大多數(shù)深度學(xué)習(xí)庫都是用C++實現(xiàn)的,。以超低延遲和極高吞吐量著稱的Scylla,,使用C++作為Apache Casand and Amazon DynDoDB的替代者進行編碼。

C++作為編程語言(包括內(nèi)存管理,、性能特性和系統(tǒng)編程)的一些獨特優(yōu)勢,,絕對是開發(fā)快速可擴展的數(shù)據(jù)科學(xué)和大數(shù)據(jù)庫最有效的工具之一。

此外,,Julia(由麻省理工學(xué)院開發(fā)的一種編譯的交互式語言)正在成為Python在科學(xué)計算和數(shù)據(jù)處理領(lǐng)域的潛在競爭對手,。其快速處理速度、并行性,、靜態(tài)以及動態(tài)鍵入和用于插入庫的 C++ 綁定功能,,簡化了開發(fā)人員/數(shù)據(jù)科學(xué)家集成和使用 C++ 作為數(shù)據(jù)科學(xué)和大數(shù)據(jù)庫的工作。

1. 來自谷歌AI的TensorFlow

由 Google 開發(fā)的熱門深度學(xué)習(xí)庫,,它擁有自己的工具,、庫和社區(qū)資源生態(tài)系統(tǒng),使研究人員和開發(fā)人員能夠輕松構(gòu)建和部署 ML 支持的應(yīng)用程序,。

官方文檔:https://www./lite/microcontrollers/library

GitHub:https://github.com/tensorflow/serving

2. Berkeley(伯克利)的Caffe

伯克利視覺和學(xué)習(xí)中心開發(fā)了用于快速功能嵌入或 Caffe C++卷積架構(gòu)的深度學(xué)習(xí)框架,。

GitHub:https://github.com/intel/caffe

3. 微軟認(rèn)知工具包 (CNTK)

微軟認(rèn)知工具包是一個統(tǒng)一的深度學(xué)習(xí)工具包,它通過定向圖幫助將神經(jīng)網(wǎng)絡(luò)翻譯為一系列計算步驟。

GitHub:https://github.com/microsoft/CNTK

4. mlpack 庫

mlpack是一個快速,、靈活的機器學(xué)習(xí)庫,,用 C++編寫,提供具有 Python 綁定,、Julia 綁定和 C++ 類的最先進的機器學(xué)習(xí)算法,。

GitHub:https://github.com/mlpack/mlpack

5. DyNet

動態(tài)神經(jīng)網(wǎng)絡(luò)工具包(支持動態(tài)計算圖形)或 DyNet 是一種用 C++ (在 Python 中具有綁定)編寫的高性能神經(jīng)網(wǎng)絡(luò)庫,可以在 CPU 或 GPU 上高效運行,。它支持自然語言處理,、圖形結(jié)構(gòu)、強化學(xué)習(xí)等,。

GitHub:https://github.com/clab/dynet

6. Shogun

Shogun 是一個開源機器學(xué)習(xí)庫,,它提供廣泛的高效和統(tǒng)一的機器學(xué)習(xí)方法,如多種數(shù)據(jù)表示,、算法類和通用工具的組合,,用于快速原型設(shè)計數(shù)據(jù)管道。

GitHub:https://github.com/shogun-toolbox/shogun

7. FANN

快速人工神經(jīng)網(wǎng)絡(luò)(FANN)是C語言中的多層人工神經(jīng)網(wǎng)絡(luò),,支持完全連接和稀疏連接的網(wǎng)絡(luò),。它支持固定點和浮點中的跨平臺執(zhí)行。此外,,它還支持基于拓?fù)涞牟粩喟l(fā)展訓(xùn)練和基于反傳播的DL模型培訓(xùn),。

GitHub:https://github.com/libfann/fann

8. OpenNN

開放神經(jīng)網(wǎng)絡(luò) (OpenNN) 是一個開源 (C/C++) 神經(jīng)網(wǎng)絡(luò)高性能庫,用于高級分析,,支持分類,、回歸、預(yù)測等,。

GitHub:https://github.com/Artelnics/opennn

9. SHARK庫

Shark 是一個快速,、模塊化、通用的開源機器學(xué)習(xí)庫 (C/C++),,用于應(yīng)用和研究,,支持線性和非線性優(yōu)化、基于內(nèi)核的學(xué)習(xí)算法,、神經(jīng)網(wǎng)絡(luò)以及各種其他機器學(xué)習(xí)技術(shù),。

GitHub:https://github.com/Shark-ML/Shark

10. Armadillo

Armadillo 是一個線性代數(shù) (C/C++) 庫,其功能類似于 Matlab,。該庫以快速將研究代碼轉(zhuǎn)換為生產(chǎn)環(huán)境,、模式識別、計算機視覺,、信號處理,、生物信息學(xué),、統(tǒng)計學(xué)、計量經(jīng)濟學(xué)等而著名,。

最全數(shù)據(jù)科學(xué)C/C++機器學(xué)習(xí)庫整理,再也不用百度搜了

11. Faisis

faiss:此庫(C/C++)用于高效相似性搜索和密集向量聚類,。它包含以任何大小的向量集進行搜索的算法,,這些向量可能不適合 RAM 中的矢量集。它還支持通過 CUDA 提供的可選 GPU 和可選 Python 接口,。

GitHub:https://github.com/facebookresearch/faiss

12.隨機森林

  • https://github.com/zhufangzhou/RandomForest

  • https://github.com/bjoern-andres/random-forest

13. Boosting

XGBoost – 并行優(yōu)化的通用梯度提升庫,。

GitHub:https://github.com/dmlc/xgboost

ThunderGBM – 用于 GPU 上的 GBDTs 和隨機森林的快速庫。

GitHub:https://github.com/Xtra-Computing/thundergbm

LightGBM – 基于決策樹算法的快速,、分布式,、高性能梯度提升(GBDT、GBRT,、GBM 或 MART)框架,,用于排名、分類和許多其他機器學(xué)習(xí)任務(wù),。

GitHub:https://github.com/Microsoft/LightGBM

CatBoost – 決策樹庫上的通用梯度提升,,具有開箱即用的分類功能支持。它易于安裝,,包含快速推理實現(xiàn),,并支持 CPU 和 GPU(甚至多 GPU)計算。

GitHub:https://github.com/catboost/catboost

14. 推薦系統(tǒng)

Recommender(推薦) – 一個 C 語言庫,,使用協(xié)作過濾(CF)進行產(chǎn)品推薦/建議,。

GitHub:https://github.com/GHamrouni/Recommender

混合推薦系統(tǒng) – 基于scikit學(xué)習(xí)算法的混合推薦系統(tǒng)。

GitHub:https://github.com/SeniorSA/hybrid-rs-trainner

15. 自然語言處理

BLLIP 解析器 -- BLLIP 自然語言解析器(也稱為查尼亞克 -約翰遜解析器),。

GitHub:https://github.com/BLLIP/bllip-parser

colibri-core -- C++庫,、命令行工具和 Python 綁定,用于快速,、高效記憶地提取和處理基本語言結(jié)構(gòu)(如 n-gram 和 skiagram),。

GitHub:https://github.com/proycon/colibri-core

CRF++ -- 用于分段/標(biāo)記順序數(shù)據(jù)的條件隨機字段 (CLF) 的開源實現(xiàn)和其他自然語言處理任務(wù)。[已棄用]

GitHub:https://github.com/taku910/crfpp

CRFsuite -- CRFifsuite 是用于標(biāo)記順序數(shù)據(jù)的條件隨機字段 (CLF) 的實現(xiàn),。[已棄用]

GitHub:https://github.com/chokkan/crfsuite

CRF 模型 -- 基于不同深度學(xué)習(xí)的 CRF模型,。frog --為荷蘭語開發(fā)的基于內(nèi)存的NLP套件:PoS 標(biāo)記器、lemmatizer,、依賴分析器,、NER、淺層解析器,、形態(tài)分析儀,。

GitHub:https://github.com/topics/crf-model

MeTA -- ModErn 文本分析是一個 C++ 數(shù)據(jù)科學(xué)工具包,,有助于挖掘大文本數(shù)據(jù),包括文本標(biāo)記化,,包括解析樹,、主題模型、分類算法,、圖形算法,、語言模型、多線程算法等深層語義功能,。

官方文檔:https:///

MIT信息提取工具包 -- C,、C++ 和 Python 工具,用于命名實體識別和關(guān)系提取

GitHub:https://github.com/mit-nlp/MITIE

ucto -- 用于各種語言的 Unicode 感知正則表達(dá)式標(biāo)記器,、工具和C++庫,,支持 FoLiA 格式。

GitHub:https://github.com/LanguageMachines/ucto

16. 數(shù)據(jù)流挖掘

StreamDM: 適用于挖掘支持以下算法的大數(shù)據(jù)流,。

GitHub:https://github.com/huawei-noah/streamDM-Cpp

SGD 學(xué)習(xí)者和感知器:

  • 樸素貝葉斯

  • CluStream

  • Hoeffding決策樹

  • Bagging

  • 流KM ++

數(shù)據(jù)產(chǎn)生器:

  • HyperplaneGenerator

  • RandomTreeGenerator

  • RandomRBFGenerator

  • RandomRBFEventsGenerator

17. 數(shù)據(jù)結(jié)構(gòu)/圖形/動態(tài)編程算法

GitHub:https://github.com/TheAlgorithms/C-Plus-Plus

18. 通用機器學(xué)習(xí)

Darknet -- Darknet是一個開源神經(jīng)網(wǎng)絡(luò)框架,,用 C 和 CUDA 編寫,支持 CPU 和 GPU 計算,。

GitHub:https://github.com/pjreddie/darknet

cONNXr -- ONNX 運行時以純 C (99) 編寫,,零依賴關(guān)系集中在小型嵌入式設(shè)備上。對機器學(xué)習(xí)模型進行推理,,無論您使用哪個框架進行訓(xùn)練,。易于安裝和編譯無處不在,即使在非常舊的設(shè)備,。

GitHub:https://github.com/alrevuelta/cONNXr

BanditLib -- 一個簡單的多臂Bandit庫,。[已棄用]

GitHub:https://github.com/jkomiyama/banditlib

CUDA -- 這是一個快速 C++/CUDA 實現(xiàn)卷積深度學(xué)習(xí)

官方文檔:https://code.google.com/p/cuda-convnet/

DeepDetect -- 一個用 C++ 11編寫的機器學(xué)習(xí)API和服務(wù)器。它使最先進的機器學(xué)習(xí)易于使用并集成到現(xiàn)有應(yīng)用程序中,。

GitHub:https://github.com/jolibrain/deepdetect

分布式機器學(xué)習(xí)工具包 (DMTK) -- 微軟的分布式機器學(xué)習(xí)(參數(shù)服務(wù)器)框架,。在多臺機器上啟用大型數(shù)據(jù)集的訓(xùn)練模型。與它捆綁的當(dāng)前工具包括:LightLDA 和分布式(多感)字嵌入,。

官網(wǎng):https://www./(已停用)

DLib -- 一套 ML 工具,,設(shè)計為易于在其他應(yīng)用中安裝。

官網(wǎng):http:///ml.html

DSSTNE -- 由亞馬遜創(chuàng)建的軟件庫,,用于使用 GPU 訓(xùn)練和部署深度神經(jīng)網(wǎng)絡(luò),,該軟件庫強調(diào)速度和擴展性,而不是實驗靈活性,。

GitHub:https://github.com/amazon-archives/amazon-dsstne

Fido -- 用于嵌入式電子和機器人技術(shù)的高度模塊化 C++ 機器學(xué)習(xí)庫,。

GitHub:https://github.com/FidoProject/Fido

igraph -- 通用圖形庫。

官方文檔:https:///

英特爾DAAL -- 由英特爾開發(fā)并針對英特爾架構(gòu)進行優(yōu)化的高性能軟件庫,。庫為數(shù)據(jù)分析的所有階段提供了算法構(gòu)建塊,,并允許以批處理,,聯(lián)機和分布式模式處理數(shù)據(jù)。

GitHub:https://github.com/oneapi-src/oneDAL

libfm -- 一種通用方法,,可以通過特征工程模擬大多數(shù)分解模型,。

GitHub:https://github.com/srendle/libfm

MLDB -- 機器學(xué)習(xí)數(shù)據(jù)庫是為機器學(xué)習(xí)而設(shè)計的數(shù)據(jù)庫。通過RESTful API發(fā)送命令以存儲數(shù)據(jù),,使用SQL探索數(shù)據(jù),,然后訓(xùn)練機器學(xué)習(xí)模型,并將其公開為API,。

官方文檔:https:///

MXNet -- 具有動態(tài),可感知突變的Dataflow Dep Scheduler的輕量,,便攜式,,靈活的分布式/移動深度學(xué)習(xí);適用于Python,,R,,Julia,Go,,Javascript等,。

GitHub:https://github.com/apache/incubator-mxnet

proNet-core -- 通用網(wǎng)絡(luò)嵌入框架:成對表示優(yōu)化Network Edit。

GitHub:https://github.com/cnclabs/proNet-core

PyCUDA -- CUDA的Python接口

官方文檔:https://mathema./software/pycuda/

ROOT -- 模塊化的科學(xué)軟件框架,。它提供了處理大數(shù)據(jù)處理,,統(tǒng)計分析,可視化和存儲所需的所有功能,。

官網(wǎng):https://root./

sofia-ml -- 快速增量算法套件,。

官網(wǎng):https://code.google.com/archive/p/sofia-ml

Stan -- 一種概率編程語言,利用漢密爾頓蒙特卡洛采樣實現(xiàn)完整的貝葉斯統(tǒng)計推斷,。

官方文檔:https:///

Timbl -- 一種軟件包/ C ++庫,,實現(xiàn)了幾種基于內(nèi)存的學(xué)習(xí)算法,其中IB1-IG是k最近鄰分類的實現(xiàn),,而IGTree是IB1-IG的決策樹近似,,常用于NLP。

GitHub:https://languagemachines./timbl/

Vowpal Wabbit(VW) -- 一個快速的核心學(xué)習(xí)系統(tǒng),。

GitHub:https://github.com/VowpalWabbit/vowpal_wabbit

Warp-CTC -- 在CPU和GPU上快速并行地實現(xiàn)連接主義時間分類(CTC),。

GitHub:https://github.com/baidu-research/warp-ctc

ThunderSVM -- 在GPU和CPU上的快速SVM庫。

GitHub:https://github.com/Xtra-Computing/thundersvm

LKYDeepNN -- 僅標(biāo)頭的 C++11 神經(jīng)網(wǎng)絡(luò)庫,。低依賴性,,本地繁體中文文檔。

GitHub:https://github.com/mosdeo/LKYDeepNN

xLearn -- 高性能,,易于使用且可擴展的機器學(xué)習(xí)套件,,可用于解決大規(guī)模的機器學(xué)習(xí)問題,。 xLearn對于解決大規(guī)模稀疏數(shù)據(jù)上的機器學(xué)習(xí)問題特別有用,這在Internet服務(wù)(例如在線廣告和推薦系統(tǒng))中非常常見,。

GitHub:https://github.com/aksnzhy/xlearn

Featuretools –一個用于自動特征工程的庫,。它擅長使用可重復(fù)使用的特征工程“基元”將事務(wù)和關(guān)系數(shù)據(jù)集轉(zhuǎn)換為用于機器學(xué)習(xí)的特征矩陣。

GitHub:https://github.com/FeatureLabs/featuretools

skynet -- 用于學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的庫,,具有C接口,,在JSON中設(shè)置了網(wǎng)。用C ++編寫,,并使用Python,,C ++和C#進行綁定。

GitHub:https://github.com/Tyill/skynet

Feast -- 用于管理,,發(fā)現(xiàn)和訪問機器學(xué)習(xí)功能的功能存儲,。 Feast可為模型訓(xùn)練和模型服務(wù)提供一致的特征數(shù)據(jù)視圖。

GitHub:https://github.com/feast-dev/feast

Hopsworks -- 具有AI的數(shù)據(jù)密集型平臺,,具有業(yè)界首個開源功能存儲,。 Hopsworks Feature Store既提供了用于基于Apache Hive進行培訓(xùn)和批處理的功能庫,又為在線應(yīng)用程序提供了基于MySQL Cluster的功能服務(wù)數(shù)據(jù)庫,。

GitHub:https://github.com/logicalclocks/hopsworks

Polyaxon -- 一個可重現(xiàn)和可擴展的機器學(xué)習(xí)和深度學(xué)習(xí)的平臺,。

GitHub:https://github.com/polyaxon/polyaxon

sara -- C ++計算機視覺庫,具有易于理解且高效的計算機視覺算法實現(xiàn),。 [Mozilla Public License版本2.0]

GitHub:https://github.com/DO-CV/sara

ANNetGPGPU -- 基于GPU(CUDA)的人工神經(jīng)網(wǎng)絡(luò)庫,。 [LGPL]

GitHub:https://github.com/ANNetGPGPU/ANNetGPGPU

btsk -- 游戲行為樹入門套件。 [zlib]

GitHub:https://github.com/aigamedev/btsk

Evolving Objects -- 基于模板的ANSI-C++演化計算庫,,可幫助您快速地編寫自己的隨機優(yōu)化算法,。 [LGPL]

官網(wǎng):http://eodev./

frugally-deep -- 只使用C++中的 KARAS 模型的頭文件庫。[MIT]

GitHub:https://github.com/Dobiasd/frugally-deep

Genann -- C中的簡單神經(jīng)網(wǎng)絡(luò)庫,。[zlib]

GitHub:https://github.com/codeplea/genann

PyTorch -- 具有強大GPU加速功能的Python中的張量和動態(tài)神經(jīng)網(wǎng)絡(luò),。

GitHub:https://github.com/pytorch/pytorch

Recast / Detour --(3D)導(dǎo)航網(wǎng)格生成器和探路器,主要用于游戲,。 [zlib]

GitHub:https://github.com/recastnavigation/recastnavigation

tiny-dnn -- 在C++11中僅有標(biāo)頭,,無依賴項的深度學(xué)習(xí)框架。 [BSD]

GitHub:https://github.com/tiny-dnn/tiny-dnn

Veles -- 用于快速深度學(xué)習(xí)應(yīng)用程序開發(fā)的分布式平臺,。 [Apache]

GitHub:https://github.com/DingKe/veles

Kaldi -- 語音識別工具包,。 [Apache]

GitHub:https://github.com/kaldi-asr/kaldi

19. 計算機視覺

CCV -- 基于 C/緩存/核心計算機視覺庫,一個現(xiàn)代計算機視覺庫,。

GitHub:https://github.com/liuliu/ccv

VLFeat -- VLFeat 是一個開放和便攜式的計算機視覺算法庫,,它具有 Matlab 工具箱。

官方文檔:https://www./

EBLearn -- Eblearn 是一個面向?qū)ο蟮?C++庫,,實現(xiàn)各種機器學(xué)習(xí)模型 [棄用]

官網(wǎng):http://eblearn./

OpenCV -- OpenCV 具有C++,、C,、Python、Java 和 MATLAB 接口,,并支持 Windows,、Linux、Android 和 Mac 操作系統(tǒng),。

官方文檔:https:///

VIGRA -- VIGRA 是一種通用的C++計算機視覺和機器學(xué)習(xí)庫,,用于使用 Python 綁定實現(xiàn)任意維數(shù)。

GitHub:https://github.com/ukoethe/vigra

Openpose -- 一個實時多人關(guān)鍵點檢測庫,,用于身體,、面部、手和腳的評估,。

GitHub:https://github.com/CMU-Perceptual-Computing-Lab/openpose

20. Facebook 研究的FlashLight

FlashLight是一個快速,、靈活的機器學(xué)習(xí)庫,完全由Facebook AI Research Speech團隊以及Torch和Deep Speech的創(chuàng)建者以C++編寫而成,。

GitHub:https://github.com/facebookresearch/flashlight

21. 阿里巴巴的MNN(移動神經(jīng)網(wǎng)絡(luò))

MNN 是一個高效、輕量級的深度學(xué)習(xí)框架,。它支持深度學(xué)習(xí)模型的推理和培訓(xùn),,具有業(yè)界領(lǐng)先的設(shè)備推理和訓(xùn)練性能。

Gitee:https:///mirrors/mnn

22. Facebook 研究的Habitat-SIM

Habitat-SIM (C++) 庫允許在高度逼真的和高效的 3D 模擬器中培訓(xùn)體現(xiàn)的 AI 代理 (虛擬機器人),, 然后再將學(xué)到的技能轉(zhuǎn)移到現(xiàn)實中,。它使用靜態(tài)數(shù)據(jù)集(例如 ImageNet、COCO,、VQA)與 AI,,其中代理通過從中學(xué)習(xí)在現(xiàn)實環(huán)境中工作。

GitHub:https://github.com/facebookresearch/habitat-sim

--END--

注:文中大部分庫的鏈接可以直接訪問,,部分則需要訪問外網(wǎng)~

這應(yīng)該是最全的數(shù)據(jù)科學(xué)C++機器學(xué)習(xí)庫匯總了

如果大家覺得有用,,記得點贊、收藏哈~

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請點擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多