新浪微博(網(wǎng)頁版搜索):Jenny愛學(xué)習(xí)
微信公眾號:R語言數(shù)據(jù)分析與實踐
更新時間:Feb 1st,,2019
R語言由近幾年隨著數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)在國內(nèi)興起而大熱,,現(xiàn)在R已經(jīng)發(fā)展成為一個社區(qū)語言,,有者非常多的packages支持工程應(yīng)用,幾乎任何問題都可以在R的packages中找到解決方案,,這是R優(yōu)于SPSS和SAS(模塊化分析)的一個強(qiáng)大功能,。此外,對于沒有編程基礎(chǔ)的統(tǒng)計學(xué)和金融學(xué)領(lǐng)域分析人員,,R語言以較易的代碼任務(wù)而勝過python(需要專門訓(xùn)練的編程項目),。
目前在CRAN和GitHub上的packages大約超過1萬個。整理了一些常見學(xué)科使用頻率較高的packages:
教育類
beginr:R初學(xué)者函數(shù)
BIFIEsurvey:教育中的調(diào)查統(tǒng)計工具,。
lessR:可視化,、描述性統(tǒng)計分析教學(xué)
dslabs:可用于數(shù)據(jù)科學(xué)課程和講習(xí)班的數(shù)據(jù)集和函數(shù)可用于數(shù)據(jù)分析實踐、作業(yè)和項目,。
Chaos Game:混沌游戲,。
childesr:實現(xiàn)對CHILDES(開放式親子互動記錄庫)的接口
earnr:支持使用markdown等工具創(chuàng)建交互式的教材,進(jìn)行R和R包的學(xué)習(xí)
olsrr:輔助進(jìn)行普通最小二乘回歸的學(xué)習(xí)和實踐
rODE:內(nèi)置大量函數(shù),,展示學(xué)生的一些自然狀態(tài)下的表現(xiàn),,如常微分方程如何求解,,如何更有效的構(gòu)建方程等。
repurrrsive:包含R對象,、JSON和XML的形式遞歸的列表,,用于在教學(xué)中使用示例,包括調(diào)色板,、GitHub庫等
工具類
tidyxl:閱讀不整潔的excel文件
stevedore:Docker客戶端
RMySQL:MySQL驅(qū)動接口
pagedown:CSS格式與HTML輸出
tmap:專題地圖
dataPreparation:數(shù)據(jù)準(zhǔn)備
htmlTable:Markdown/HTML標(biāo)記工具
OpenImageR:圖片處理工具
REKKL:在R中使用KEEL代碼
smartdata:數(shù)據(jù)預(yù)處理
cdata:流體數(shù)據(jù)轉(zhuǎn)換
abstractr:用于創(chuàng)建抽象視覺的shiny應(yīng)用
kutils:項目管理工具
pkgnet:獲取R包的網(wǎng)絡(luò)表示
rsparkingling:H2O接口
geoknife:大型網(wǎng)格化數(shù)據(jù)集的網(wǎng)絡(luò)處理
MazamaSpatialUtils:空間數(shù)據(jù)下載
cleanerR:缺失值處理
SQRL:與基于ODBC協(xié)議的數(shù)據(jù)庫交互的接口,。
crul:HTTP客戶端
bitsqueezr:提供用于精確保持壓縮的浮點量化算法的實現(xiàn)。
timeR:為代碼運算計時
OpenCL:OpenCL的R調(diào)用界面
Ohmage:Ohmage2服務(wù)器的R客戶端
httr:URL和http工具
httptest:http請求測試環(huán)境
pkgsearch:在CRAN中查找R包
googleAnalyticsR:谷歌分析API
AzureContainers:微軟云計算工具Azure接口界面
AzureStor:Azure中數(shù)據(jù)的存儲和管理
AzureVM:通過Azure實現(xiàn)數(shù)據(jù)科學(xué)的虛擬技術(shù),。
spatialwidget: 將空間數(shù)據(jù)轉(zhuǎn)換為網(wǎng)頁支持的JSON格式,。
codetools:R代碼分析工具
bookdown:使用R Markdown編寫圖書和技術(shù)文檔。
expss:從電子表格和SPSS中讀取數(shù)據(jù),、標(biāo)簽,、函數(shù)等。
romero.gateway: OMERO接口,。
surveydata:調(diào)查數(shù)據(jù)處理工具,。
httpuv:提供了用于處理http和服務(wù)器端的簡單套接字和協(xié)議。
多邊形符號數(shù)據(jù)分析
psda:GeoJSON:GeoJSON和簡單的功能,,對象之間進(jìn)行轉(zhuǎn)換,。
rvcheck:R、R包版本檢查
rsppfp:R的最短路徑問題
pkgdown:將用戶文件制作為靜態(tài)html文檔
gcite:谷歌引用解析器
farver:調(diào)用顏色空間實現(xiàn)顏色轉(zhuǎn)換
DatapackageR: 提供一個框架,,支持以可重現(xiàn)的方式構(gòu)造R數(shù)據(jù)包.
hedgehog: 允許用戶根據(jù)隨機(jī)生成的輸入測試其程序的屬性,,與單元測試相比,提供了更優(yōu)越的測試覆蓋率.
jsonstat: 實現(xiàn)JSON-stat的接口,,JSON-stat是一種簡單,、輕量級的“JSON”格式,用于數(shù)據(jù)傳播.
nseval: 提供用于惰性和非標(biāo)準(zhǔn)評估的API,,該API具有捕獲,、檢查、操作和創(chuàng)建惰性值,、“…”列表和活動調(diào)用的功能.
runner: 提供具有不同窗口大小的運行函數(shù)(窗口化,、滾動、累積)和R向量的缺少處理選項.
RTest: 提供基于XML的測試框架,,用于為監(jiān)管環(huán)境開發(fā)的R軟件包的自動化組件測試.
dataCompare:用于比較兩個表格數(shù)據(jù)對象的函數(shù), 其目的是顯示差異,,從而使理解差異更容易。
datastructures:提供先進(jìn)的數(shù)據(jù)結(jié)構(gòu),,如哈希圖
catch:對多維數(shù)組進(jìn)行分類和變量選擇的功能
dplyr:本地數(shù)據(jù)集的常用操作
jsonlite:良好的網(wǎng)絡(luò)API接口,,適用于收集JSON數(shù)據(jù)
AWR:安裝編譯的Java模塊
filesstrings:提供了多個工具操作字符和文件
ggraph:提供了多個函數(shù),擴(kuò)展ggplot2的可視化功能
經(jīng)濟(jì)
BCDating:商業(yè)周期和繪制工具
busdater:企業(yè)標(biāo)準(zhǔn)數(shù)據(jù)計算
riskParityPortfolio:金融投資的風(fēng)險均衡投資組合的快速設(shè)計,。
bayesm:市場/微觀經(jīng)濟(jì)學(xué)貝葉斯推斷
PortfolioAnalytics:投資組合分析函數(shù)庫(包括投資組合優(yōu)化等方法)
alphavantager :提供了alpha vantage API,,可以獲取股票,、物理貨幣和數(shù)字貨 幣等歷史交易數(shù)據(jù)。
estudy2:實現(xiàn)了事件研究模型,,包括收益率估計和其他經(jīng)典模型,。
音樂
chorrrds:音樂和旋提取
tabr:支持通過R代碼生成樂譜
bioacoustics:錄音數(shù)據(jù)分析,同時可以提取動物聲音,、處理常見格式聲音,、過濾有噪聲的文件
billboard 包含了從1960年到2016年公告牌百強(qiáng)榜單上歌曲的數(shù)據(jù)集,包括給定年份的排名,、音樂特征和歌詞,。
地理
NLMR:模擬自然地形模型
landscapemetrics:分類地圖
GSIF:全球土壤信息設(shè)施
HelperMG:地球氣息分析工具
filedRS: 利用Olofsson等人提出的最佳實踐, 為遙感現(xiàn)場工作提供支持.
rayshader: 提供使用光線跟蹤、球面紋理映射,、朗伯反射和環(huán)境遮擋的組合的函數(shù),,以生成高程矩陣的山體陰影,包括水檢測和分層功能,、可編程調(diào)色板生成,、內(nèi)置紋理,、2D和3D繪圖選項等.
mapsapi:提供了谷歌地圖數(shù)據(jù)接口
公益
PetfindR: 可以從Petfinder(北美最大的在線搜索可領(lǐng)養(yǎng)動物和動物福利組織數(shù)據(jù)庫)中提取數(shù)據(jù)和交互
學(xué)術(shù)語義
microdemic:支持在Microsoft Academ Graph中對學(xué)術(shù)文章的程序化訪問,。
交互
mapdeck: 提供使用Mapbox GL(用于交互式地圖的JavaScript庫)和Deck.gl(使用WebGL可視化大型數(shù)據(jù)集的JavaScript庫)繪制交互式地圖的機(jī)制.
rayshader: 提供使用光線跟蹤、球面紋理映射,、朗伯反射和環(huán)境遮擋的組合的函數(shù),,以生成高程矩陣的山體陰影,包括水檢測和分層功能,、可編程調(diào)色板生成,、內(nèi)置紋理、2D和3D繪圖選項等.
sigmajs: 提供sigma.js圖形可視化庫的接口訪問.
GoogleVis API在R制作網(wǎng)頁HRML,,調(diào)用Google charts作圖,,交互式的HTML圖表
Manipulate:人際互動
Rcharts:用R與javascript做交互式可視化產(chǎn)品
Shiny:制作嵌入網(wǎng)頁的交互式R程序平臺
Solidify:制作和發(fā)布基于R的報告
shinyalert:提供在shiny中創(chuàng)建美觀UI的功能
自然語言處理
tidyxl:閱讀不整潔的excel文件
pdftools:pdf格式文本處理工具
quanteda:文本數(shù)據(jù)的定量分析
languageR:語言學(xué)數(shù)據(jù)分析工具
sigr:報道中的簡明、正確,、統(tǒng)計摘要方法
lhs:拉丁超多維數(shù)據(jù)集示例及研究方法
readr:讀取文本數(shù)據(jù)
CRF:條件隨機(jī)場,。是一種無向圖模型,它的目標(biāo)是尋找在條件概率最大情況下的一種組合,,應(yīng)用于命名實體識別,、文本淺層分析等信息抽取任務(wù)等實驗,實現(xiàn)句法語義自動標(biāo)注,?;谀J狡ヅ洹C(jī)器學(xué)習(xí),、支持向量機(jī)等方法,??捎糜趶?fù)雜的最長名詞短語識別、漢語詞法分析研究,。
tm: 文本挖掘
jiebaR:中文分詞工具,本身是C++寫的,,具有極高的運算處理速度
Rwordseg:中文分詞工具,Mac版依賴舊版本的Java,,較難安裝,,版本更新慢,不推薦使用
chinese.misc:中文分詞工具,,內(nèi)核基于Rwordseg
rmmseg4j:
snowball:英文詞干化
lexiconPT:為情緒分析提供對葡萄牙詞匯的訪問
wordmatch:用于兩個word文本對照
readtext:支持文本文件導(dǎo)入,,
.csv,.tab,.json,.xml,.pdf,.docx,.xls,.xlsx
officer:在R中對PPT、Word文件導(dǎo)入,、導(dǎo)出,、編輯
在線數(shù)據(jù)API
getTBinR:獲取世衛(wèi)組織結(jié)核病數(shù)據(jù)
UCSCXenaTools:從UCSC Xena數(shù)據(jù)庫獲取數(shù)據(jù)和探索分析
congressbr:巴西聯(lián)邦參議院和眾議院的立法數(shù)據(jù)
taxize:網(wǎng)絡(luò)分類信息
rdbnomics:下載DBnomics數(shù)據(jù)
rehydratoR:從Tweets中下載推文
RSmartlyIO:從Facebook和Instagram廣告中下載數(shù)據(jù)
googledrive:GoogleDrive接口
streamR:Twitter Streaming API
crypto:加密貨幣市場數(shù)據(jù)
rnrfa:英國國家河流數(shù)據(jù)檔案API
arkdb: 提供將表從關(guān)系數(shù)據(jù)庫連接、導(dǎo)出到壓縮文本文件中的功能,,并將這些文本文件導(dǎo)入數(shù)據(jù)庫,,而無需將整個表放入工作內(nèi)存中.
dobson:GLM書本數(shù)據(jù)
cancensus:從“CensusMapper”API獲取加拿大人口普查數(shù)據(jù)和地理信息
sparkbq: 通過提供與Google BigQuery的集成來擴(kuò)展sparklyr.它支持從/向BigQuery直接導(dǎo)入/導(dǎo)出,及從Google云存儲中提取中間數(shù)據(jù)等功能.
sigmajs: 提供sigma.js圖形可視化庫的接口訪問.
aws.kms: 實現(xiàn)AWS密鑰管理服務(wù)(用于管理加密密鑰的云服務(wù))的接口.
vapour: 提供對地理空間數(shù)據(jù)抽象庫GDAL的低級訪問.
nsapi:Nederlandse Spoorwegen(荷蘭鐵路)API接口. 用戶可下載當(dāng)前站點的出發(fā)時間,、站點列表,、每個站點的旅行建議等數(shù)據(jù).
repec: 通過RESTful API訪問RePEc(經(jīng)濟(jì)學(xué)研究論文)
rfacebookstat: Facebook營銷API借口, 允許用戶多種方式加載數(shù)據(jù).
UCSCXenaTools: 頂級基因庫. 支持對USCS Xena數(shù)據(jù)中心等數(shù)據(jù)訪問. 是UCSC托管等公共數(shù)據(jù)庫的集合.
ZipRadius: 當(dāng)給定起始郵政編碼和半徑(單位:英里)時, 在該數(shù)據(jù)框下, 可生成對于等美國郵政編碼及其到給定郵政編碼的距離.
essurvey:歐洲社會調(diào)查(European Social Survey)下載所需數(shù)據(jù)
mleap:為MLeap提供了sparklyr擴(kuò)展,可以導(dǎo)出Apache Spark管道
rdfp:提供谷歌DFP(DoubleClick for Publishers)的訪問接口
hdf5r:提供一個使用R6類的HDF5 API的面向?qū)ο蟀b器。
odbc:可以使用DBI接口來創(chuàng)建一個數(shù)據(jù)庫連接,只要滿足ODBC連接即可使用此包進(jìn)行便 捷的連接功能,。
RMariaDB:實現(xiàn)與MariaDB and MySQL數(shù)據(jù)庫兼容的DBI接口,。
geoops v0.1.2: 提供針對用GeoJSON地理空間數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換的工具.
linl v0.0.2: 添加LaTeX字符類到rmarkdown,使用與rmarkdown相適應(yīng)的pandoc-letter模板.
rcreds v0.6.6: 提供從加密文件讀取和寫入憑證的功能.
RMariaDB v1.0-2: 實現(xiàn)與MariaDB and MySQL數(shù)據(jù)庫兼容的DBI接口.
securitytxt v0.1.0: 提供識別和解析security.txt文件的工具,使之能夠分析并采用Web安全策略草案標(biāo)準(zhǔn).
usethis v1.1.0: 自動化包和項目設(shè)置任務(wù),包括建立單元測試,測試覆蓋率,,持續(xù)集成,Git,,GitHub,,許可證,RStudio項目等等,,否則需要手動執(zhí)行.
xltabr v0.1.1: 它提供了可以使用[openxlsx](https://cran.r -project.org/package= openxlsx)來生成良好格式化的跨列表的函數(shù),,它已經(jīng)被開發(fā)用來幫助自動化發(fā)布官方統(tǒng)計數(shù)據(jù)
photobiologySun:提供外星太陽光譜輻照度、地平面太陽光譜輻照度的數(shù)據(jù)
Matrix
MASS
gsl
polynom
signal
GetLattesData:實現(xiàn)了一個API,,支持從Lattes直接下載和讀取XML數(shù)據(jù)
數(shù)學(xué)
Rpolyhedra:多面體數(shù)據(jù)庫
CovTools:協(xié)方差分析的統(tǒng)計工具
pointdexter:多邊形內(nèi)的標(biāo)簽點
GMMAT:廣義線性混合模型關(guān)聯(lián)試驗
fromo:支持向量和矩陣的計算,,以及矩陣的單點追加。
plsdof:最小二乘回歸
mpoly:多項式計算
MonteCarlo:蒙特卡洛模擬方法
mlogit:多項式邏輯模型
bigalgebra:矩陣及大型矩陣計算,。
Delaporte:Delaporte分布統(tǒng)計函數(shù)
doremi: 支持利用微分方程和線性混合效應(yīng)回歸函數(shù)來估計方程的特征參數(shù).
bivariate : 提供用于構(gòu)造,、繪制雙變量概率分布的便捷函數(shù).
eikosograms: eikosogram(來自古希臘ε?κ?σ的概率圖 )將單位正方形劃分為矩形區(qū)域,,其區(qū)域、邊和寬度表示與一個或多個分類變量的值相關(guān)聯(lián)的各種概率.
freegroup:支持進(jìn)行抽象數(shù)學(xué)(抽象代數(shù))的相關(guān)分析與應(yīng)用
SimCorrMix:提供生成具有特定相關(guān)矩陣等連續(xù)(正態(tài),、非正態(tài),、混合分布)、二元,、有序變量的方法等
可視化
gganimate:在R中繪制動態(tài)圖
IPWboxplot:存在缺失對象的箱型圖繪制
OutliersO3:繪制異常值O3圖
handyplots:快速繪制圖形,,Q-Q圖、箱型圖,、置信區(qū)間等
WVPlots:常見數(shù)據(jù)分析可視化繪制
gplots:提供可視化數(shù)據(jù)繪制工具
vioplot:小提琴圖
rainbow:條形圖,、箱型圖、彩虹圖繪制
treemapify:在ggplot2中繪制樹狀圖
ezplot:常見圖表繪制函數(shù)集
spaceRGB:RGB定義工具
r2d3: 3D可視化工具
discoveR:通過shiny實現(xiàn)的可視化探索性數(shù)據(jù)分析接口,,包括聚類,、主成分分析等
scico:基于科學(xué)色彩地圖的顏色板
DesignLibrary: 提供一個簡單的界面來構(gòu)建設(shè)計,允許用戶在一系列參數(shù)組合(如效果大小,、樣本量和分配概率)之間比較給定設(shè)計的性能.
survsup : 實現(xiàn)繪制生存曲線的函數(shù).
ggjoy
r2d3:利用D3庫進(jìn)行數(shù)據(jù)的動態(tài)和交互式的可視化
rgl:3D可視化
ggplot2:高級繪圖包
ggplotgui:支持shiny app創(chuàng)建和優(yōu)化ggplot2圖形,,并產(chǎn)生要求的R代碼
lattice:高級繪圖包
corrplot
plotly:基于網(wǎng)絡(luò)的ggplot2交互地圖
wordcloud2:繪制詞云
ggjoy:joyplots提供了時間和空間分布的變化
DescriptiveStats.O Beu:包含部分函數(shù)為OpenBudgets.eu數(shù)據(jù)集提供估計和返回可視化所需的相關(guān)參數(shù)。
iheatmapr v0.4.2: 支持繪制復(fù)雜的,、交互式的熱圖.
otvPlots v0.2.0: 支持自動可視化變量分布,,并為大型數(shù)據(jù)集計算時間匯總匯總統(tǒng)計數(shù)據(jù)
統(tǒng)計學(xué)
homomorpheR:同態(tài)計算
HARModel:異構(gòu)自回歸模型
npsm:非參統(tǒng)計建模
GAS:廣義自回歸評分模型
ado:過度分散數(shù)據(jù)分析
riskRegression:風(fēng)險回歸模型與競爭風(fēng)險生存分析的預(yù)測分?jǐn)?shù)
ROCit:基于可視化的二元分類器性能評估
plot3logit:三項式回歸模型的三元圖
weibulltools:生命周期分析。例如汽車?yán)锍虜?shù)
dominanceanalysis:優(yōu)勢分析
nlreg:非線性模型的高階推理
concurve:計算和繪制置信度
pairwise:基于配對算法的Rasch模型參數(shù)
hyper.fit :超平面你和和可視化,。允許用戶產(chǎn)生強(qiáng)大的一維線性類型數(shù)據(jù),、二維平面適合數(shù)據(jù),,以及n維數(shù)據(jù)集的任何(n-1)超平面模型,。
gendist:生成概率分布模型
MVN:多變量的正態(tài)分布檢驗
JointNets:稀疏高斯圖形模型估計、可視化和評價,。
Fstability:有兩個函數(shù)幫助計算特征穩(wěn)定性,。
CPAT:變點分析測試。
glmmboot:混合效應(yīng)和普通模型的模擬抽樣方法,。
miWQS:多重加權(quán)分量分析,。
svydiags:用于調(diào)查數(shù)據(jù)的線性回歸模型診斷。
netmeta:基于頻度的Meta網(wǎng)絡(luò)分析法
rsample:通過函數(shù)和類驗證不同類型的樣本(如交叉驗證)
Rnmr1D : 提供從自由感應(yīng)衰變的原始數(shù)據(jù)處理質(zhì)子核磁共振譜的功能,,參見Jacob et al.
bcaboot: 提供函數(shù)以一種幾乎自動的方式計算bootstrap置信區(qū)間.
blandr:包含進(jìn)行Bland Altman分析功能(也被稱為杜克均值差圖)
cnbdistr:提供條件負(fù)二項分布函數(shù)
dqrng:具有良好統(tǒng)計特性的快速隨機(jī)數(shù)生成器,,包括Mersenne-Twister(64位)、pcg64,、Xoroshiro128,、Xoroshiro256
XGBoost:高效的算法包
cultevo:距離矩陣相關(guān)性等Mantel檢驗
adaptiveGPCA:自適應(yīng)的主成分分析算法實踐
sfdct:支持針對簡單的對象構(gòu)建德勞內(nèi)三角
cnbdistr:條件負(fù)二項分布的分布函數(shù)
llogitstic:密度、分布,、帶參數(shù)的l-logistic分布分位數(shù)和隨機(jī)數(shù)生成函數(shù)
RBest:提供支持貝葉斯證據(jù)合成的工具集,,包括薈萃分析,、歷史數(shù)據(jù)的先驗推 導(dǎo)、操作特性分析
SMM:提供了多狀態(tài)離散時間半馬爾可夫和馬爾可夫模型多模擬和估計功能,。
BayesRS:適用于分層線性貝葉斯模型,,并計算出與savge-dickey密切比有關(guān)的群參數(shù)的貝葉斯因子。
CovTools:提供了幾何和推理工具,,方便分析協(xié)方差結(jié)構(gòu)和多元統(tǒng)計中的協(xié)方差分析,。
emmeans:提供了許多函數(shù),計算線性/廣義線性/混合模型的估計邊際均值(EMMS)
BayesRS v0.1.2: 適用于分層線性貝葉斯模型,,并計算出與savage - dickey密度比有關(guān)的群參數(shù)的貝葉斯因子(見Wetzels et al.(2009).
CatPredi v1.1: 允許用戶通過最大化模型的判別能力,,將連續(xù)預(yù)測變量分類為邏輯推理或Cox比例風(fēng)險回歸設(shè)定,可參見Barrio et al. (2015) and Barrio et al. (2017).
CovTools v0.2.1: 提供了幾何和推理工具,,方便分析協(xié)方差結(jié)構(gòu)和多元統(tǒng)計中的協(xié)方差分析,,可參見Schervish (1987).
genlogis v0.5.0: 對Rathie和Swamee (2006)提出的廣義邏輯回歸分布提供了基本的分布函數(shù).
emmeans v0.9.1: 提供了許多函數(shù),計算線性/廣義線性/混合模型的估計邊際均值(EMMS).
貝葉斯
BayesMallows:基于Mallows Rank模型的貝葉斯偏好
bayesCT:自適應(yīng)貝葉斯臨床試驗的模擬與分析
bssm:非線性和非高斯?fàn)顟B(tài)空間模型的貝葉斯推理
abn:廣義線性模型,、多元線性回歸,、最優(yōu)貝葉斯網(wǎng)絡(luò)模型。
BHSBVAR:構(gòu)造貝葉斯向量自回歸模型,。
RSE:貝葉斯加權(quán)估計,。可用來估計其他生態(tài)樣本中新發(fā)現(xiàn)的稀有物種的數(shù)量
tidybayes: 提供組合數(shù)據(jù)的功能,,以整齊的數(shù)據(jù)格式從貝葉斯模型(JAGS,、Stan、rstanarm,、brms...)中提取,、操作和可視化.
BACCO
bayesm
bayesSurv
LaplacesDemon
MIBayesOpt:提供了一套支持貝葉斯優(yōu)化方法的計算框架,輔助支持向量機(jī),、隨機(jī)森林和極端梯度增強(qiáng)模型優(yōu)化超參數(shù),。
生物醫(yī)學(xué)
BGData:大基因組數(shù)據(jù)分析套件
getTBinR:獲取世衛(wèi)組織結(jié)核病數(shù)據(jù)
ICDS:腫瘤功能障礙鑒定亞途徑,基于DNA甲基化,、復(fù)制數(shù)變異和基因表達(dá)的數(shù)據(jù)
UCSCXenaTools:從UCSC Xena數(shù)據(jù)庫獲取數(shù)據(jù)和探索分析
genoPlotR:繪制人口基因組與基因地圖
bayesCT:自適應(yīng)貝葉斯臨床試驗的模擬與分析
PTE:個性化治療評估,。為個性化的醫(yī)學(xué)模型提供推斷。
NetworkToolbox:腦,、認(rèn)知,、心理網(wǎng)絡(luò)分析方法
MetabolicSurV:利用代謝組學(xué)特征進(jìn)行分類和預(yù)測生存的生物標(biāo)志物驗證方法
cliqueMS:代謝組學(xué)分析工具
simcdm:模擬認(rèn)知診斷模型數(shù)據(jù)
Eagle:在基因組范圍內(nèi)實現(xiàn)多位點關(guān)聯(lián)映射?;诰€性混合模型,,適合于連續(xù)性狀的數(shù)據(jù)分析。
Buddle:使用深度學(xué)習(xí)方法實現(xiàn)統(tǒng)計分類。案例數(shù)據(jù)包括臨床試驗患者的統(tǒng)計分類,、預(yù)測疾病的臨床分析,。考慮到今日疾病的負(fù)面影響,,及時正確的對病患進(jìn)行確診,,在臨床中是關(guān)鍵的。確定高?;颊呷后w,,并在適當(dāng)時機(jī)安排醫(yī)療方案。借助深度學(xué)習(xí)方法,,幫助在各種具有挑戰(zhàn)性的臨床試驗中尋找答案,。
webddx:在線診斷生成工具。用戶可以生成列出給定的一組癥狀鑒別診斷,,web工具可能會被用于臨床實踐,,但方案交互和數(shù)據(jù)操作能大大提高效率和再現(xiàn)性研究臨床信息。
GenoScan:用于全基因組序列分析的全基因組掃描統(tǒng)計框架
benford.analysis: 基于Benford方法的數(shù)據(jù)驗證和法醫(yī)鑒定,。
bamp:貝葉斯年齡-時期隊列模型,。使用馬爾可夫鏈和蒙特卡洛模擬方法。
epibasix:提供流行病學(xué)及生物統(tǒng)計學(xué)的基本流行病學(xué)函數(shù)
speaq:OOL核磁共振波譜對其,,基于峰值處理,、定量分析和可視化。
SimInf:大規(guī)模流行疾病傳播的模擬仿真,。模型采用馬爾可夫鏈,、吉萊斯皮隨機(jī)模擬算法。
pathfindR:通過提供的基因列表識別蛋白質(zhì)-蛋白質(zhì)相互作用路徑,,并對已確定的子網(wǎng)絡(luò)實現(xiàn)途徑強(qiáng)化分析,,確定具有代表性的路徑。幫助研究人員能夠發(fā)現(xiàn)表行背后的機(jī)制,。
BioInstaller:生物信息學(xué)資源集合
UCSCXenaTools: 頂級基因庫. 支持對USCS Xena數(shù)據(jù)中心等數(shù)據(jù)訪問. 是UCSC托管等公共數(shù)據(jù)庫的集合.
DSAIRM: 提供一組Shiny應(yīng)用程序,實現(xiàn)動態(tài)模擬系統(tǒng), 探索宿主免疫反應(yīng).
localIV: 提供使用局部工具變量估計邊際治療效果的函數(shù),,參見Heckman et al. (2006)、Zhou and Xie (2018)
epiflows:提供用于處理,、可視化區(qū)域間流行病流動的功能和類別, 以及用于預(yù)測疾病傳播的統(tǒng)計方法.
GROAN:一個測試基因組回歸準(zhǔn)確性的工作臺。
grf:提供了非參數(shù)最小二乘回歸,、量化回歸和治療效果估計的方法
chromoMap:人類染色體的交互式圖形可視化,,引入染色體熱圖
DrInsight:能夠反向查詢疾病表型或者查詢相似功能藥物
CytobankAPIstats:提供了從細(xì)胞庫獲取和處理細(xì)胞數(shù)據(jù)的工具。
SympluR:通過訪問Symplur接口,,提供了對醫(yī)療社會圖(Healthcare Social Graph)進(jìn)行數(shù)據(jù)分析的功能
cRegulome:提供方法來構(gòu)建預(yù)計算的轉(zhuǎn)錄因子或microRNA的SQLite數(shù)據(jù)庫文件,,數(shù)據(jù)源于Cistrome和miRCancerdb數(shù)據(jù)庫
detectRUNS:提供滑動窗口(Purcell等)和連續(xù)運行(Marras等)等方法,檢測二倍體基因組中純合性和雜合性的運行,。
malariAtlas:從瘧疾地圖集項目服務(wù)器下載公共可用數(shù)據(jù),。
機(jī)器學(xué)習(xí)
gclus:聚類繪圖
greybox:建模與預(yù)測分析工具
automl:Metaheuristic方法深度學(xué)習(xí)
ordinaLBM:基于連續(xù)隨機(jī)變量的聚類
protoclust:使用原型的聚類
ANN2: 使用ANN方法實現(xiàn)異常檢測,。
MachineShop:機(jī)器學(xué)習(xí)模型和工具。
discoveR:通過shiny實現(xiàn)的可視化探索性數(shù)據(jù)分析接口,,包括聚類,、主成分分析等
CRF:條件隨機(jī)場。是一種無向圖模型,,它的目標(biāo)是尋找在條件概率最大情況下的一種組合,,應(yīng)用于命名實體識別、文本淺層分析等信息抽取任務(wù)等實驗,,實現(xiàn)句法語義自動標(biāo)注,。基于模式匹配,、機(jī)器學(xué)習(xí),、支持向量機(jī)方法??捎糜趶?fù)雜的最長名詞短語識別,、漢語詞法分析研究。
geoveg:社區(qū)數(shù)據(jù)分析,,提供自動樹種的選擇和排序圖,,計算和天氣表的排序等。
DALEX2: 描述機(jī)器學(xué)習(xí)的解釋,。
FLSSS:組合優(yōu)化問題中的子集和族,。挖掘真實值和預(yù)定義的子集。
embed:通過廣義線性模型實現(xiàn)因子預(yù)測,。
clustvarsel:高斯模型聚類
whilboclustering:白盒的聚類算法實現(xiàn),。這周方式可以重新創(chuàng)建現(xiàn)有聚類算法。
dials: 提供用于創(chuàng)建無法從數(shù)據(jù)直接估計模型參數(shù)的工具.
optional:可選模型和模式匹配
naniar:數(shù)據(jù)結(jié)構(gòu)/概要/可視化數(shù)據(jù)缺失值的填補(bǔ)
modi:多元異常值檢測與數(shù)據(jù)缺失填補(bǔ)
mma:多個中介(媒介/介質(zhì)/載體)分析
CARS:輔助排序和大型雙樣本刷選
caret:分類和回歸訓(xùn)練
assertive.matrices:斷言檢查矩陣的性質(zhì)
merlin: 根據(jù)Crowther(2017)開發(fā)的框架,,提供適合線性,、非線性和用戶自定義的混合效應(yīng)回歸模型的函數(shù).
MRFcov: 提供估計馬爾可夫隨機(jī)場圖形網(wǎng)絡(luò)的節(jié)點交互參數(shù)的函數(shù)
SCPME: 提供函數(shù),支持通過擴(kuò)展ADMM算法估計懲罰精度矩陣,,如Molstad和Rothman(2018)所述.
survxai: 支持創(chuàng)建生存模型的統(tǒng)一表示,,可以由各種生存解釋器進(jìn)一步處理.
tosca: 提供內(nèi)容分析中的統(tǒng)計分析框架.
tsmap: 實現(xiàn)Matrix Profile 概念以進(jìn)行分類.
autoBagging:實現(xiàn)了一個自動化機(jī)器學(xué)習(xí)框架,重點是裝袋工作流程的優(yōu)化
grf:提供了非參數(shù)最小二乘回歸,、量化回歸和治療效果估計的方法
iRF:提供功能以迭代地增長特征加權(quán)的隨機(jī)森林,,并以一種穩(wěn)定的方式發(fā)現(xiàn)高階交互特征。
keras:實現(xiàn)了Keras的接口,,這是一種高級神經(jīng)網(wǎng)絡(luò)API,,運行在TensorFlow之上
randomForestExplainer:提供一組工具來幫助解釋隨機(jī)森林中哪些變量最重要。
DALEX:提供各種解釋器,幫助理解機(jī)器學(xué)習(xí)模型中輸入變量與模型輸出之間的關(guān)聯(lián)關(guān)系,。
forestControl:借助Konukoglu和Ganz所提供的方法,,在隨機(jī)森林的頻率選擇中控制假陽性率。
kmed:基于Park和Jun的方法,,實現(xiàn)了基于距離的k-medoids聚類算法,,并通過重新排序矩陣算法生成圖來驗證聚類族
lolR:維度超過樣本大小的情況,實現(xiàn)了最佳低秩投影算法
projpred:提供了廣義線性模型進(jìn)行投影預(yù)測特征選擇的方法
RGF:
apcluster :聚類
clusterSim:聚類
clustMixType:聚類
evclust:聚類
trimcluster:聚類
apcluster:聚類
時間序列
NlinTS:非線性時間序列分析
ftsa:功能時間序列函數(shù)
ctmm:連續(xù)時間移動模型
segMGarch:通過高緯度數(shù)據(jù)實現(xiàn)了一個分割為多個變點的檢測算法,,研究數(shù)據(jù)集或其子集的時間序列變點,。
tsxtreme:基于貝葉斯方法的時間序列分析。根據(jù)時間序列的極值依賴結(jié)構(gòu)的特性,,避免預(yù)處理和篩選高峰/閾值的方法,。
NTS:非線性實踐序列分析。
beyondWhittle:非參數(shù)/半?yún)?shù)的單變量/多變量時間序列的貝葉斯分析
mets:多元事件時間序列分析
ctsem:連續(xù)實踐結(jié)構(gòu)方程建模
ordinalCont:連續(xù)尺度的順序回歸分析
hpiR: 提供計算房價指數(shù)和序列的功能,,并基于準(zhǔn)確性,、波動性和修正統(tǒng)計來評估指數(shù)的好壞.
STMotif: 提供函數(shù)來識別空間-時間序列中的基序(先前識別的子序列).
trawl : 提供模擬和估計Veraart(2018)中描述的整數(shù)值拖網(wǎng)過程的函數(shù),以及模擬來自二元負(fù)二項和二元對數(shù)分布的隨機(jī)向量.
sweep:提供tidyverse作為時間序列預(yù)測工具,。
timetk:針對時間序列問題,,提供了一系列工具套件。
lubridate:輕量級時間序列操作包,,包含大量時間序列處理函數(shù)
segclust2d:二元時間序列的分割,、聯(lián)合分割、聚類
tstools:繪制官方統(tǒng)計時間序列
綜合學(xué)科
worrms:世界海洋物種登記(WoRMS)客戶端
qgraph:心理學(xué)數(shù)據(jù)可視化方法工具
raster:地理數(shù)據(jù)分析與建模
phreeqc:地球化學(xué)建模軟件的R接口
nhdR:國家水文數(shù)據(jù)集的工具
metScanR:環(huán)境數(shù)據(jù)分析工具
ropenaq:從OpenAQ上下載空氣質(zhì)量數(shù)據(jù)
KnowBR:物種多樣性數(shù)據(jù)庫研究
stacomiR:魚類遷徙檢測
landscapemetrics:分類地圖
psychotools:心理測定模型基礎(chǔ)架構(gòu)
forestChange:基于全球森林變化(森林區(qū)和森林破碎化)計算的生物多樣性變量的指標(biāo),。
rvacon:基于貝葉斯方法的年齡-深度模型,。使用放射性C衰變&歷史
AeRobiology:大氣生物學(xué)數(shù)值計算工具。
capm:人口動力學(xué)建模
asnipe:動物社會網(wǎng)絡(luò)分析,。對社會網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行多元回歸分析,。
gasfluxes:溫室氣體流量測定
openair:空氣污染分析工具,數(shù)據(jù)為小時序列,。包含的功能也可用于氣象和交通分析,。
meteoForecast:數(shù)值氣象預(yù)報
fdq:森林?jǐn)?shù)據(jù)。
essurvey:歐洲社會調(diào)查(European Social Survey)下載所需數(shù)據(jù)
fishmethods:漁業(yè)學(xué)科建模和方法
|