作者:Joseph Rickert 翻譯:黃小偉,10年資深數(shù)據(jù)礦工,。目前就職杭州有贊數(shù)據(jù)分析團(tuán)隊(duì),歡迎加入,! 2019年2月,,151個(gè)R新包收錄于CRAN(1月份收錄153個(gè)新包)!以下是選摘的40個(gè)R新包,,包括八個(gè)類別:生物信息,、數(shù)據(jù)、機(jī)器學(xué)習(xí),、醫(yī)學(xué),、統(tǒng)計(jì)學(xué)、時(shí)間序列,、工具和可視化,。 一. 生物信息 1. Cascade: 提供了一種建模工具,允許在級(jí)聯(lián)網(wǎng)絡(luò)中進(jìn)行基因選擇,、逆向工程和預(yù)測(cè). 2. countfitteR: 提供了部分函數(shù)和Shiny程序,,用于在DNA分析中自動(dòng)評(píng)價(jià)計(jì)數(shù)數(shù)據(jù)的分布模型. 二. 數(shù)據(jù) 1. noaaoceans: 提供訪問國(guó)家海洋和大氣管理局(NOAA) API的工具. 2. guardianapi: 提供訪問衛(wèi)報(bào)開放API的功能,,包含1999年至今在衛(wèi)報(bào)中發(fā)布的所有文章. 3. RobinHood: 提供針對(duì)RobinHood投資平臺(tái)的交互界面,包括訪問帳戶數(shù)據(jù),、檢索投資統(tǒng)計(jì)和報(bào)價(jià),、下訂單和取消訂單等功能. 4. stlcsb: 提供對(duì)圣路易斯市公民服務(wù)局?jǐn)?shù)據(jù)訪問的功能,包括下載數(shù)據(jù),、分類問題請(qǐng)求,、清理和分組CSB數(shù)據(jù)以及使用x和y坐標(biāo)投影數(shù)據(jù). 三. 機(jī)器學(xué)習(xí) 1. bigMap: 基于數(shù)據(jù)的低維表示,實(shí)現(xiàn)用于大規(guī)模結(jié)構(gòu)化數(shù)據(jù)的無(wú)監(jiān)督聚類協(xié)議,,參見Garriga and Bartumeus (2018) . 2. fastNaiveBayes: 提供樸素貝葉斯分類器的快速實(shí)現(xiàn),,主要基于Schneider(2003)的論文. 3. gama: 利用遺傳進(jìn)化方法實(shí)現(xiàn)硬分區(qū)聚類.參見Scrucca (2013), Charrad et al. (2014), and Tsagris and Papadakis (2018). 4. leiden: 借助reticulate執(zhí)行Python leidenalg聚類算法. 5. r.blip: 提供從包含數(shù)千個(gè)變量的數(shù)據(jù)集中學(xué)習(xí)貝葉斯網(wǎng)絡(luò)的功能,包括父集識(shí)別,、一般結(jié)構(gòu)優(yōu)化,、有界樹寬度結(jié)構(gòu)的算法優(yōu)化、不完整數(shù)據(jù)集的結(jié)構(gòu)學(xué)習(xí)等. 6. RTML: 實(shí)現(xiàn)10種正則化多任務(wù)學(xué)習(xí)算法的有效求解器,,適用于回歸,、分類、聯(lián)合特征選擇,、低秩學(xué)習(xí),、稀疏學(xué)習(xí)和網(wǎng)絡(luò)合并等. 7. Spectrum: 為單視圖和多視圖數(shù)據(jù)實(shí)現(xiàn)快速、自適應(yīng)的譜聚類算法. 8. SAR: 針對(duì)個(gè)性化推薦問題,,提供智能自適應(yīng)推薦(SAR)算法的兩種實(shí)現(xiàn). 9. tfdeploy: 提供跨多個(gè)服務(wù)器部署TensorFlow模型的工具. 10. tfio: 提供TensorFlow IO的接口. 11. stabm: 提供多個(gè)方法以評(píng)估特征選擇的穩(wěn)定性. 12. tidystopwords: 提供以53種語(yǔ)言生成禁用詞列表的功能,,其方式與所支持的所有語(yǔ)言一致. 四. 醫(yī)學(xué) 1. ClinReport: 提供在Microsoft Word文檔中創(chuàng)建符合臨床標(biāo)準(zhǔn)的格式化統(tǒng)計(jì)表的功能. 2. safetyGraphics: 通過Shiny應(yīng)用程序或獨(dú)立的htmlwidget圖表實(shí)現(xiàn)評(píng)估臨床試驗(yàn)安全性的框架. 五. 統(tǒng)計(jì)學(xué) 1. dosearch: 實(shí)現(xiàn)了一種方法,通過do-calculus和標(biāo)準(zhǔn)概率操作來(lái)識(shí)別任意觀測(cè)和實(shí)驗(yàn)概率分布的因果效應(yīng). 2. geosample: 提供構(gòu)建抽樣設(shè)計(jì)的功能. 3. interactions: 提供相關(guān)功能,,用于執(zhí)行和解釋回歸模型中統(tǒng)計(jì)交互的分析及雙向和三向交互的可視化. 4. IrregLong: 提供用于分析縱向數(shù)據(jù)的功能,,其中觀察時(shí)間是可能與結(jié)果過程相關(guān)的隨機(jī)變量. 5. missCompare: 提供方法用于測(cè)試和比較模擬、實(shí)際數(shù)據(jù)上的各種缺失數(shù)據(jù)插補(bǔ)算法. 6. OutlierDetection: 提供多種方法來(lái)檢測(cè)異常值,,包括基于模型的方法,、基于距離的方法、基于密度的方法等. 7. plsr: 提供用于兩個(gè)高維數(shù)據(jù)集關(guān)系的偏最小二乘分析的函數(shù). 8. pliable: 用于訓(xùn)練和擬合套索模型. 9. PointFore: 提供估計(jì)規(guī)范模型的函數(shù). 10. segmenTier: 基于machne等人所描述的理論,,實(shí)現(xiàn)了基于段內(nèi)任意相似性度量最大化的分段動(dòng)態(tài)規(guī)劃解決方案. 11. TextForecast: 提供使用文本數(shù)據(jù)進(jìn)行回歸分析和預(yù)測(cè)的功能,,這些數(shù)據(jù)基于Lima(2018). 六. 時(shí)間序列 1. Rlgt: 提供使用rstan的函數(shù),用于擬合全局趨勢(shì)模型進(jìn)行時(shí)間序列預(yù)測(cè),,這些模型是貝葉斯歸納和某些指數(shù)平滑模型的擴(kuò)展. 2. tsfeatures: 如Hyndman等人所述,,實(shí)現(xiàn)從時(shí)間序列數(shù)據(jù)中提取各種特征的多種方法. 七. 工具 1. pak: 簡(jiǎn)化和改進(jìn)R包的安裝. 2. qs: 提供快速寫入和讀取任何R對(duì)象到磁盤和從磁盤讀取的功能. 3. ropendata: 提供收集網(wǎng)絡(luò)安全數(shù)據(jù),并通過開放式數(shù)據(jù)門戶使其可用的功能. 4. rosr: 提供創(chuàng)建可重復(fù)的學(xué)術(shù)項(xiàng)目的方法,,包括數(shù)據(jù)集,、參考、代碼,、圖像等綜合學(xué)術(shù)元素. 5. ShinyEventLogger: 為復(fù)雜的Shiny應(yīng)用程序?qū)崿F(xiàn)日志框架. 八. 可視化 1. gratia: 提供基于ggplot的圖形和工具函數(shù),,借助mgcv包進(jìn)行廣義加性模型(GAM)的可視化. 2. jskm : 提供函數(shù)jskm( )以創(chuàng)建具有下面風(fēng)險(xiǎn)表的Kaplan-Meier圖,,并使用svyjskm( )繪制加權(quán)Kaplan-Meier估計(jì)量. 說明:限于個(gè)人水平,錯(cuò)誤之處難免,,煩請(qǐng)批評(píng)指正,,共同交流~ |
|
來(lái)自: geoallan > 《數(shù)據(jù)分析》