久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

dplyr和tydir包學習筆記

 連果啦啦 2020-03-25

1 dplyr包

1.1 展現(xiàn)數(shù)據(jù) tbl_df():

函數(shù)tbl_df()使得大數(shù)據(jù)集規(guī)范顯示出來,,行列都只顯示10個,,跟head差不多,但是head只能控制行,,無法控制列,,使用tbl_df()就是為了防止數(shù)據(jù)刷屏。
mtcars_df <- tbl_df(mpg)
mtcars_df

1.2 篩選數(shù)據(jù) filter():

按給定的邏輯判斷篩選出符合要求的子數(shù)據(jù)集
filter(longdata, "mpg" == 21, "cyl" == 6)

1.3 排列數(shù)據(jù) arrange():按給定的列名依次對行進行排序

arrange(mtcars_df, cyl, desc(carb))# 先對cyl列正序排列,,再對carb列倒序排列,descending order倒序排列

1.4 選擇子集 select():用列名作參數(shù)來選擇子數(shù)據(jù)集

select(mtcars_df, mpg, disp:wt, carb) # disp:wt表示從disp列選到wt列

1.5 變形 mutate():對已有列進行數(shù)據(jù)運算并添加為新列

mutate(mtcars_df, NO = 1:dim(mtcars_df)[1], res = hp - drat)  

1.6 總覽數(shù)據(jù) summarise():對數(shù)據(jù)框調用其它函數(shù)進行匯總操作, 返回一維的結果

summarise(mtcars_df, mdisp = mean(disp, na.rm = TRUE), mhp = mean(hp, na.rm = TRUE))

1.7 數(shù)據(jù)分組 group_by():當對數(shù)據(jù)集通過group_by()添加了分組信息后,,mutate(),arrange() 和 summarise() 函數(shù)會自動對這些 tbl 類數(shù)據(jù)執(zhí)行分組操作,。

cars <- group_by(mtcars_df, cyl)(countcars <- summarise(cars, count = n())) # count = n()用來計算次數(shù)

2 tidyr包

2.1 寬轉長 gather():使用gather()函數(shù)實現(xiàn)寬表轉長表,語法如下:

# gather(data, key, value, …, na.rm = FALSE, convert = FALSE)# data:需要被轉換的寬形表# key:將原數(shù)據(jù)框中的所有列賦給一個新變量key# value:將原數(shù)據(jù)框中的所有值賦給一個新變量value# …:可以指定哪些列聚到同一列中# na.rm:是否刪除缺失值longdata <- gather(mtcars_df, attribute, value, -mpg)longdata <- gather(mtcars_df, attribute, value)

2.2 長轉寬 spread():有時,,為了滿足建模或繪圖的要求,往往需要將長形表轉換為寬形表,,或將寬形表變?yōu)殚L形表,。

如何實現(xiàn)這兩種數(shù)據(jù)表類型的轉換。使用spread()函數(shù)實現(xiàn)長表轉寬表,,語法如下:
# spread(data, key, value, fill = NA, convert = FALSE, drop = TRUE)# data:為需要轉換的長形表# key:需要將變量值拓展為字段的變量# value:需要分散的值# fill:對于缺失值,,可將fill的值賦值給被轉型后的缺失值spread(longdata, attribute, value)

2.3 合并 unit():unite的調用格式如下

# unite(data, col, …, sep = “_”, remove = TRUE)
# data:為數(shù)據(jù)框
# col:被組合的新列名稱
# …:指定哪些列需要被組合
# sep:組合列之間的連接符,默認為下劃線
# remove:是否刪除被組合的列

TIMES <- data.frame(years = c('1990', '1991', '1992'), months = c(2,3,4), day = c(1, 2, 3))
(TIMESunite <- unite(TIMES, information, months, day, sep= "-"))

2.4 拆分 separate():separate()函數(shù)可將一列拆分為多列,,一般可用于日志數(shù)據(jù)或日期時間型數(shù)據(jù)的拆分,,語法如下:

# separate(data, col, into, sep = “[^[:alnum:]]+”, remove = TRUE,
# convert = FALSE, extra = “warn”, fill = “warn”, …)
# data:為數(shù)據(jù)框
# col:需要被拆分的列
# into:新建的列名,為字符串向量
# sep:被拆分列的分隔符
# remove:是否刪除被分割的列
TIMESsep <- separate(TIMESunite, information, c("months", "day"), sep = "-")

R語言中的連接dplyr中的join系列與merge函數(shù)

R語言中dplyr包jion函數(shù)之目前我看到過的最形象的教程

dplyr官方參考函數(shù)

R成精系列-用dplyr高效變換數(shù)據(jù)和處理數(shù)據(jù)

R成精系列-用dplyr高效變換數(shù)據(jù)和處理數(shù)據(jù)

R語言常用的包

    本站是提供個人知識管理的網絡存儲空間,,所有內容均由用戶發(fā)布,,不代表本站觀點。請注意甄別內容中的聯(lián)系方式,、誘導購買等信息,,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,,請點擊一鍵舉報,。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多