久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

R for Data Science

 微笑如酒 2018-05-06

mark


看到群里一個(gè)個(gè)R語(yǔ)言大神,讓我覺(jué)得自己該去好好提高自己的R功底了,,所以接下來(lái)的一段時(shí)間,,我主要和大家一起分享學(xué)習(xí)這本R語(yǔ)言書(shū),來(lái)和大家提高R語(yǔ)言功底,,這本書(shū)是R大神Hadley Wickham的著作,旨在給大家提供如何用R語(yǔ)言進(jìn)行數(shù)據(jù)分析,,算是一個(gè)基礎(chǔ)入門(mén)書(shū),。


本書(shū)一共5大部分,30個(gè)小節(jié),,我將用兩到三個(gè)月的時(shí)間和大家分享,,數(shù)據(jù)科學(xué)是一個(gè)巨大的領(lǐng)域,,我們不可能通過(guò)閱讀一本書(shū)來(lái)掌握它。這本書(shū)的目的是給我們一個(gè)堅(jiān)實(shí)的基礎(chǔ),。在一個(gè)典型的數(shù)據(jù)科學(xué)項(xiàng)目中所需要的工具模型是這樣的:

mark

就是數(shù)據(jù)導(dǎo)入-數(shù)據(jù)整理-數(shù)據(jù)轉(zhuǎn)置-建立模型-數(shù)據(jù)可視化-交流的一個(gè)過(guò)程


安裝本書(shū)所需要的工具包和數(shù)據(jù)包

install.packages('tidyverse')
install.packages(c('nycflights13', 'gapminder', 'Lahman'))
install.packages('ggplot2')

第二章第三講數(shù)據(jù)可視化

--- “The simple graph has brought more information to the data analyst’s mind than any other device.” — John Tukey

本書(shū)中數(shù)據(jù)可視化,,主要是基于ggplot2

首先給大家提供一個(gè)ggplot2繪圖公式:

ggplot(data = DATA>) +
 GEOM_FUNCTION>(mapping = aes(MAPPINGS>))

第一部分主要是存放數(shù)據(jù),第二部分才是幾何形狀映射,,大部分情況下,,可以省略掉前面的一些參數(shù),第二個(gè)必須輸入x,,y坐標(biāo),。

ggplot(data) + geom_function(aes(x= ,y= ,color= ,shape= ,alpha= ))
ggplot(data) + geom_function(aes(x= ,y= ),color=  ,shape= ,alpha= )

仔細(xì)觀察,這兩種寫(xiě)法的區(qū)別,,區(qū)別就是第一種寫(xiě)法如果顏色變量對(duì)應(yīng)的是分類變量的話,,每一類會(huì)有不同的顏色,,形狀等,,第二種方法則是進(jìn)行了全局變量設(shè)置,是對(duì)所有變量設(shè)置同樣的顏色等,。

分面

就是數(shù)據(jù)按照某一個(gè)類別分別建立不同的畫(huà)布展示

用一個(gè)變量展示的話

facet_wrap()
ggplot(data = mpg) +
 geom_point(mapping = aes(x = displ, y = hwy)) +
 facet_wrap(~ class, nrow = 2)
傳遞給facet_wrap 應(yīng)該是一個(gè)離散變量
mark
用兩個(gè)變量展示的話,,即兩種變量的組合
facet_grid()
后面輸入的是兩個(gè)變量,其兩個(gè)變量之間通過(guò)~來(lái)連接
ggplot(data = mpg) +
 geom_point(mapping = aes(x = displ, y = hwy)) +
 facet_grid(drv ~ cyl)
mark

使用facet_grid()依舊可以實(shí)現(xiàn)單個(gè)變量分面繪圖,,只需要改動(dòng)一下,第一個(gè)參數(shù)換為點(diǎn)號(hào),,代表整個(gè)數(shù)據(jù)結(jié)構(gòu)

ggplot(data = mpg) +
 geom_point(mapping = aes(x = displ, y = hwy)) +
 facet_grid(. ~ cyl)

這就和下面使用facet_wrap,一樣了,只是其不含點(diǎn)號(hào)哦

ggplot(data = mpg) +
 geom_point(mapping = aes(x = displ, y = hwy)) +
 facet_wrap(~ cyl,nrow=1)
因?yàn)槟J(rèn)是兩行哦,,所以改成一行

都會(huì)得到下面的結(jié)果圖

mark

今天先到這,,希望大家批評(píng)指正,明天繼續(xù),!



    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多