費(fèi)了九牛二虎之力、歷盡千辛萬苦收集了數(shù)據(jù),,終于走到了分析這一步,。分析前少不了將數(shù)據(jù)導(dǎo)入/錄入分析軟件。但因?yàn)榧兠畹脑?,很多時(shí)候R都是我們最后的或者不得已的選擇,,所以我們在用到R時(shí)拿到的數(shù)據(jù)可能有很多種格式,比如excel(.xlsx),、SPSS(.sav)、STATA(.dta),、SAS(sas7bdat),、CSV(.csv)等。一般來說,,面對海量的數(shù)據(jù),,我們不會(huì)逐條錄入,導(dǎo)入是最佳的選擇,。 【1】導(dǎo)入Excel文件:read_excel{readxl} ##導(dǎo)入名稱為“Diabetes”的Excel文件中的第2個(gè)sheet(工作表),該工作表名稱為”blood”,Excel文件存放在D盤DATA的文件夾中,。將導(dǎo)入到R中的這個(gè)excel文件儲(chǔ)存在數(shù)據(jù)框Diabetes中,。 library(readxl) 其他常用: read.xlsx{openxlsx}: 【2】導(dǎo)入SPSS文件:read_sav{haven} library(haven) 程序包haven還可導(dǎo)入SPSS(read_sav),、STATA(read_dta)和SAS(read_sas)等多種形式的文件。其他導(dǎo)入SPSS文件的常用程序包函數(shù)有: read.spss{foreign}: spss.get{Hmisc}: 【3】導(dǎo)入STATA文件:read_dta{haven} library(haven) 其他常用read.spss{foreign}: foreign程序包也可以讀取如Minitab、S、SAS,、SPSS,、Stata、Systa,、Weka,、dBase等多種形式的數(shù)據(jù)。需要注意的是,,read.dta只能讀取stata5-stats12的數(shù)據(jù),。 【4】導(dǎo)入CSV、TXT文件 最后友情提示一下,,不要忘記了任何一個(gè)軟件一般都會(huì)有一個(gè)“另存為”的功能,,通過軟件將數(shù)據(jù)存儲(chǔ)為你最熟悉的格式往往會(huì)起到事半功倍的效果。 |
|