本文首發(fā)于 ”百味科研芝士“ 微信公眾號(hào),,轉(zhuǎn)載請(qǐng)注明:百味科研芝士,,F(xiàn)ocus科研人的百味需求 大家好,上次已經(jīng)介紹過(guò)SPSS的操作了,今天小編給大家分享另外一個(gè)常用統(tǒng)計(jì)分析軟件—SAS,很多人一聽(tīng)到SAS要編程,,就望聞生畏了,,小編認(rèn)為當(dāng)你熟悉基本的操作界面之后,,基本上就是粘貼復(fù)制的事情,,就能跑出你想要的結(jié)果了。現(xiàn)在小編就給大家分享一下SAS的基本知識(shí),,下期再給大家介紹具體案例的實(shí)際操作,。 一、SAS窗口簡(jiǎn)介
1,、編輯器窗口 主要功能是編輯SAS程序語(yǔ)句,,并用不同的顏色顯示SAS語(yǔ)句,同時(shí)進(jìn)行語(yǔ)句的邏輯檢查,,如:出現(xiàn)紅色字體,,說(shuō)明語(yǔ)句拼寫(xiě)有誤,需要修改,;深藍(lán)色字體表示數(shù)據(jù)步或過(guò)程步的開(kāi)始,;淺藍(lán)色表示關(guān)鍵語(yǔ)句;黃底色表示數(shù)據(jù)流,。 2,、日志窗口 主要作用是顯示運(yùn)行程序后的有關(guān)信息。顯示的信息內(nèi)容包括所建立的數(shù)據(jù)集名稱(chēng),、建立數(shù)據(jù)集包括多少個(gè)變量和觀測(cè),、執(zhí)行了什么過(guò)程、執(zhí)行過(guò)程運(yùn)行了多長(zhǎng)時(shí)間,、語(yǔ)句中有什么錯(cuò)誤等等,。 3、輸出窗口 主要作用是顯示程序運(yùn)行的結(jié)果,。 注:當(dāng)程序?qū)懞脮r(shí)需要點(diǎn)擊運(yùn)行(小人的圖標(biāo)喲),,另外需要注意無(wú)論是數(shù)據(jù)集的名稱(chēng)還是SAS程序,SAS均不區(qū)分大小寫(xiě),。 二,、SAS數(shù)據(jù)集與SAS數(shù)據(jù)庫(kù) 1、SAS數(shù)據(jù)集存放于SAS數(shù)據(jù)庫(kù)中,,類(lèi)似于excel文檔存放在一個(gè)文件夾中,。SAS庫(kù)的類(lèi)型可分為永久數(shù)據(jù)庫(kù)(關(guān)閉SAS后數(shù)據(jù)集保存)和臨時(shí)數(shù)據(jù)庫(kù)(關(guān)閉SAS軟件后SAS數(shù)據(jù)集不保存,但可以保存進(jìn)建立臨時(shí)數(shù)據(jù)集的程序),。 三,、SAS運(yùn)算符及常用函數(shù)
四,、SAS程序簡(jiǎn)介 1、SAS程序結(jié)構(gòu):數(shù)據(jù)步(data step)+過(guò)程步(proc step),;以run結(jié)束 2,、SAS程序語(yǔ)法規(guī)范:每個(gè)語(yǔ)句以“;”作為結(jié)束符號(hào),;同一行可以有多個(gè)語(yǔ)句,,一個(gè)語(yǔ)句也可以分幾行編寫(xiě)。 五,、建立數(shù)據(jù)集 下面就以一個(gè)實(shí)例,,了解建立SAS數(shù)據(jù)集。
SAS的編輯窗口和日志窗口如下:
建立的SAS數(shù)據(jù)a1如下:
六,、整理數(shù)據(jù) 常用的SAS語(yǔ)句: 1,、if-then/else 2、刪除不需要變量或保留需要變量:drop/keep語(yǔ)句(data步中) 3,、產(chǎn)生新變量:直接等號(hào)賦值即可,,if-then/else產(chǎn)生新變量 4、數(shù)據(jù)集的排序:proc sort 過(guò)程步 5,、數(shù)據(jù)集的合并:proc merge過(guò)程步(橫向合并) 6,、數(shù)據(jù)集的連接:set語(yǔ)句(縱向連接) 詳細(xì)SAS程序如下:
數(shù)據(jù)集M如下:(只包含男性信息)
數(shù)據(jù)集F如下:(只包含女性信息)
數(shù)據(jù)集A2如下:(使用drop語(yǔ)句去除A1數(shù)據(jù)集中的 age blood變量)
數(shù)據(jù)集A3如下:(使用keep語(yǔ)句保留A1數(shù)據(jù)集中的 age blood變量)
A4、A5,、A6如下:(產(chǎn)生新變量)
/*數(shù)據(jù)集的排序:按照年齡降序排序(若按升序排列變量名前的ascending可以省略不寫(xiě))*/ proc sort data=a1;by decending age;run; Proc sort之后的A1如下:
/*數(shù)據(jù)集的連接:m,、f數(shù)據(jù)集眾向連接成lj數(shù)據(jù)集*/ data lj;set m f;run; lj數(shù)據(jù)集如下:
/*數(shù)據(jù)集的合并:a1、b1橫向合并成hb數(shù)據(jù)集*/ /*需要對(duì)原數(shù)據(jù)集的關(guān)聯(lián)詞排序,,即對(duì)by后的變量進(jìn)行排序*/ proc sort data=a1;by no;run; proc sort data=b1;by no;run; data hb;merge a1 b1;by no;run; 數(shù)據(jù)集HB如下:
七,、描述性統(tǒng)計(jì)分析 數(shù)值型變量的均值(means 過(guò)程): 程序:proc means data=a1;var age;run; 結(jié)果如下:
可以限制means過(guò)程步的輸出結(jié)果,如下需要輸出age的n mean std stderr p5 cv,。 程序:proc means data=a1 n mean std stderr p5 cv;var age;run;
分類(lèi)變量描述頻數(shù): 程序:proc freq data=a1;tables sex;run;
可以同時(shí)看多個(gè)變量的頻數(shù),,如下同時(shí)看性別和血型的頻數(shù)。 程序:proc freq data=a1;tables sex blood;run;
今天就到這里了,,期待下期統(tǒng)計(jì)推斷的具體案例實(shí)際操作,,不見(jiàn)不散喲。 參考資料: 《SAS統(tǒng)計(jì)軟件應(yīng)用》,,賀佳主編,,人民衛(wèi)生出版社,2014年4月
|
|
來(lái)自: 百味科研芝士 > 《R語(yǔ)言與統(tǒng)計(jì)》