久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

統(tǒng)計學(xué)的實質(zhì)是什么,?--寫給所有將要或者正在學(xué)習(xí)統(tǒng)計學(xué)的朋友們

 東西二王 2019-12-06
統(tǒng)計學(xué)定義是,,通過搜索,、整理、分析,、描述數(shù)據(jù)等手段,,以達到推斷所測對象的本質(zhì),甚至預(yù)測對象未來的一門綜合性科學(xué),。統(tǒng)計學(xué)研究數(shù)據(jù),,發(fā)現(xiàn)數(shù)據(jù)背后的規(guī)律。不過,,大部分初學(xué)者對這樣的統(tǒng)計學(xué)定義依然一知半解,。統(tǒng)計學(xué)的本質(zhì)是什么?統(tǒng)計學(xué)是數(shù)學(xué)嗎,?如果不是數(shù)學(xué),,它和數(shù)學(xué)有什么關(guān)系?我們統(tǒng)計分析的目的是什么,?它的原理難以理解,,如何應(yīng)用統(tǒng)計原理于數(shù)據(jù)分析呢?

今年秋季以來,,作為一名浙江中醫(yī)藥大學(xué)的醫(yī)學(xué)統(tǒng)計學(xué)教授,,通過不斷地學(xué)習(xí)與反思,本人總結(jié)出一些出關(guān)于統(tǒng)計學(xué)本質(zhì),、統(tǒng)計思維的關(guān)鍵感悟,。特此撰寫長文進行梳理,來幫助學(xué)習(xí)者來理解統(tǒng)計學(xué),。

本篇文字約5000字,,閱讀時間為14分鐘。無論你正在,、將要或者已經(jīng)完成學(xué)習(xí)統(tǒng)計學(xué),,我都推薦你們耐心閱讀。

我分5點來介紹統(tǒng)計學(xué)的實質(zhì)

1.統(tǒng)計學(xué)的本質(zhì),;

2.統(tǒng)計學(xué)是數(shù)學(xué)嗎,?

3.統(tǒng)計學(xué)是抽樣研究;

4.統(tǒng)計學(xué)是經(jīng)濟學(xué),;

5.統(tǒng)計學(xué)核心是研究變量與變量之間的關(guān)系,。

1、統(tǒng)計學(xué)的本質(zhì)

現(xiàn)代統(tǒng)計學(xué)誕生于19世紀(jì)末20世紀(jì)初,奠基人Karl.Pearson與其前輩們一起,,將統(tǒng)計學(xué)方法用來描述事物客觀現(xiàn)象,。更準(zhǔn)確來說,,他們在大規(guī)模群體的基礎(chǔ)上,,用一種數(shù)學(xué)的參數(shù)(比如均數(shù),、標(biāo)準(zhǔn)差)描述事物的狀態(tài)。

隨后,,另外一位取得卓越成就的現(xiàn)代生物統(tǒng)計學(xué)大師Fisher認(rèn)為,,統(tǒng)計學(xué)可用小樣本的信息來推斷真實世界的事物特征。他提出了假設(shè)檢驗思想,,也就是統(tǒng)計學(xué)的最為核心的思維與方法?,F(xiàn)代統(tǒng)計學(xué)的發(fā)展直至今日,仍然主要以Fisher的思想體系為基礎(chǔ),。

統(tǒng)計學(xué)思維認(rèn)為,,客觀世界存在著一些普遍性的規(guī)律。這些規(guī)律,,雖然是確定的,,但是不可知的。因為客觀世界的規(guī)律是所有群體表現(xiàn)出來的特征,,統(tǒng)計學(xué)稱之為總體的特征,。總體特征可否直接得到,?不能,。人類能夠聽到的、見到的,、感覺到的,,只是總體客觀世界的局部反映而已。局部的體現(xiàn)可稱之為樣本的特征,。我們只是盲人摸象,、管中窺豹罷了。

那么,,管中窺豹,,可否全豹?顯然不能,,但能見一斑,。什么意思?我們可以看到整體的一部分,,即樣本,,慶幸的是樣本和總體有一定的相似性。所以Fisher認(rèn)為,,雖然無法直接得知客觀世界的真實地特征,,但是只要局部群體的特征具有代表性,那么局部可以反映總體;總體特征依然可以猜出來的,。由此誕生了現(xiàn)代統(tǒng)計學(xué)?,F(xiàn)代統(tǒng)計學(xué)家尋找各種技術(shù)與方法猜總體,來實現(xiàn)人類孜孜以求的夙愿---發(fā)現(xiàn)科學(xué)的真諦,。

為達到這一目的,統(tǒng)計學(xué)家首先需要采集一定代表性的樣本,,描述樣本的特征,,比如樣本的均數(shù),樣本的率,;接著借助一定統(tǒng)計技術(shù),,比如總體參數(shù)置信區(qū)間估計方法、假設(shè)檢驗方法,,來判斷總體的特征,,從而發(fā)現(xiàn)數(shù)據(jù)背后存在著的一般性規(guī)律。

這就是統(tǒng)計學(xué)的基本方式:根據(jù)小規(guī)模的代表性群題的信息,,去猜測事物或者數(shù)據(jù)背后一般的運行規(guī)律,。

醫(yī)學(xué)研究的統(tǒng)計過程亦是如此。研究者可能想知道藥物的效果,,或者想證明某種外科治療手段的價值,,或者期望證明適度飲酒對身體有沒有傷害?統(tǒng)計本質(zhì)而言,,都是在探討人類一般規(guī)律性的科學(xué)問題,。任何學(xué)者探討的醫(yī)學(xué)問題,都不是針對觀察到的群體,,而是基于觀察得到的表面現(xiàn)象,,探討現(xiàn)象背后的本質(zhì)規(guī)律。

因此,,《赤裸裸的統(tǒng)計學(xué)》一書的作者稱,,統(tǒng)計學(xué)家做的事情就是偵探家做的事情。偵探家,,會運用各種偵探技術(shù),,根據(jù)案發(fā)現(xiàn)場的一切可觀察得到的信息,去偵破犯罪的過程,。犯罪起因,、犯罪目的、最重要是罪犯是誰,?為解答這些問題,,一系列邏輯思維和縝密的推導(dǎo)過程會展開。統(tǒng)計研究過程何其像呀。案發(fā)現(xiàn)場就是的我們能采集的到的樣本,,案發(fā)現(xiàn)場的蛛絲馬跡便是統(tǒng)計學(xué)計算得到的樣本均數(shù),。數(shù)據(jù)背后是什么?背后必然有相應(yīng)的規(guī)律導(dǎo)致這一現(xiàn)象的發(fā)生,。醫(yī)學(xué)研究人員應(yīng)該為此感到高興,。當(dāng)我們能從一個雜亂無章的現(xiàn)場識別背后的罪犯時,這不是激動人心的時刻嗎?

2,、統(tǒng)計學(xué)是數(shù)學(xué)嗎,?

統(tǒng)計學(xué)是數(shù)學(xué)嗎?這是困擾所有學(xué)習(xí)統(tǒng)計學(xué)的人,。針對這一問題,,有些人認(rèn)為,統(tǒng)計學(xué)分析核心內(nèi)容均為數(shù)學(xué)運算,,根據(jù)數(shù)學(xué)公式去產(chǎn)生所需要的均數(shù),、標(biāo)準(zhǔn)差、百分?jǐn)?shù),;另外則有人認(rèn)為,,統(tǒng)計學(xué)就是概率,它總是在討論總體的發(fā)生概率(的確,,統(tǒng)計學(xué)非常重要的指標(biāo)P值就是關(guān)于概率學(xué)的概念),。這兩類說法都不是很準(zhǔn)確。

統(tǒng)計學(xué)并非數(shù)學(xué),,兩者存在著一定的區(qū)別,。統(tǒng)計學(xué)不是數(shù)學(xué),學(xué)習(xí)難度沒有數(shù)學(xué)那么難,。

概率論確實是數(shù)學(xué)的一部分,,統(tǒng)計學(xué)也非常倚重于概率學(xué)。但是,,統(tǒng)計學(xué)并非概率學(xué),。一方面,概率論只是基于總體層面進行理論推到和運算,,是數(shù)學(xué)演算和分析,,并不涉及樣本及基于樣本推斷總體的邏輯思維。另外一方面,,現(xiàn)代統(tǒng)計學(xué)誕生的時間比概率論理論早了半個世紀(jì),。概率論還在發(fā)展萌芽中時,現(xiàn)代統(tǒng)計學(xué)就借助其基本樸素的思想----發(fā)生可能性發(fā)展了現(xiàn)代統(tǒng)計學(xué)的統(tǒng)計推斷思想,。

數(shù)學(xué)是一種演繹的思想,,從理論的公式來,,到理論的公式去,即公式證明公式,,最終人類用公式來指導(dǎo)自然科學(xué)的發(fā)展,。比如,愛因斯坦的E=MC2公式,。這是20世紀(jì)偉大的物理學(xué)家愛因斯坦基于其它數(shù)學(xué)和物理學(xué)理論演繹出來的新的真理性的公式,。它揭示客觀世界的一個規(guī)律是質(zhì)量乘以光速的平方等于能量。這一公式具有跨時代的指導(dǎo)意義,,它推動了20世紀(jì)核工業(yè)的發(fā)展,,譬如核電站的建設(shè)與發(fā)展,核武器的研究與發(fā)展,。因此,數(shù)學(xué)的公式意味著真理,,它科學(xué)地反映了客觀世界的規(guī)律,。它具有指導(dǎo)性,是現(xiàn)代自然科學(xué)發(fā)展的根本性源泉,。

但是,,絕大多數(shù)客觀世界的規(guī)律不像數(shù)學(xué)“1 1=2”恒等不變。比如,,天氣預(yù)報對于明天的判斷,、高血壓治療藥物對于一名高血壓患者的治療效果,都是確定的,??赡芩腥烁哐獕夯颊咧校?/span> 55.0%的比例有效果,,但是將近一半的患者藥物效果不佳,。這一總體人群的治療效果無法用公式推導(dǎo)產(chǎn)生,也無法直接測量,,只能被猜測,,基于樣本的特征推斷產(chǎn)生。

因此,,統(tǒng)計學(xué)與數(shù)學(xué)之間存在著非常明顯的區(qū)別,。統(tǒng)計學(xué)是一種歸納。它無法直接計算,,但它往往通過匯總真實的數(shù)據(jù)(而非理論公式)來猜測總體的信息(而非計算),,而歸納的總體存在著一定不確定性。

數(shù)學(xué)和統(tǒng)計學(xué)上述區(qū)別導(dǎo)致兩者在應(yīng)用上存在著明顯的差異,。數(shù)學(xué)主要用于宏觀的指導(dǎo),,比如愛因斯坦的公式,它能夠揭示核物質(zhì)的理論產(chǎn)能結(jié)果。但是,,實際上,,一公斤的核物質(zhì),產(chǎn)生的能量不嚴(yán)格等于MC2,,其實每個類型的核反應(yīng)堆產(chǎn)生的能量是不確定的,,但相同類型的核反應(yīng)堆產(chǎn)生的能量遵守一定的自然規(guī)律,它可以通過統(tǒng)計分析探究得到,。因此,,統(tǒng)計學(xué)在應(yīng)用層面更為細致和微觀。

3,、統(tǒng)計學(xué)是抽樣研究

統(tǒng)計學(xué)作為發(fā)現(xiàn)事件真相的科學(xué)方法,,其整個過程和抽樣這一動作緊密結(jié)合,難以分割,。統(tǒng)計學(xué)過程實際上很大程度上是一個抽樣過程,,任何的統(tǒng)計研究都是如此。統(tǒng)計學(xué)研究利用了一小部分群體,,也就是基于樣本推斷總體,。這一過程看似是研究人員順手看到信息來猜測總體,似乎很簡單,。實際則不然,,統(tǒng)計學(xué)過程存在著一個復(fù)雜的抽樣過程。要去猜總體,,一個重要的舉措就是精心準(zhǔn)備的樣本,。我們看得的,順手拿到的,,其實不是好的樣本,。因此,高質(zhì)量的統(tǒng)計研究,,首先就是要拿到高質(zhì)量的樣本,。任何統(tǒng)計研究項目,其核心內(nèi)容就是抽樣研究,。

既然是抽樣研究,,研究人員需要認(rèn)真考慮:什么是好的樣本?好的樣本,,指的是,,能夠代表總體的樣本。統(tǒng)計研究核心任務(wù)是猜測總體,,“卡脖子”的情況便是樣本是否有代表性,。具有代表性的樣本,,則推斷產(chǎn)生的總體和實際情況相差無幾;沒有代表性的樣本,,則將得到有偏的總體,。但是,好的樣本就需要精心準(zhǔn)備,,精心設(shè)計,,精心實施,都非易事,。因此,,統(tǒng)計研究不是那么輕松、簡單的數(shù)據(jù)工作,,而是一項復(fù)雜的系統(tǒng)工程,。

為實現(xiàn)樣本的代表性,統(tǒng)計研究需要解決兩個關(guān)鍵問題,。第一,,什么方式抽樣才能得到代表性樣本;第二,,樣本量是多大。這兩個問題,,是當(dāng)前任何統(tǒng)計學(xué)研究都無法回避的事情,。任何的統(tǒng)計研究,研究的對象必然要千挑萬選,,考慮包括且不僅限于以下內(nèi)容:抽樣的方法,、具體抽樣的過程、抽樣的誤差,、各亞組人群的比例,、等比例還是等誤差?抽樣的分層數(shù),、隨機數(shù)字的產(chǎn)生方法等,。整個過程嚴(yán)謹(jǐn)細致,其抽樣結(jié)果真正代表統(tǒng)計研究希望探討的目標(biāo)總體群體,。

同樣重要的是樣本量的考慮,。樣本量的多少直接決定整個研究項目的成功與否。若研究者未采納相對科學(xué)的樣本量測算方法,,則會陷入迷思:我的研究項目到底需要多少樣本量,。因為,過低的樣本量,,會導(dǎo)致統(tǒng)計分析很可能得不到所期望的陽性結(jié)果(P<0.05), 意味著整個項目半途而廢,;過高的樣本量,,那么項目的人財物投入將面臨嚴(yán)重的考驗。因此,,一個高質(zhì)量的統(tǒng)計研究,,樣本量是無法繞開的坎。

根本而言,,考慮統(tǒng)計分析不僅是要認(rèn)真考慮分析技術(shù)的問題,,更重要的是,必須認(rèn)識它本身不僅是一個數(shù)據(jù)分析問題,,更是抽樣研究的問題,。這一思維必須建立起來,否則任何研究都將失去統(tǒng)計學(xué)的真正內(nèi)涵,。

4,、統(tǒng)計學(xué)是經(jīng)濟學(xué)

統(tǒng)計學(xué)是經(jīng)濟學(xué)的理念,是目前學(xué)習(xí)統(tǒng)計學(xué)的人基本缺乏的基本思維方式,。統(tǒng)計學(xué)為什么和經(jīng)濟學(xué)劃等號了呢,?經(jīng)典的經(jīng)濟學(xué)主要是理性主義經(jīng)濟學(xué),它是一門研究人類如何將有限或者稀缺資源進行合理配置,,從而實現(xiàn)資源價值最大化的科學(xué),。統(tǒng)計學(xué)研究亦是如此,它是合理分配科研人員的智力,、時間和資金來有效發(fā)現(xiàn)事物運行規(guī)律,,實現(xiàn)發(fā)掘真理的過程。

統(tǒng)計學(xué)不是數(shù)學(xué),。數(shù)學(xué)研究者只要一紙一筆,,甚至是評價大腦思考就能完成它的偉大證明過程,甚至計算機都不需要,。

近幾年,,一個非常著名的華人科學(xué)家張益唐(1955-),他初步證明了困擾全世界科學(xué)家?guī)资甑摹叭鯇\生素數(shù)猜想”,。據(jù)其介紹,,這一證明的主要思考過程,是他在朋友家院子里等待觀看野生梅花鹿現(xiàn)身的時間內(nèi)完成,。

英國數(shù)學(xué)家安德魯.懷爾茲,,躲在自家閣樓15年,經(jīng)過長年的思考和演算最終成功完成費馬大定理的證明,。

然而,,統(tǒng)計學(xué)必須借助于龐大的客觀世界,將人,、動物,、環(huán)境,、計算機等元素整合在一起,才能完成統(tǒng)計過程,。它與其它社會運動一樣,,整個過程將會產(chǎn)生諸多成本,這些成本是必須的,,是真相發(fā)現(xiàn)過程必須支付的,,統(tǒng)計學(xué)研究須在人力、物力,、財力的共同支撐下才能實現(xiàn),。因此,統(tǒng)計學(xué)研究必須要盡量控制成本,,用盡量小的成本來發(fā)現(xiàn)事物背后的真相,,它是具有較好成本效益的一種方法學(xué)。

統(tǒng)計學(xué)控制成本的方式便是抽樣,,它基于小規(guī)模樣本而不是直接探討總體,。它的思維方式是,采用研究需要的最小樣本量,,實現(xiàn)發(fā)現(xiàn)社會的運作規(guī)律的目標(biāo),。這與經(jīng)濟學(xué)思維方式不謀而合。為了實現(xiàn)這一目標(biāo),,統(tǒng)計學(xué)研究必須要妥善分配資源,,想方設(shè)法采取合理簡約的方式來實現(xiàn)抽樣和數(shù)據(jù)采集,采用精致的模型來規(guī)避由于簡易化抽樣調(diào)查過程帶來的一些缺陷,。因此,統(tǒng)計學(xué)學(xué)習(xí)人員,,必須要了解甚至是掌握一些精致的統(tǒng)計學(xué)方法,。這有利于減少成本而仍然實現(xiàn)相應(yīng)的統(tǒng)計分析目標(biāo)。

很遺憾的是,,當(dāng)前一些研究沒把統(tǒng)計學(xué)研究視為一種經(jīng)濟學(xué)過程,,而是認(rèn)定為一種醫(yī)學(xué)過程的點綴。

舉個例子,,近幾年,,有國內(nèi)醫(yī)學(xué)研究團隊基于全國大范圍50萬人群隊列進行研究與分析,探討影響中國人群健康的主要飲食,、環(huán)境,、行為因素。由于人群規(guī)模極其龐大,,研究成果連續(xù)在國際頂級期刊《新英格蘭醫(yī)學(xué)雜志》,、《柳葉刀》雜志發(fā)表了多篇學(xué)術(shù)論文,。學(xué)界和人民為之驕傲、感動,,這是中國原創(chuàng)性的成果,。然而,從經(jīng)濟學(xué)角度來看,,這并非值得提倡的事情,,這是違背統(tǒng)計學(xué)研究思維的事情。為什么,?從發(fā)表論文角度,,醫(yī)學(xué)研究人群規(guī)模越大,耗費資金越多,,錄用雜志等級將越高,。50萬的人群規(guī)模,數(shù)以億計的科研經(jīng)費,,全世界范圍都屈指可數(shù),,必然有大概率的機會刊登頂級雜志。但是,,從研究結(jié)果來看,,10000規(guī)模人群、1000萬人民幣的投入同樣可以獲得相似的結(jié)果,,差別在于錄用論文的期刊,,不再是《柳葉刀》,而是《柳葉刀》子刊,??雌饋黼s志有差別,但是統(tǒng)計效果完全一樣,。發(fā)表《柳葉刀》雜志,,不是說就能夠有跟高概率獲得諾貝獎,實際上大多數(shù)諾貝獎都沒有頂級雜志錄用的論文作為支撐,。

從經(jīng)濟學(xué)角度來看,,50萬人群的研究項目,只不過是浪費國家資源,,不屬于真正的統(tǒng)計學(xué)研究,。這些學(xué)者只不過是在積累和提升個人榮譽,迎合國內(nèi)虛榮膨脹的學(xué)術(shù)氛圍罷了,。

5,、統(tǒng)計學(xué)核心是研究變量與變量之間的關(guān)系

統(tǒng)計學(xué)分析的主要目標(biāo)是發(fā)現(xiàn)真相,探索世界事物運行的規(guī)律,,常規(guī)的方法包括假設(shè)檢驗,、回歸分析兩大類,。這些統(tǒng)計方法發(fā)現(xiàn)了何種真相,探索獲得了哪些規(guī)律,?總結(jié)來說,,醫(yī)學(xué)統(tǒng)計學(xué)期望在其它學(xué)科的共同努力下,闡釋事物屬性(變量)與屬性(變量)之間的關(guān)系,,特別是是因果關(guān)系,。無論是利用假設(shè)檢驗方法評價差異性,還是利用回歸技術(shù)探討影響因素,,統(tǒng)計學(xué)無不在證明兩類屬性或變量之間到底有沒有關(guān)系,,甚至是因果關(guān)系。

譬如,,評價人群適度飲酒(100g-200g酒精每周)與不飲酒人群在十年內(nèi)全人群死亡率的差異,。比較兩類人群的差別,探討兩組率的差異性,,采用的統(tǒng)計學(xué)方法是卡方檢驗,。實際上,這一差異性的探討,,是在進行關(guān)聯(lián)性的探討,,也就是論證兩個變量----飲酒量和死亡情況----因果關(guān)系。我們可能會學(xué)習(xí)道卡方檢驗是用來探討組間差異性,,t檢驗,、F檢驗都是如此,其實他們都是在探討變量和變量的關(guān)聯(lián)性,。
飲酒量
死亡(名)
死亡率
100g-200g
200
2% 
不飲酒
100
0.5%

相關(guān)與回歸分析方法,,其關(guān)聯(lián)性研究的意圖更為直接。相關(guān)分析主要探討變量與變量的關(guān)聯(lián)性強度,,而回歸分析則是單方向探討原因變量對結(jié)局變量的影響程度,。譬如,我們可以將人群的健康結(jié)局(死亡情況)作為結(jié)局變量,,飲酒作為原因變量,構(gòu)建統(tǒng)計回歸分析模型,,探討飲酒量是否是一個影響因素,。換言之,適度飲酒和不飲酒人群相比,,其對死亡率的影響影響程度多大,。

因此,作為統(tǒng)計學(xué)兩大分析方法,,差異性的假設(shè)檢驗方法和關(guān)聯(lián)性方法都從各自角度探討變量與變量之間的關(guān)聯(lián)性,。在更多的場合下,,結(jié)合醫(yī)學(xué)科研設(shè)計方法,利用復(fù)雜的統(tǒng)計技術(shù),,在探討醫(yī)學(xué)措施,、醫(yī)學(xué)有關(guān)因素與健康結(jié)局的因果關(guān)系。統(tǒng)計學(xué)學(xué)習(xí)者一定要清醒認(rèn)識到,,當(dāng)大部分的醫(yī)學(xué)研究都在探討因果關(guān)聯(lián)性情況下,,在你面臨醫(yī)學(xué)研究問題時,你的統(tǒng)計學(xué)方法可否有效排除干擾,,嚴(yán)謹(jǐn),、科學(xué)地證實它們的因果關(guān)系呢?如果不能,,研究結(jié)論必然不可信,、不可靠、無說服力,,也缺乏科學(xué)價值,。
 
本篇到此結(jié)束,感謝諸位內(nèi)心閱讀,,有關(guān)切的問題可以留言或者加微信號,。歡迎分享本人長篇原創(chuàng)!

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請點擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多