久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

算法數(shù)學(xué)基礎(chǔ)-統(tǒng)計(jì)的基本概念

 taotao_2016 2020-02-07

這章開始我們開始介紹數(shù)理統(tǒng)計(jì)的內(nèi)容。概率論是研究的工具,,那么數(shù)理統(tǒng)計(jì)就是研究的方法,。大學(xué)里面概率論和統(tǒng)計(jì)是一門課,當(dāng)時(shí)其實(shí)根本沒有學(xué)明白,,稀里糊涂?,F(xiàn)在來理解就是研究的工具和方法的關(guān)系,而研究的對(duì)象隨機(jī)現(xiàn)象,。在概率論中,,我們都假設(shè)某個(gè)隨機(jī)變量的分布是已知的,告知了我們一些性質(zhì),。而數(shù)理統(tǒng)計(jì)將帶來更多的未知,,要解決概率論中那些個(gè)前提假設(shè)如何來的問題,教會(huì)我們?nèi)绾螐拇罅康臄?shù)據(jù)中找到規(guī)律,、做出推斷,,是更有用的部分。比如,,我們從數(shù)據(jù)中發(fā)現(xiàn)可能一個(gè)隨機(jī)現(xiàn)象可以用正態(tài)分布來描述,,那么這種感覺或者判斷在我們不了解全部信息的情況下是否正確呢?這就需要用到統(tǒng)計(jì)學(xué)的方法,,求得模型的參數(shù),、為判斷提供依據(jù),告訴我們?nèi)绾螐挠^察中得到規(guī)律,!個(gè)人覺得學(xué)習(xí)知識(shí)脈絡(luò)是最重要的,,理清楚脈絡(luò)才能融會(huì)貫通,,運(yùn)用自如。

我們先梳理一下統(tǒng)計(jì)的基本概念:

1,、總體:試驗(yàn)的全部可能的觀察值,;(是不是樣本空間呢?)

2,、個(gè)體:每一個(gè)可能的觀察值,;(是不是樣本點(diǎn)?)

3,、容量:總體中包含的個(gè)體個(gè)數(shù),;容量有限的稱為有限容量總體,,無限容量的稱為無限總體,。例如投擲硬幣,就是一個(gè)有限總體,,而測(cè)量湖水深度就是一個(gè)無限總體,。(連續(xù)隨機(jī)變量是有限總體么?)擔(dān)但這個(gè)劃分也不是絕對(duì)的,,如果一個(gè)很大的量我們也可以將其近似看成無限的,,比如測(cè)量全國(guó)人民身高14億人就可以近似看成無限總體。

通過上述定義就可以將現(xiàn)實(shí)中的樣本與概率中的概念聯(lián)系起來了,??傮w對(duì)應(yīng)著就是我們的樣本空間,個(gè)體的觀察值(每一次試驗(yàn)結(jié)果)對(duì)應(yīng)樣本空間的樣本點(diǎn),,我們可以用一個(gè)隨機(jī)變量來對(duì)應(yīng)這個(gè)樣本空間,,通過研究隨機(jī)變量的分布函數(shù)和數(shù)字特征來研究總體的特點(diǎn)和規(guī)律。是不是很順??!通過幾個(gè)定義,從概率論的概念對(duì)應(yīng)到了實(shí)際問題,。這個(gè)就叫建模,!把身邊的事情用數(shù)學(xué)模型來描述,是很爽的一件事,,如果模型建對(duì)了你就可以解釋現(xiàn)象,、預(yù)測(cè)未來了,哈哈哈哈,。

舉個(gè)例子吧,,比如我們生產(chǎn)了一批零件,這批零件就是一個(gè)總體,,有合格的也有不合格的,。如果我要了解這批零件的合格率但又不能全部每一個(gè)都測(cè)量一遍,我們就可以用一個(gè)隨機(jī)變量X來對(duì)應(yīng)(X代表這個(gè)零件的合格率),模型就建完了,。接下來我們可以研究X的分布函數(shù),、數(shù)字特征了。如何研究呢,?不知大家有沒有想起大數(shù)定律,,如果有那么說明你前面的內(nèi)容掌握的不錯(cuò)了。我們可以采用抽樣幾批求平均的方法,,通過小樣本的研究來近似總體的特征,。這個(gè)就是統(tǒng)計(jì)學(xué)的方法了。

因?yàn)榭傮w的分布通常是未知的,,一般都是通過抽樣的方法來獲得總體特征進(jìn)行推斷,。所以抽樣概念及方法自然而然就需要提煉出來了。

4,、樣本:從總體抽取一部分?jǐn)?shù)據(jù)對(duì)總體進(jìn)行推斷,,被抽出的部分個(gè)體叫做樣本;

5,、簡(jiǎn)單隨機(jī)樣本:在相同條件在對(duì)總體進(jìn)行n次抽樣并記錄觀察值,,每一次觀察值都是獨(dú)立的,而且與總體有相同的分布函數(shù),,則稱為容量為n的簡(jiǎn)單隨機(jī)樣本,。也就是一個(gè)簡(jiǎn)單隨機(jī)樣本包括了n個(gè)觀察值。比如我想考察北京市的人均收入,,那簡(jiǎn)單隨機(jī)樣本應(yīng)該怎么選呢,?我就不能過多的考慮差異,按地區(qū)抽樣是比較合理的,,因?yàn)椴煌藗兊牡赜蚍植伎梢约僭O(shè)是均勻的,,高低收入人群的分是類似的。(可能例子不是太恰當(dāng),,但是大家理解意思就好了),,就是要求抽樣的前提一致,樣本之間無關(guān)聯(lián),。這樣我們就可以簡(jiǎn)單求得總體分布(X1,X2,X3)=F(X1)*F(X2)...F(Xn)-假設(shè)樣本無關(guān),,所以從獨(dú)立性的定義出發(fā)聯(lián)合分布的概率等于概率之積,即從樣本的分布得到了總體的分布,。這是從部分感知總體的方法,,但是約束也是很清晰的就是部分之間沒有聯(lián)系!

6,、統(tǒng)計(jì)數(shù)據(jù)的圖形表示:直方圖,、箱線圖,。直方圖就不解釋了,就是將統(tǒng)計(jì)數(shù)據(jù)用曲線的形式表示出來,,有很多例子比如圖像處理中的灰度圖就是典型的直方圖,,橫坐標(biāo)是灰度縱坐標(biāo)是點(diǎn)數(shù),這種直方圖外部輪廓線從大數(shù)定律的角度出發(fā)接近于總體的概率密度函數(shù),。另外一種圖要多說兩句,,叫箱線圖。箱線圖就是把數(shù)據(jù)分布表示在圖上的一種方法,,非常有利于比較不同組數(shù)據(jù)之間的差異,。分位點(diǎn)就是數(shù)據(jù)集的劃分,通常有第一分位點(diǎn),、第三分位點(diǎn),,通俗理解就是將數(shù)據(jù)排序后得到的最大、最小,、1/4大,、1/2大,、3/4大以及每個(gè)區(qū)間的數(shù)據(jù)個(gè)數(shù)用圖像表示出來,。這樣不光可以看到數(shù)據(jù)的個(gè)數(shù),還可以知道數(shù)據(jù)按一個(gè)直觀分布情況,。同時(shí)箱線圖還可以排除測(cè)試中的異常數(shù)值,。箱線圖特別適合用于不同組之間的數(shù)據(jù)比較。如下圖,,中間的黑線就是中位數(shù),,我們可以看到這些房?jī)r(jià)的總體是平穩(wěn)的,99年的房?jī)r(jià)5萬元以下的比較集中,,而2003年的房?jī)r(jià)6-10萬這個(gè)區(qū)間分布比較集中(此例為示意,,勿當(dāng)真)。大家可以感受一下,,箱線圖中表達(dá)的信息還是非常豐富的,。

算法數(shù)學(xué)基礎(chǔ)-統(tǒng)計(jì)的基本概念

算法數(shù)學(xué)基礎(chǔ)-統(tǒng)計(jì)的基本概念

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多