久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

徹底理解正態(tài)分布——強(qiáng)大的數(shù)學(xué)分析工具

 excel05 2020-04-26

徹底理解正態(tài)分布——強(qiáng)大的數(shù)學(xué)分析工具

每個試圖進(jìn)入強(qiáng)大的數(shù)據(jù)科學(xué)世界的人都會遇到正態(tài)分布。在這篇文章中,,我將以一種非常清晰的方式解釋它到底是什么,,我們?nèi)绾谓忉屗约盀槭裁此鳛橐粋€每個數(shù)據(jù)科學(xué)家都必須意識到的概念具有巨大的重要性,。

什么是正態(tài)分布,?

正態(tài)分布也被稱為高斯分布或鐘形曲線(因為它看起來像一個鐘),這是統(tǒng)計學(xué)中最重要的概率分布,,就像我們在大自然中經(jīng)??吹降哪菢樱悬c神奇,。例如,,身高、體重,、血壓,、測量誤差、智商得分等都服從正態(tài)分布,。

還有一個跟它相關(guān)的,,并且非常重要的概念,叫中心極限定理,,這將在以后的文章中討論,。

徹底理解正態(tài)分布——強(qiáng)大的數(shù)學(xué)分析工具

現(xiàn)在,參考上面的圖像,,并了解一個正常變量的值是如何分布的,。這是一個對稱分布,其中大多數(shù)觀測值聚集在具有最高發(fā)生概率的中心峰(均值/平均值)附近,,并且當(dāng)我們在兩個方向上都偏離中心峰時,,我們看到曲線尾部出現(xiàn)值的可能性越來越小。此圖描繪了一個群體的智商水平,可以理解,,智商水平非常低或智商水平很高的人很少見,,并且大多數(shù)人都處于平均智商得分范圍內(nèi)。

我們周圍的很多很多變量都可以用這個正態(tài)分布來描述,。想想所有同事到達(dá)辦公室所需要的時間,,只有少數(shù)人會住在5分鐘或2個多小時的距離內(nèi)(尾部)。大多數(shù)人將在20分鐘-70分鐘的距離(即峰值附近的區(qū)域),。當(dāng)你研究越來越多的正態(tài)分布的變量時,,你會發(fā)現(xiàn)它無處不在。

正態(tài)分布的參數(shù)

正態(tài)分布總是以平均值為中心,,而曲線的寬度則由標(biāo)準(zhǔn)差(SD)決定,。

徹底理解正態(tài)分布——強(qiáng)大的數(shù)學(xué)分析工具

這是兩個正態(tài)分布,x軸上的高度單位是英寸,,y軸上是特定高度對應(yīng)的人數(shù),。

  1. 嬰兒的平均身高為20英寸(50cm),標(biāo)準(zhǔn)差為0.6英寸(1.5cm),。
  2. 成年人的平均分布為70英寸(175cm),,標(biāo)準(zhǔn)差為4英寸(10cm)

了解正態(tài)分布標(biāo)準(zhǔn)差的意義在于,它遵循一個經(jīng)驗法則,,即大約95%的測量值落在均值附近的+/- 2倍個標(biāo)準(zhǔn)差之間,。

推論:95%的人口落在平均值+/- 2*SD之間

  1. 95%的嬰兒身高在20 +/- 1.2英寸之間
  2. 95%的成年人身高測量值在70 +/- 8英寸之間

正態(tài)分布的第一個參數(shù)是均值

均值或平均值是正態(tài)分布的集中趨勢,它決定了曲線峰值的位置,。平均值的變化導(dǎo)致曲線沿x軸水平移動,。

正態(tài)分布的第二個參數(shù)是標(biāo)準(zhǔn)差SD

標(biāo)準(zhǔn)差是正態(tài)分布變異性的量度,它決定了曲線的寬度,。SD值的變化導(dǎo)致曲線變得更窄或更寬,,并對曲線的高度產(chǎn)生反比例的影響。

  • 更緊的曲線(較小的寬度)->更高的高度
  • 更寬的曲線(更高的寬度)->更短的高度

現(xiàn)在,,你已經(jīng)了解了正態(tài)分布曲線的所有基礎(chǔ)知識,。讓我們繼續(xù)學(xué)習(xí)與之相關(guān)的其他重要信息。

徹底理解正態(tài)分布——強(qiáng)大的數(shù)學(xué)分析工具

所有正態(tài)分布的共同特征

  1. 它們都是對稱的,。
  2. 平均值=中位數(shù)
  3. 根據(jù)經(jīng)驗法則,,我們可以確定正態(tài)分布曲線離均值標(biāo)準(zhǔn)差范圍內(nèi)的數(shù)據(jù)百分比。

通過一個示例,,這一點將變得更加清楚,。

徹底理解正態(tài)分布——強(qiáng)大的數(shù)學(xué)分析工具

讓我們來看一個披薩外賣的例子。假設(shè)一家披薩餐廳的平均配送時間為30分鐘,,標(biāo)準(zhǔn)偏差為5分鐘,。根據(jù)經(jīng)驗法則,我們可以確定68%的交付時間在25-35分鐘(30 +/- 5)之間,,95%在20-40分鐘(30 +/- 2*5)之間,,99.7%在15-45分鐘(30 +/-3*5)之間。

當(dāng)我們知道如何將統(tǒng)計應(yīng)用于現(xiàn)實生活中的問題時,,看到事情變得多么直觀了嗎,?我的統(tǒng)計學(xué)家、數(shù)據(jù)科學(xué)家/工程師,、ML/AI愛好者或正在閱讀這篇文章的那些好奇的家伙們,,繼續(xù)前進(jìn)吧!

在這篇文章的最后一部分,,我們將學(xué)習(xí)正態(tài)分布的一個特例

標(biāo)準(zhǔn)正態(tài)分布:正態(tài)分布的特例

如前所述,,正態(tài)分布根據(jù)參數(shù)值(平均值和標(biāo)準(zhǔn)差)有許多不同的形狀。標(biāo)準(zhǔn)正態(tài)分布是正態(tài)分布的一個特例,,均值為0,,標(biāo)準(zhǔn)差為1。這個分布也稱為Z分布,。

標(biāo)準(zhǔn)正態(tài)分布上的值稱為標(biāo)準(zhǔn)分?jǐn)?shù)或Z分?jǐn)?shù),。標(biāo)準(zhǔn)分?jǐn)?shù)表示某一特定觀測值高于或低于平均值的SD數(shù)。

例如,,標(biāo)準(zhǔn)得分為1.5表示觀察到的結(jié)果比平均值高1.5個標(biāo)準(zhǔn)差,。另一方面,負(fù)分?jǐn)?shù)表示低于平均值的值,。平均值的Z分?jǐn)?shù)為0,。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點,。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報,。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多