用數(shù)學(xué)符號 X~B(n,p) 來表示二項分布,。即做n個兩點分布的實驗,其中,,
E
=
n
p
E = np
E=np,,
D
=
n
p
(
1
?
p
)
D = np(1-p)
D=np(1?p)。而它的概率分布函數(shù)為:
P
(
k
)
=
C
n
k
p
k
(
1
?
p
)
n
?
k
P(k)=C_n^kp^k(1-p)^{n-k}
P(k)=Cnk?pk(1?p)n?k,。
對于拋硬幣的問題,,做100次實驗,正反面概率都為0.5,,觀察其概率分布函數(shù):
from scipy.stats import binom
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
# Binomial distribution
n =100
p =0.5
k = np.arange(20,80)
binomial = binom.pmf(k,n,p)
plt.plot(k, binomial,'o-')
plt.title('binomial:n=%i,p=%.2f'%(n,p))
plt.xlabel('number of success')#正面向上的次數(shù)
plt.ylabel('probalility of success')
plt.grid(True)
plt.show()
用數(shù)學(xué)符號 X~GE(p) 來表示幾何分布。即在n次伯努利實驗中,,第k次實驗才得到第一次成功的概率分布,。其中:
P
(
k
)
=
(
1
?
p
)
(
k
?
1
)
p
P(k) = (1-p)^{(k-1)}p
P(k)=(1?p)(k?1)p。期望值
E
=
1
/
p
E = 1/p
E=1/p 推導(dǎo)方法就是利用利用錯位相減法然后求lim - k ->無窮 ,。方差
D
=
(
1
?
p
)
/
p
2
D = (1-p)/p^2
D=(1?p)/p2 推導(dǎo)方法利用了
D
(
x
)
=
E
(
x
)
2
?
E
(
x
2
)
D(x) = E(x)^2-E(x^2)
D(x)=E(x)2?E(x2),,其中
E
(
x
2
)
E(x^2)
E(x2)求解同上,。
對于拋硬幣的問題,正反面概率都為0.5,,觀察第k次實驗才得到第一次成功的概率分布函數(shù):
from scipy.stats import geom
# 幾何分布(geometric distribution)
n =10
p =0.5
k = np.arange(1,10)
geom_dis = geom.pmf(k,p)
plt.plot(k, geom_dis,'o-')
plt.title('geometric distribution')
plt.xlabel('i-st item success')
plt.ylabel('probalility of i-st item success')
plt.grid(True)
plt.show()
from scipy.stats import poisson
# 泊松分布(poisson distribution)
mu =2
x = np.arange(10)
plt.plot(x, poisson.pmf(x, mu),'o')
plt.title(u'poisson distribution')
plt.xlabel('shot case count')
plt.ylabel('probalility of shot case count')
plt.grid(True)
plt.show()
這個證明過程簡單表示:
P
(
s
+
t
∣
s
)
=
P
(
s
+
t
,
s
)
/
P
(
s
)
=
F
(
s
+
t
)
/
F
(
s
)
=
P
(
t
)
P(s+t| s) = P(s+t , s)/P(s) = F(s+t)/F(s)=P(t)
P(s+t∣s)=P(s+t,s)/P(s)=F(s+t)/F(s)=P(t)
它的概率密度函數(shù)為:
f
(
x
)
=
{
λ
e
?
λ
x
x
>
0
,
λ
>
0
0
x
≤
0
f(x)=
f(x)={λe?λx0?x>0,λ>0x≤0?
期望值
E
=
1
/
λ
E=1/λ
E=1/λ,方差
D
=
1
/
λ
2
D=1/λ^2
D=1/λ2,。
from scipy.stats import expon
# 指數(shù)分布
fig,ax = plt.subplots(1,1)
lambdaUse =2
loc =0
scale =1.0/lambdaUse
#ppf:累積分布函數(shù)的反函數(shù),。q=0.01時,,ppf就是p(X<x)=0.01時的x值,。
x = np.linspace(expon.ppf(0.01,loc,scale),expon.ppf(0.99,loc,scale),100)
ax.plot(x, expon.pdf(x,loc,scale),'b-',label ='expon')
plt.xlabel('x')
plt.ylabel('f(x)')
plt.title(u'expon distribution')
plt.show()
顯示結(jié)果如下:
6. 正態(tài)分布(高斯分布)
用數(shù)學(xué)符號 X~N(μ,,σ^2) 表示正態(tài)分布。期望值
E
=
μ
E = μ
E=μ,,方差
D
=
σ
2
D = σ^2
D=σ2,。
正態(tài)分布是比較常見的,譬如學(xué)生考試成績的人數(shù)分布,、身高分布等,。
它的概率密度函數(shù)是:
f
(
x
)
=
1
2
π
σ
e
x
p
(
?
(
x
?
μ
)
2
2
σ
2
)
f(x)=\frac{1}{\sqrt{2\pi} \sigma}exp(-\frac{(x-\mu)^2}{2\sigma^2})
f(x)=2π?σ1?exp(?2σ2(x?μ)2?)
from scipy.stats import norm
# 正態(tài)分布(normal distribution)
fig,ax = plt.subplots(1,1)
loc =1
scale =2.0#ppf:累積分布函數(shù)的反函數(shù)。q=0.01時,,ppf就是p(X<x)=0.01時的x值,。
x = np.linspace(norm.ppf(0.01,loc,scale),norm.ppf(0.99,loc,scale),100)
ax.plot(x, norm.pdf(x,loc,scale),'-',label ='norm')
plt.title(u'normal distribution')
plt.show()