本來今天想要講講軟件操作的,,后來發(fā)現(xiàn)好像還有好幾個(gè)重要的指標(biāo)沒有說,干脆等全部說完在講操作吧,,否則操作出來的結(jié)果會(huì)發(fā)現(xiàn)大量的“不明覺厲”,。 首先是空間統(tǒng)計(jì)里面很神秘的兩個(gè)值:P值和Z值。 要說這兩個(gè)值之前,,還是要復(fù)習(xí)一下統(tǒng)計(jì)學(xué)的概念,,畢竟空間統(tǒng)計(jì)的理論基礎(chǔ)還是建立在經(jīng)典統(tǒng)計(jì)學(xué)上面的。 首先,,統(tǒng)計(jì)學(xué)里面,,有一個(gè)叫做“零假設(shè)”的概念非常厲害,一定要說說,。 零假設(shè)(null hypothesis),,有時(shí)候又稱原假設(shè),官方的解釋是:指進(jìn)行統(tǒng)計(jì)檢驗(yàn)時(shí)預(yù)先建立的假設(shè),。也就是說,,你在檢驗(yàn)?zāi)愕慕Y(jié)果之前,先對(duì)這些結(jié)果假設(shè)一個(gè)數(shù)值區(qū)間,,這個(gè)區(qū)間一般是符合某種概率分布的情況,,如果你的真實(shí)結(jié)果偏離了你設(shè)定的區(qū)間,就表示發(fā)生了小概率事件,。這樣你原來的假設(shè)就不成立了,。 如下圖所示: 如果你的計(jì)算結(jié)果落在-2到2之間,就表示你的假設(shè)是可以接受得,,但是不在這個(gè)范圍內(nèi),,就說明消息小概率事件了。既然有小概率事件,,就說明兩種可能:1,,你的假設(shè)有錯(cuò)誤;2,,出現(xiàn)了異常值,。
這個(gè)神奇的零假設(shè)有啥用呢?看下面這個(gè)例子: 我們來拋一枚硬幣,,(我發(fā)現(xiàn)統(tǒng)計(jì)學(xué),,特別是經(jīng)典統(tǒng)計(jì)學(xué)最喜歡拋硬幣了),在丟之前,,我們就已經(jīng)設(shè)定了無論正反兩面的概率都在50%左右,,(實(shí)際上更接近48%——52%這個(gè)區(qū)間)那么如果我們丟出來的結(jié)果,,出現(xiàn)了正面概率高達(dá)80%,而反面才出現(xiàn)了20%,,那就是說,,超出了我預(yù)設(shè)的范圍,發(fā)生了小概率現(xiàn)象,,那么這種小概率現(xiàn)象就很值得研究了,蝦神個(gè)人認(rèn)為,,如果出現(xiàn)了這種情況,,最大可能是這個(gè)硬幣被做了手腳。 當(dāng)然,,還有可能是出現(xiàn)硬幣豎立了起來這種極小概率的事情……這種就得歸類到異常值里面去了,。 (關(guān)于拋硬幣的另外一種思維方式,還可以看這篇文章:拋硬幣的兩種思維方式: 在經(jīng)典統(tǒng)計(jì)里面,,零假設(shè)認(rèn)為你統(tǒng)計(jì)計(jì)算的數(shù)據(jù)是符合某種概率的,,那么在空間統(tǒng)計(jì)里面,零假設(shè)表示什么呢,? 看下面這個(gè)例子: 如果說,,A市在7月份發(fā)生了200起案件,理論上,,不設(shè)定條件的話,,這200起案件應(yīng)該是平均的分布在A市的每個(gè)區(qū)域的,但是實(shí)際上這是不可能的,,我們會(huì)發(fā)現(xiàn)某些地區(qū),,案發(fā)率遠(yuǎn)遠(yuǎn)高于其他地區(qū)。 那么上面那個(gè)命題,,最開始我們說明的,,200起案件,平均分布在全市各個(gè)地方,,就是所謂的“零假設(shè)”,,在空間統(tǒng)計(jì)中,零假設(shè)指的就是空間位置在一定區(qū)域里面呈現(xiàn)完全隨機(jī)(均勻)分布(在自然現(xiàn)象里面,,均勻分布是極小概率才會(huì)出現(xiàn)的,,基本上都可以忽略了,所以一般談的就是完全隨機(jī)),。 按照這樣的假設(shè),,我們就可以對(duì)整個(gè)城市的案件案發(fā)地點(diǎn)進(jìn)行統(tǒng)計(jì)分析了,如果計(jì)算出來的結(jié)果,,符合我們假設(shè),,那么就只能說,,這200起案件,發(fā)生的地點(diǎn)是隨機(jī)的,,沒有聚集規(guī)律或者離散的規(guī)律,。 在空間數(shù)據(jù)的分析中,有一個(gè)很重要內(nèi)容,,就是知道數(shù)據(jù)分布是否有規(guī)律,。 拿到一份數(shù)據(jù)的時(shí)候,第一時(shí)間,,要了解的,,就是這份數(shù)據(jù)是不是有規(guī)律,因?yàn)橛幸?guī)律的數(shù)據(jù)才能進(jìn)行更好的分析,。而如果你拿到的這份數(shù)據(jù)是一份隨機(jī)分布的數(shù)據(jù),,那么一般來說,就沒有啥分析研究的可能了,。因?yàn)榧冸S機(jī)(完全隨機(jī))是無法預(yù)測也無法找到模式的,,就像素?cái)?shù)(素?cái)?shù)在數(shù)軸上出現(xiàn)的位置就是完全隨機(jī)的,無法找到任何規(guī)律和模式),。 所謂的純隨機(jī),,也有三種可能,一種是你的假設(shè)是純隨機(jī)的,,二是你要計(jì)算的數(shù)據(jù)本身是純隨機(jī)的,,第三就是你要計(jì)算的數(shù)據(jù)與其周邊數(shù)據(jù)的關(guān)系是純隨機(jī)。 那么如何對(duì)隨機(jī)假設(shè)進(jìn)行判斷呢,?也就是說,,你的結(jié)果是接受零假設(shè)還是拒絕零假設(shè),這種就可以通過P,、Z兩種值的結(jié)果來幫助我們進(jìn)行判斷,。 (未完待續(xù)) |
|