久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

新版白話空間統(tǒng)計(jì)(8):莫蘭指數(shù)小結(jié)

 godxiasad 2023-04-21 發(fā)布于北京

本節(jié)對(duì)前面寫(xiě)的莫蘭指數(shù)部分留下的一下小問(wèn)題進(jìn)行解答,,里面包括一些讀者朋友們通過(guò)郵件提出的一些問(wèn)題。

Q1:ArcGIS中,,計(jì)算莫蘭指數(shù)的工具里面的那個(gè)Row(行標(biāo)準(zhǔn)化)是拿來(lái)干嘛的,?

A:所謂的行標(biāo)準(zhǔn)化,指的是在進(jìn)行空間權(quán)重設(shè)定的時(shí)候,,是否對(duì)權(quán)重系數(shù)進(jìn)行標(biāo)準(zhǔn)化,,具體說(shuō)來(lái),看下面這個(gè)例子:

還是這張圖:

那么我們記錄空間關(guān)系時(shí)候,,會(huì)記錄成這樣的結(jié)構(gòu):
城市
臨近城市
空間權(quán)重系數(shù)
北京
石家莊
1
北京
太原
1
北京
天津
1
北京
濟(jì)南
1
西安
蘭州
1
西安
銀川
1
西安
西寧
1
這種情況,,所有有臨近關(guān)系的城市,都記錄為1,,那么現(xiàn)在就帶來(lái)問(wèn)題了:北京與周邊臨近城市的空間權(quán)重之和等于4,,而西安與周邊城市的空間權(quán)重之和,等于3,。

這種情況,,帶入到莫蘭指數(shù)的公式里面的時(shí)候,可能出現(xiàn)因?yàn)榭臻g位置分布不均勻,,或者設(shè)計(jì)采樣以及聚合的方式不一致,,帶來(lái)一些計(jì)算上的麻煩,最大的麻煩就是有時(shí)候莫蘭指數(shù)計(jì)算出來(lái)的結(jié)果,,不在-1 —— 1之間,。(大家可以回憶一下莫蘭指數(shù)的計(jì)算公式,會(huì)迭代累加所有臨近要素的字段值來(lái))

所以,,Esri建議對(duì)空間權(quán)重進(jìn)行標(biāo)準(zhǔn)化,,也就是用1來(lái)除以所有臨近要素的數(shù)量,權(quán)重系數(shù)取平均值,,那么上面這個(gè)空間權(quán)重矩陣就會(huì)記錄成這個(gè)樣子:

城市
臨近城市
空間權(quán)重系數(shù)
北京
石家莊
0.25
北京
太原
0.25
北京
天津
0.25
北京
濟(jì)南
0.25
西安
蘭州
0.333
西安
銀川
0.333
西安
西寧
0.333

這樣,,所有的空間要素與臨近要素的空間權(quán)重之和,就都等于1了,,不管你如何去設(shè)計(jì)你的采樣方式,,也不管數(shù)據(jù)分布是稀疏還是稠密,,帶入到公式里面的計(jì)算權(quán)重結(jié)果都是一樣的。

Q2,、莫蘭指數(shù)計(jì)算的時(shí)候,,為什么說(shuō)最少需要30個(gè)樣本才具備一定的可信性?這種說(shuō)法出自哪個(gè)理論,?

A:30個(gè)樣本這個(gè)說(shuō)法只是一個(gè)經(jīng)驗(yàn)公式,,沒(méi)有確切的理論來(lái)證明。

所謂的“經(jīng)驗(yàn)公式”,,就是某個(gè)大牛,,在某次會(huì)議或者與同行聊天的時(shí)候說(shuō):我覺(jué)得,這個(gè)樣子,,應(yīng)該就差不多了……然后所謂的“這個(gè)樣子”就是經(jīng)驗(yàn)公式了,,至于后面那個(gè)“應(yīng)該就差不多了”,就被大家選擇性的遺忘,。

最出名的經(jīng)驗(yàn)公式,,就是費(fèi)舍爾的95%(后面在講PZ值的時(shí)候,還會(huì)給大家詳細(xì)說(shuō)這個(gè)故事),。

那么既然這30個(gè)樣本,,只是個(gè)經(jīng)驗(yàn)公式,那么在實(shí)際使用的時(shí)候,,可不可以不遵守呢,?比如我就只有15個(gè)樣本(例如要做某個(gè)市各縣區(qū)的空間自相關(guān)——我國(guó)大部分地級(jí)市,下面只有十幾個(gè)區(qū)縣,;或者我要做北京市某個(gè)指標(biāo)的空間自相關(guān)——北京也只有十六個(gè)區(qū)縣)不夠30個(gè)怎么辦,?

答案當(dāng)然是肯定的。首先確定30個(gè)樣本只是建議值,,并非確定值,只是一般來(lái)說(shuō),,如果不滿30個(gè)樣本做出來(lái)的結(jié)果可能不是非常顯著,,但是絕對(duì)不是不可以用。(當(dāng)然,,你要遇上某個(gè)教條型的審稿人,,把你的論文給斃回來(lái)的話,蝦神也是木有辦法的),。

如果真的遇上這種情況,,就像真要去做北京市的莫蘭指數(shù),十六個(gè)區(qū)縣加入運(yùn)算,,導(dǎo)致結(jié)果不顯著,,有沒(méi)有改進(jìn)的辦法呢,?答案肯定是有的。

為什么說(shuō)不滿30個(gè)會(huì)導(dǎo)致結(jié)果不顯著呢,?因?yàn)槟m指數(shù)需要計(jì)算某個(gè)樣本的臨近指標(biāo)值,,所以你樣本數(shù)量太少,會(huì)導(dǎo)致臨近要素也相對(duì)比較少,,所以算出來(lái)結(jié)果很不理想,。那么解決方法自然就是增加臨近要素咯——很簡(jiǎn)單做法,就是自定義空間權(quán)重關(guān)系,,增加空間臨近要素,。根據(jù)Esri的研究結(jié)果表明,如果你的數(shù)據(jù)屬性分布偏斜嚴(yán)重的時(shí)候,,建議每個(gè)要素最好要有8個(gè)或者8個(gè)以上的臨近要素,,結(jié)果才比較可靠。

至于怎么做去,?等講到空間權(quán)重矩陣的時(shí)候,,我們會(huì)詳細(xì)說(shuō)明——如果有等不及的同學(xué),可以看舊版本的白話空間統(tǒng)計(jì)里面有關(guān)空間權(quán)重矩陣的部分:(下面是舊版,,里面很多內(nèi)容在新版里面會(huì)重新訂正——基本上會(huì)是重寫(xiě),,敬請(qǐng)期待)

首先是空間關(guān)系概念化:

    然后是空間權(quán)重矩陣:

    嗯,還有兩個(gè)外篇:

Q3,、不會(huì)用ArcGIS,,還有其他軟件可以做莫蘭指數(shù)么?

A,、當(dāng)然有,,ArcGIS是最全面的工具,和空間相關(guān)你只要想找,,都能找到——所以通常把ArcGIS這種大型軟件比喻成沃爾瑪……從一次性口罩到雷明頓狙擊槍?zhuān)ó?dāng)然是美國(guó)的沃爾瑪),,只要你想買(mǎi)的東西,都能找得到……

但是如果你要買(mǎi)個(gè)口香糖,,街邊的便利店也是可以買(mǎi)到的……或者你覺(jué)得沃爾瑪?shù)臉屩ХN類(lèi)太少,,也可以去光顧專(zhuān)業(yè)的槍店:

好了,言歸正傳——

所以,,除了ArcGIS以外,,還有很多軟件可以做莫蘭指數(shù):

如果你會(huì)寫(xiě)代碼的話,Python里面的PySAL,,就可以實(shí)現(xiàn)空間統(tǒng)計(jì)的大部分功能:

或者使用R語(yǔ)言里面的Spdep

這兩個(gè)是我最經(jīng)常用的,,特別是Spdep包,具備了極其強(qiáng)大的空間統(tǒng)計(jì)分析能力,,包括空間權(quán)重矩陣,、多種空間自相關(guān)算法,、多種空間統(tǒng)計(jì)學(xué)模型等等。

當(dāng)然,,如果你說(shuō),,不會(huì)寫(xiě)代碼怎么辦呢?你還可以使用號(hào)稱(chēng)空間統(tǒng)計(jì)學(xué)第一強(qiáng)大的軟件:Geoda:

具體geoda有多出名我這里不詳細(xì)說(shuō)明了,,在后面講LISA的時(shí)候,,還會(huì)在把這個(gè)東西給拉出來(lái)。目前關(guān)鍵是Geoda目前開(kāi)發(fā)小組里面的負(fù)責(zé)人之一,,是中國(guó)人,,所以目前這個(gè)軟件包括了全中文界面和說(shuō)明,大家有興趣的可以下載試用一下,。

另外,,Geoda軟件提供的下載,有百度云盤(pán)地址——灰常中國(guó)特色,,大家可以在公眾號(hào)發(fā)送“geoda”來(lái)提取云盤(pán)地址,。


Q4、點(diǎn)和面,,要做空間自相關(guān)很好理解,,如果我要用線來(lái)做空間自相關(guān)怎么做呢?

A:ArcGIS里面支持用線圖層做空間自相關(guān),,但是僅支持下面幾種空間權(quán)重模式:

即:
  • 反距離模式

  • 反距離平方模式

  • 距離范圍模式

  • 無(wú)差別區(qū)域模式

  • 自定義權(quán)重文件模式:

可以看見(jiàn),,面要素常見(jiàn)的共邊相鄰和共點(diǎn)相鄰模式?jīng)]有,所以說(shuō),,做空間統(tǒng)計(jì),,最核心的在于如何定義空間權(quán)重關(guān)系

在ArcGIS里面,,線與線的距離,,通常是測(cè)量?jī)蓷l線的中點(diǎn)的距離,所以測(cè)量出來(lái)的距離與認(rèn)知并不一致……如果想按照你自定義的空間關(guān)系來(lái)做線要素的空間自相關(guān),,那又回到了那個(gè)老問(wèn)題:自定義空間權(quán)重矩陣文件,。

PS:geoda目前不支持線數(shù)據(jù)做空間統(tǒng)計(jì):


Q5、我的數(shù)據(jù)是一堆點(diǎn),,只有空間位置,沒(méi)有屬性信息,,可不可以做莫蘭指數(shù),?

A:首先,這些點(diǎn)本身是不可以做莫蘭指數(shù)的,,因?yàn)樽瞿m指數(shù)的話,,必須有一個(gè)屬性字段,,而且還必須是數(shù)值型的屬性字段才行。

如果沒(méi)有屬性字段,,就只能做密度分析——這當(dāng)然也是一種空間分析手段,;另外還可以做多距離空間聚類(lèi)分析,當(dāng)然這種方法,,我后面在講多距離空間聚類(lèi)分析 (Ripley's K 函數(shù))的時(shí)候會(huì)專(zhuān)門(mén)寫(xiě),。

除了上面兩種方式,那么有沒(méi)有其他的辦法呢,?當(dāng)然木有問(wèn)題(蝦神語(yǔ)錄:有困難要上,,木有困難,創(chuàng)造困難也要上),。

如果你的點(diǎn),,表示某種事件,比如是一起疾病病例,,或者是一起刑事案件,,那么可以把點(diǎn)規(guī)約到行政區(qū)劃上面,一個(gè)點(diǎn)計(jì)數(shù)為1,,這樣行政區(qū)劃上,,多個(gè)數(shù)值了。

除了可以規(guī)約到行政區(qū)劃上,,也可以劃分成網(wǎng)格,,把點(diǎn)規(guī)約到網(wǎng)格上面,也是可以的,。

Q6,、莫蘭指數(shù)除了你上一節(jié)介紹的用來(lái)做空間分布的案例以外,還能做什么,?

A:莫蘭指數(shù)號(hào)稱(chēng)空間統(tǒng)計(jì)學(xué)第一指路標(biāo),,它幾乎在所有空間統(tǒng)計(jì)算法里面都有應(yīng)用:

首先,探索空間數(shù)據(jù)是否具備一定的分布特征,,是莫蘭指數(shù)的天賦技能,,也是他得以存在的意義,這個(gè)我們前面已經(jīng)說(shuō)過(guò)的度量經(jīng)濟(jì)空間分布特征隨著時(shí)間的變化發(fā)生的變化,,就是主要的應(yīng)用之一,,那么同樣,你也可以用來(lái)研究人口,、民族,、社會(huì)生活等等其他的方面。

其次,在任何需要探索合適距離的場(chǎng)合,,都可以用:

在做聚類(lèi)的時(shí)候,,最關(guān)鍵的是選擇聚類(lèi)的合適距離,那么你就可以用莫蘭指數(shù)來(lái)進(jìn)行探索,。

又或是做插值分析的時(shí)候,,尋找多大距離內(nèi)的點(diǎn)來(lái)進(jìn)行插值,也很重要,,那么你也可以用莫蘭指數(shù)來(lái)進(jìn)行探索,。

然后,還可以度量某些數(shù)據(jù)隨著空間的變化發(fā)生的一些規(guī)律,,比如總結(jié)某種社會(huì)輿情,、疾病疫情等的趨勢(shì)是否隨空間和時(shí)間變化的傳播情況 ——這些觀點(diǎn)、疾病或趨勢(shì)是繼續(xù)保持隔離和集中呢,,還是已經(jīng)傳播開(kāi)并變得更加分散了,。(請(qǐng)研究本次新冠疫情同學(xué)繼續(xù)加油)

(以上案例,將在后面的文章中,,逐一展開(kāi)——有空的話

待續(xù)未完,,下期更精彩
轉(zhuǎn)發(fā)、打賞,、點(diǎn)贊——隨緣,。

    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多