早期研究發(fā)現(xiàn)在很多網(wǎng)絡(luò)中,少數(shù)節(jié)點(diǎn)占據(jù)了整個(gè)網(wǎng)絡(luò)中的大部分連邊,,而多數(shù)節(jié)點(diǎn)的連邊數(shù)量很少,,節(jié)點(diǎn)連邊數(shù)量的分布符合冪律,。以巴拉巴西為代表的科學(xué)家們發(fā)現(xiàn)了大量滿足冪律的網(wǎng)絡(luò)結(jié)構(gòu),這種網(wǎng)絡(luò)被稱為無(wú)標(biāo)度網(wǎng)絡(luò),。人們?cè)絹?lái)越傾向于認(rèn)為,,冪律(Power Low)是無(wú)處不在規(guī)律,尤其在復(fù)雜網(wǎng)絡(luò)中,。 而2018年1月份發(fā)表的一篇論文,,掀起了網(wǎng)絡(luò)科學(xué)領(lǐng)域的腥風(fēng)血雨。文中考察了1000種網(wǎng)絡(luò),,只有4%是真正符合冪律分布的無(wú)標(biāo)度網(wǎng)絡(luò),,這對(duì)冪律分布的普遍性提出了質(zhì)疑。冪律分布(Power Law)的發(fā)現(xiàn)和證明是網(wǎng)絡(luò)科學(xué)發(fā)展史上最具有價(jià)值,,最轟動(dòng),,影響力最大的事件之一。這就好比哥白尼提出“日心說(shuō)”,,開(kāi)始撼動(dòng)“地心說(shuō)”的統(tǒng)治地位,。那么冪律分布的前世今生到底是什么樣呢。我們先來(lái)了解一下,。 1.冪律分布和無(wú)標(biāo)度網(wǎng)絡(luò)的 前世今生 早有學(xué)者發(fā)現(xiàn),,從WWW網(wǎng)絡(luò)到細(xì)胞中的蛋白質(zhì)相互作用網(wǎng)絡(luò)都具有無(wú)標(biāo)度的性質(zhì)(Scale-free),,直觀來(lái)說(shuō),在眾多網(wǎng)絡(luò)節(jié)點(diǎn)中,,那些擁有極大連邊的點(diǎn)占少部分,,大部分都僅有較少的連邊,比如WWW網(wǎng)絡(luò)中只有少數(shù)超文本擁有海量的超鏈接,。一個(gè)節(jié)點(diǎn)擁有的連邊數(shù)量在網(wǎng)絡(luò)中稱為一個(gè)節(jié)點(diǎn)的度(Degree),,用數(shù)學(xué)來(lái)描述這類網(wǎng)絡(luò)中節(jié)點(diǎn)度的分布就是我們說(shuō)的冪律分布(Power Law)。 如果無(wú)標(biāo)度網(wǎng)絡(luò)真實(shí)存在,,那它將給一些現(xiàn)象提供一個(gè)可解釋思路,,比如一個(gè)小小的病毒如何導(dǎo)致異常大規(guī)模流行病的傳播;一個(gè)黑客為什么能夠輕易的造成大規(guī)模的網(wǎng)絡(luò)癱瘓,。 最早針對(duì)無(wú)標(biāo)度網(wǎng)絡(luò)進(jìn)行深度研究的是來(lái)自美國(guó)東北大學(xué),、從物理系跨界的科學(xué)家——Barabási(巴拉巴西),他是目前網(wǎng)絡(luò)科學(xué)領(lǐng)域的大牛,。他在網(wǎng)絡(luò)科學(xué)科普書籍《鏈接》中稱,冪律分布在真實(shí)世界中無(wú)處不在,,了解冪律分布背后的成因,,給出合理的解釋,是推動(dòng)網(wǎng)絡(luò)科學(xué)發(fā)展和進(jìn)步的重要工作,。在這之后,,成千上萬(wàn)的文章對(duì)真實(shí)世界中的冪律現(xiàn)象進(jìn)行了探討,無(wú)標(biāo)度網(wǎng)絡(luò)和冪律分布已經(jīng)成為了網(wǎng)絡(luò)科學(xué)學(xué)者普遍認(rèn)同的規(guī)律和知識(shí),。 真實(shí)世界網(wǎng)絡(luò)顯示出豐富多樣的結(jié)構(gòu),,這可能需要新的理論模型來(lái)解釋?!撐淖髡?Anna Broido 和 Aaron Clauset 2.質(zhì)疑聲音: 冪律在網(wǎng)絡(luò)世界中其實(shí)很罕見(jiàn),! 近期科羅拉多大學(xué)的兩位學(xué)者 Anna Brodio 和 Aaron Clauset 發(fā)現(xiàn),在1000個(gè)真實(shí)網(wǎng)絡(luò)中只有4%的網(wǎng)絡(luò)通過(guò)了冪律分布的強(qiáng)檢驗(yàn),,而67%的網(wǎng)絡(luò)是不服從冪律分布的,,包括之前研究多次提到的Facebook的朋友關(guān)系網(wǎng)絡(luò)。因此冪律分布的普遍性在此受到了質(zhì)疑,,兩位學(xué)者指出面對(duì)真實(shí)世界中豐富又充滿多樣性的網(wǎng)絡(luò)結(jié)構(gòu),,我們需要一套新的機(jī)制去解釋他們。 Aaron Clauset 發(fā)現(xiàn)在自然界中無(wú)標(biāo)度網(wǎng)絡(luò)是罕見(jiàn)的,,這與流行的看法相反 論文合著者:Anna Broido 大多數(shù)網(wǎng)絡(luò)科學(xué)家肯定了兩位作者在統(tǒng)計(jì)學(xué)上的分析,,但是談到如何解釋這些統(tǒng)計(jì)結(jié)果上,網(wǎng)絡(luò)科學(xué)家有兩種聲音,,激烈的爭(zhēng)論在Twitter上演,。 介于隨機(jī)網(wǎng)絡(luò)和無(wú)標(biāo)度網(wǎng)絡(luò)之間的網(wǎng)絡(luò)(以 Facebook 用戶網(wǎng)絡(luò)為例) 支持無(wú)標(biāo)度模型的學(xué)者認(rèn)為無(wú)標(biāo)度網(wǎng)絡(luò)模型是一個(gè)理想化的模型,,而不是精確地捕捉真實(shí)世界的網(wǎng)絡(luò)行為。他們說(shuō),,無(wú)標(biāo)度網(wǎng)絡(luò)的許多最重要的特性,,也適用于一個(gè)更廣泛的類,稱為“重尾網(wǎng)絡(luò)”(heavy-tailed),,許多現(xiàn)實(shí)世界的網(wǎng)絡(luò)可能屬于這個(gè)網(wǎng)絡(luò)(這些網(wǎng)絡(luò)的連接概率比隨機(jī)網(wǎng)絡(luò)高得多,,但不一定遵循嚴(yán)格的冪律)。 反對(duì)者則認(rèn)為像“無(wú)標(biāo)度”和“重尾”這樣的概念在網(wǎng)絡(luò)科學(xué)文獻(xiàn)中存在模糊和不一致的表述,,使得這些命題存在不可證偽的問(wèn)題(能夠稱之為科學(xué)的概念都必須具有可證偽性即總是存在一種方法能夠證明該命題錯(cuò)誤),。 有評(píng)論家說(shuō)這篇文章就嘗試著解決了定義中的模糊性和混淆性,當(dāng)然網(wǎng)絡(luò)科學(xué)作為近20年里剛興起的一門年輕的學(xué)科,,肯定存在很多不成熟的地方,,包括對(duì)無(wú)標(biāo)度網(wǎng)絡(luò)的研究也不盡然全面,發(fā)展至今也仍然是一片待開(kāi)墾的新領(lǐng)域,。 3.冪律是普適法則嗎,? ——Barabási的無(wú)標(biāo)度網(wǎng)絡(luò)研究 每個(gè)節(jié)點(diǎn)都有4條連邊,網(wǎng)絡(luò)的特征尺度為4 關(guān)于網(wǎng)絡(luò)的特征尺度問(wèn)題:在一個(gè)二維正方體晶格網(wǎng)絡(luò)中我們說(shuō)一個(gè)節(jié)點(diǎn)與4個(gè)其他節(jié)點(diǎn)連接,,也就是網(wǎng)絡(luò)中節(jié)點(diǎn)的平均度是4,,這就是可以看做一個(gè)網(wǎng)絡(luò)的特征尺度。 在隨機(jī)網(wǎng)絡(luò)中,,一對(duì)節(jié)點(diǎn)的以一定概率連接,,盡管這個(gè)概率大小可以不同,但是它們會(huì)集中在一個(gè)平均值附近,,這也就可以用以描述網(wǎng)絡(luò)的特征大小,,節(jié)點(diǎn)的度分布呈現(xiàn)一個(gè)鐘形曲線,遠(yuǎn)遠(yuǎn)大于平均值的大度節(jié)點(diǎn)基本不會(huì)出現(xiàn),。 隨機(jī)網(wǎng)絡(luò) 但是 Barabási在研究萬(wàn)維網(wǎng)(WWW網(wǎng)絡(luò))時(shí)發(fā)現(xiàn),,有些網(wǎng)站,比如谷歌和雅虎,,它們的鏈接數(shù)往往遠(yuǎn)大于其他網(wǎng)站,,畫出該網(wǎng)絡(luò)的度分布,會(huì)發(fā)現(xiàn)它存在冪律特征(即度為k的節(jié)點(diǎn)的個(gè)數(shù)與I/k的某個(gè)指數(shù)函數(shù)成正比,,比如在萬(wàn)維網(wǎng)中這個(gè)指數(shù)大概是2),。 把具有冪律特征的網(wǎng)絡(luò)稱為無(wú)標(biāo)度網(wǎng)絡(luò)的原因是:冪律分布沒(méi)有峰值,只是隨著度增大節(jié)點(diǎn)數(shù)減少,,但是減少的速率相對(duì)較慢,,并且如果你放大網(wǎng)絡(luò)的不同部分,它們看起來(lái)很相似,。結(jié)果就是,,大多數(shù)節(jié)點(diǎn)度較小,,但是在眾多度小的節(jié)點(diǎn)中,會(huì)出現(xiàn)一個(gè)大度節(jié)點(diǎn)(hub),。要知道在 Barabási研究網(wǎng)絡(luò)中的冪律現(xiàn)象之前,,冪律分布研究已經(jīng)是統(tǒng)計(jì)物理學(xué)的一個(gè)重要分支了,并且演化出了分形(Fractals)和自組織臨界(self-organized criticality)兩個(gè)分支,。 無(wú)標(biāo)度網(wǎng)絡(luò)(以 Twitter 用戶網(wǎng)絡(luò)為例) Barabási自1999年開(kāi)始在頂尖雜志中發(fā)表一系列關(guān)于無(wú)標(biāo)度網(wǎng)絡(luò)的研究,,他和他的研究生 Reka Albert 在眾多真實(shí)網(wǎng)絡(luò)中發(fā)現(xiàn)了冪律分布的現(xiàn)象,包括演員合作網(wǎng),、科學(xué)家引文網(wǎng)等,,該文章的被引數(shù)超過(guò)三萬(wàn)次,這是一個(gè)天文數(shù)字,。 Barabási 用“優(yōu)先連接”的機(jī)制解釋了無(wú)標(biāo)度網(wǎng)絡(luò)的生成,,即“富人更富,窮人更窮”,,當(dāng)網(wǎng)絡(luò)中生成新的節(jié)點(diǎn),,這些節(jié)點(diǎn)會(huì)偏向與度較大的節(jié)點(diǎn),即原有的中心節(jié)點(diǎn)(hub)連接,。他們也在無(wú)標(biāo)度網(wǎng)絡(luò)上進(jìn)行了網(wǎng)絡(luò)動(dòng)力學(xué)和魯棒性的研究,,當(dāng)無(wú)標(biāo)度網(wǎng)絡(luò)受到攻擊時(shí),大部分節(jié)點(diǎn)的損壞并不造成網(wǎng)絡(luò)的崩潰,,但是一旦攻擊中心節(jié)點(diǎn),網(wǎng)絡(luò)將很快失去穩(wěn)定性(這一點(diǎn)也一直遭受部分網(wǎng)絡(luò)專家的反對(duì)),。 總之,,Barabási的工作在網(wǎng)絡(luò)科學(xué)領(lǐng)域掀起了對(duì)無(wú)標(biāo)度研究的熱潮,眾多頂尖雜志都接受了關(guān)于無(wú)標(biāo)度研究的相關(guān)工作,。 Barabási,,美國(guó)東北大學(xué)教授,無(wú)標(biāo)度網(wǎng)絡(luò)研究范式的擁護(hù)者 4.對(duì)無(wú)標(biāo)度網(wǎng)絡(luò)理論早有質(zhì)疑 當(dāng)然在一開(kāi)始就有學(xué)者指出,,偏好連接機(jī)制只是網(wǎng)絡(luò)產(chǎn)生冪律分布的一種機(jī)制,。還有學(xué)者對(duì)一些特殊網(wǎng)絡(luò)中出現(xiàn)的無(wú)標(biāo)度性質(zhì)也產(chǎn)生了質(zhì)疑。 另一方面有人提出無(wú)標(biāo)度網(wǎng)絡(luò)的相關(guān)研究缺乏統(tǒng)計(jì)意義上的嚴(yán)格性,,為了發(fā)一篇更好的文章,,有些作者甚至調(diào)整圖像的角度使得度分布看上去就是冪律那么一回事。(如果將度分布的橫縱坐標(biāo)取雙對(duì)數(shù),,那么無(wú)標(biāo)度的網(wǎng)絡(luò)的度分布會(huì)呈一條直線,,因此有些作者,只要畫出這條直線就認(rèn)為網(wǎng)絡(luò)服從冪律分布,,這真的可信么,?) 為了逃避這個(gè)問(wèn)題,,許多物理學(xué)家把研究重心轉(zhuǎn)移到了重尾網(wǎng)絡(luò)的研究中,當(dāng)然還有一些值得討論的問(wèn)題并沒(méi)有被展開(kāi),,比如:無(wú)標(biāo)度網(wǎng)絡(luò)的準(zhǔn)確含義是什么,?一個(gè)服從冪律分布的網(wǎng)絡(luò)其冪律指數(shù)只能介于2-3之間么?會(huì)不會(huì)有一個(gè)網(wǎng)絡(luò)只是部分服從冪律呢,?沒(méi)有一個(gè)精確的語(yǔ)言表述也使得無(wú)標(biāo)度網(wǎng)絡(luò)的研究越來(lái)越沮喪,。這使得一些學(xué)生甚至誤以為,冪律分布的普遍性已經(jīng)是一個(gè)既定,,被證明過(guò)的事實(shí),。 Clauset并沒(méi)有忽略上面提到的問(wèn)題,他有野心去挑戰(zhàn)在網(wǎng)絡(luò)科學(xué)領(lǐng)域具有統(tǒng)治地位的無(wú)標(biāo)度理論,。在過(guò)去的幾年里他的研究小組收集了大量的真實(shí)網(wǎng)絡(luò)數(shù)據(jù),,形成了ICON(Colorado Index of Complex Networks)數(shù)據(jù)庫(kù),里面有將近4000多個(gè)真實(shí)網(wǎng)絡(luò)的數(shù)據(jù),,覆蓋了社會(huì)經(jīng)濟(jì),、生物、交通等眾多領(lǐng)域,,就是為了找到冪律分布缺乏普遍性的證據(jù),,換句話說(shuō),他試圖證明“冪律分布具有普遍性”這個(gè)命題是錯(cuò)的,,并且推廣到所有可能的實(shí)際網(wǎng)絡(luò)中,。 5.浮塵散去,真相大白,? 統(tǒng)計(jì)數(shù)據(jù)來(lái)說(shuō)話 Clauset和他的研究生Broido在將近1000個(gè)網(wǎng)絡(luò)中進(jìn)行了嚴(yán)格的統(tǒng)計(jì)性檢驗(yàn),,他們?cè)O(shè)計(jì)了一種嚴(yán)格的統(tǒng)計(jì)方法測(cè)試網(wǎng)絡(luò)是否服從無(wú)標(biāo)度的特性(具體細(xì)節(jié)請(qǐng)參考論文原文)。 為了進(jìn)行對(duì)比,,他們還給出了另外兩種分布作對(duì)照,,一種是指數(shù)分布,一種是對(duì)數(shù)正態(tài)分布,,重點(diǎn)觀察分布尾部即大度節(jié)點(diǎn)的分布情況,。 相比冪律分布,指數(shù)分布的尾部更瘦,,意味著大度節(jié)點(diǎn)更稀少,;而對(duì)數(shù)正態(tài)分布的尾部厚度,介于指數(shù)分布和冪律分布之間,。 不同參數(shù)下的指數(shù)分布 不同參數(shù)下的對(duì)數(shù)正態(tài)分布 他們發(fā)現(xiàn)在2/3網(wǎng)絡(luò)的度分布,,完全不能用冪律分布來(lái)解釋,而在剩下的1/3的網(wǎng)絡(luò)中,雖然并非完全服從冪律,,只是不能排除服從冪律分布的可能,。 值得驚訝的是對(duì)數(shù)正態(tài)分布在45%的網(wǎng)絡(luò)中,匹配程度超越了冪律分布,,并且在其他43%的網(wǎng)絡(luò)中與冪律分布打成平手,。只有4%的網(wǎng)絡(luò)通過(guò)嚴(yán)格的統(tǒng)計(jì)檢驗(yàn)(冪律指數(shù)落在2-3的范圍內(nèi)),并且比另外兩種分布更吻合,。 6.爭(zhēng)議: 你不能因?yàn)橐黄鹈|(zhì)疑萬(wàn)有引力 對(duì) Clauset 等人研究的反駁主要有兩種,。 一種反駁意見(jiàn)是,偏好鏈接機(jī)制只是形成無(wú)標(biāo)度屬性的一種可能,,還有很多其他的機(jī)制可以造成無(wú)標(biāo)度的屬性,,而這些機(jī)制共同作用,最終使得網(wǎng)絡(luò)的度分布偏離了純粹的冪律分布,。Barabási認(rèn)為,,此前已經(jīng)有學(xué)者對(duì)于其他機(jī)制進(jìn)行了成功的論證,Clauset 的結(jié)論不代表復(fù)雜網(wǎng)絡(luò)中不存在無(wú)標(biāo)度的特征,。 另一種反駁意見(jiàn)是在真實(shí)的網(wǎng)絡(luò)中,,數(shù)據(jù)中總是存在偏差和噪聲等,使得真實(shí)世界的網(wǎng)絡(luò)不可能完美的符合冪律分布,。 Barabási用一個(gè)比喻來(lái)反駁 Clauset 的工作,,“你不能因?yàn)楝F(xiàn)實(shí)中一片羽毛和一塊石頭落下的速度不同,就否定萬(wàn)有引力定律(萬(wàn)有引力定律告訴你自由落體的速度就應(yīng)該一樣),,在現(xiàn)實(shí)中總是會(huì)受到其他因素的干擾,,比如空氣阻力”。 顯然 Clauset 不接受這個(gè)批評(píng),,他說(shuō)“這并不是一個(gè)受過(guò)訓(xùn)練的統(tǒng)計(jì)物理學(xué)家應(yīng)該作出的比喻,,如果有1000種物體自由落體,你總能在大部分物體中觀察到重力和空氣阻力如何共同作用于物體的普遍規(guī)律,,所謂的干擾因素問(wèn)題就可以迎刃而解,但是冪律分布在1000個(gè)真實(shí)網(wǎng)絡(luò)中僅有4%能通過(guò)檢驗(yàn),,這說(shuō)明冪律分布模型沒(méi)有普適性,。” 即使那些沒(méi)有通過(guò)嚴(yán)格的冪律分布統(tǒng)計(jì)檢驗(yàn)的網(wǎng)絡(luò)中真的存在無(wú)標(biāo)度的屬性,,并且是一些其他因素導(dǎo)致的,,那我們應(yīng)該觀察到一個(gè)主要的影響機(jī)制,就像在自由落體試驗(yàn)中,,我們總能觀察到重力在起主導(dǎo)作用,,空氣阻力只是一個(gè)小的擾動(dòng)項(xiàng)。但是在對(duì)網(wǎng)絡(luò)特性的檢驗(yàn)中,我們無(wú)法觀察到一個(gè)獨(dú)立的機(jī)制起主導(dǎo)作用,。 美國(guó)東北大學(xué)的網(wǎng)絡(luò)科學(xué)家 Alessandro Vespignani 認(rèn)為,,這些爭(zhēng)論體現(xiàn)了物理學(xué)家和統(tǒng)計(jì)學(xué)家心態(tài)的不同,他肯定了雙方的觀點(diǎn)都是有價(jià)值的,,并且提到物理學(xué)的藝術(shù)就在與近似,,在于找到通用的規(guī)則,無(wú)標(biāo)度屬性的提出就是一個(gè)例子,,在這套框架下我們可以用一個(gè)統(tǒng)一的框架去解釋多種現(xiàn)象,。但是他認(rèn)為,無(wú)標(biāo)度屬性的重點(diǎn)在于這個(gè)度分布是否是重尾分布,,因?yàn)檫@種重尾分布才導(dǎo)致了先前提到的一系列現(xiàn)象,,比如網(wǎng)絡(luò)的魯棒性和脆弱性。 微軟研究院的網(wǎng)絡(luò)科學(xué)家 Duncan Watts 則認(rèn)為 Vespignani 的觀點(diǎn)偷換了概念,,“重尾分布”是一個(gè)含義甚廣的詞語(yǔ),,并且它和無(wú)標(biāo)度的定義有重合的地方,因此它并不是解決問(wèn)題的關(guān)鍵,。他認(rèn)為無(wú)標(biāo)度性在一定程度上解釋了某些現(xiàn)象,,但其適用范圍并不廣。讓科學(xué)家們重新把精力放在更正自己的觀點(diǎn),、收回先前的評(píng)論上,,并不是好事,畢竟無(wú)標(biāo)度性質(zhì)的提出也具有跨世紀(jì)的價(jià)值,。 Duncan Watts,,微軟研究院網(wǎng)絡(luò)科學(xué)家,以其對(duì)“小世界網(wǎng)絡(luò)”的研究而聞名 7.小結(jié): 網(wǎng)絡(luò)科學(xué)的普適理論尚未誕生 盡管辯論激烈,,但是卻十分有趣,,因?yàn)閷W(xué)者們爭(zhēng)議的“是否存在普適規(guī)律”本身就是一個(gè)有意思的難題。Clauset 解釋到“我們這篇工作只是想引起網(wǎng)絡(luò)科學(xué)家的注意,,去發(fā)現(xiàn)更多的網(wǎng)絡(luò)結(jié)構(gòu)分布和形成機(jī)制,,去質(zhì)疑經(jīng)典理論的適用性?!?/strong>在這一點(diǎn)上Vespignani也表示贊同,,深究起來(lái),在網(wǎng)絡(luò)科學(xué)領(lǐng)域尚且還沒(méi)有一個(gè)普適的理論,。
|
|
來(lái)自: 萬(wàn)皇之皇 > 《教育學(xué)習(xí)》