從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

本篇筆記基於張江老師《從網絡隱藏幾何的角度看網絡驅動的病毒傳播》公開課程,探究交通流量數據與城市間病毒傳播的關係。

1、背景

傳播源頭、新病例爆發在哪裡、何時病毒傳到特定地點、共有多少病例?

2、傳統模型

反應擴散模型(Reaction Diffusion Method不適合於現在社會)、基於個體模型(Agent based models)、隨機集合種群模型(Stochastic metapopulation models)。

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

SIR模型

上圖為基於個體模型--SIR模型,S表示易感者,I表示感染者,R表示移出者。紅色節點為感染者會以α概率隨機選擇傳播他的鄰居,連接為社會接觸,而感染者會以β概率進行恢復。

NetLogo自帶病毒傳播仿真程序,起初病毒感染了三個人,按照一定概率規則進行病毒傳播,傳播過程中不停擴散整個網絡,感染個體又會變成恢復態,恢復的人因為有抗體所以不會再被感染,直到不再有感染者。

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

病毒傳播圖

3、有效距離

城市之間通過輸運網絡、航空網絡等,城市之間可以輸運病毒或健康個體。所以,以某個城市為節點,看一個城市裡感染的人數和康復的人數,如何變化?

一般來講,兩個城市地理空間更近,那麼病毒傳播的更快。也就是地理空間距離與病毒傳播天數呈正相關。但是事實告訴我們,猜想是錯誤的。以H1N1和SARS病毒為例,橫座標表示其他城市距離病毒爆發城市的地理距離,縱座標表示病毒傳播天數。座標圖並沒有呈現出很明顯的正相關關係。

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

地理距離與傳播天數關係圖

那麼如何設計來增強距離與傳播的天數的正相關關係?這就需要引出有效距離(Effective Distance)的概念。這種有效距離可以回答背景中所提出的三個問題,病毒源頭?病毒傳到哪裡?在某一城市病毒何時出現?

有效距離的計算需要人口流動數據,即任意兩個城市的人口流量(最好是穩態數據,蒐集數據時間越接近效果越好)。

通過人口流量的網絡可以轉換為概率網絡,需要注意的是A與B的人口流量是不一致的,比如武漢到北京的人口流量是不等同於北京到武漢的人口流量。

概率定義是某一條連邊上,例如,從A出發向外隨機跳躍,A到B的跳轉概率就是用A到B的流量除以A的所有流量,那麼P(B|A)=300/300×7=1/7,同理,從C出發只有到B的一條路徑,P(B|C)=50/50=1。基於跳轉概率可以計算兩個節點之間的有效距離。

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

兩個節點間跳轉概率


從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

兩個節點間有效距離計算

dA→B=1-lgP(B|A),A到B跳轉概率越大,A到B有效距離越短,即跳轉概率與有效距離呈負相關關係。A到C的距離根據距離的傳遞性,計算A到B的距離,B到C的距離,二者距離相加為A到C的距離。關於這個公式有幾點說明。

a.取對數:若計算A到C的概率,那麼概率是相乘的,為了保證距離的可加性,因為lgab=lga+lgb。

b.取1-:當A、B只有一條路徑時,P(B|A)=1,dA→B=1,lgP(B|A)=0,即網格距離也為1。

如果一個節點到另一個節點存在多條路徑情況,那麼有效距離如何計算?

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

多條路徑下,有效距離計算

例如,A到D的距離,分別計算A到B到D的距離、A到D的距離以及A到C到D的距離,取三個距離中的最小值,作為A到D的有效距離。(我自己的計算結果與所給結果,雖結論相同,但是所算距離數據並不相等)

引入有效距離,以H1N1和SARS病毒為例,可以很明顯看出距離與傳播的天數的正相關關係。

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

有效距離與傳播天數關係圖

4、預測到達時間

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

傳播時間公式

用有效距離除以相應的傳播速度,可以算出有效時間。但是傳播速度依賴於傳播模型。那是不是就無法計算傳播時間呢?並不,我們可以通過間接方式計算傳播時間。

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

間接方法:傳播時間公式

n、m、k為城市,假設我們已知k到n的傳播時間,有效距離已知,就可以計算出k到m的傳播時間。

5、尋找源頭

假設每個城市為傳染源,遍歷每一個城市,尋找傳播擴散圖呈現圓形、對稱的,那麼這個城市就是傳播源頭。

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

根據圖例,確定傳播源頭

計算T,D的相關性:如果知道每個城市感染病毒的時間以及任意兩個城市之間的有效距離,只需要求相關性,任何一個城市作為假設的傳播源頭,那麼已知它到達每個城市的時間以及有效距離,計算它們之間的相關性。如果源頭為真正源頭,二者相關性是最高的。遍歷所有城市,得到相關性,將相關性進行排序,相關性最大即為源頭。

左圖為H1N1相關性計算,右圖為SARS相關性計算。根據計算結果墨西哥和中國分別H1N1和SARS的傳播源頭,符合客觀事實。

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

有效距離與傳播時間相關性計算

但是這種方法的弊端是必須知道每一個城市到達每一個城市的傳播時間,如果病毒沒有傳播結束,前提是要遍歷每一個城市,未出現病毒城市的傳播時間可以通過間接方法計算(傳播時間之比等於有效距離之比)。但是真實的傳播時間並不一定等於計算時間,可能會出現誤差。所以可能會發生並沒有出現感染者的某一城市被推算為傳播源頭。為了避免這種情況,提出一種新的算法。

以此刻,已感染的城市為源頭,以這個城市為中心,看所有城市的有效距離。如果這個城市為傳播源頭,那麼這個城市一定是所有城市傳播事件中心的位置,它到其他感染城市的有效距離差不多大小,方差也比較小。具體做法:將所有城市有效距離的均值和方差繪製二維座標圖,那麼均值和方差都比較小的一定是傳播源頭,即離圓點最近的為傳播源。

下圖為H1N1的真實數據,基本推測準確。


從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

城市有效距離的均值和方差二維座標圖

6、傳播模型

SIR模型在複雜網絡的擴展模型

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

SIR模型在複雜網絡擴展模型

其中,jn為n城市感染比例

sn為n城市疑似病例

rn為n城市康復比例

γ為人口流動平均比例

反應項:當感染者接觸疑似者時,可能會到疑似者感染,感染人數增加。

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

反應項

康復項

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

康復項

傳播項:n城市轉移到m城市

從網絡隱藏幾何的角度看網絡驅動的病毒傳播——筆記

以上,就是我對於該課程的理解,如果存在理解有誤的地方,希望可以批評指正。


分享到:


相關文章: