傳染病與網絡爆紅熱點內容傳播背後的數學模型

傳染病與網絡爆紅熱點內容傳播背後的數學模型

新冠病毒引起的疾病 COVID-19 的爆發迅速成為所有人關注的焦點新聞:從社交媒體到其他所有媒體平臺,人們幾乎只討論疫情,我們的生活也因為出臺的各種防疫政策而受到了很大的影響。人們持續探討、刷新疫情進展的新聞,關注確診數量,甚至擔心將來會是怎樣的演變與發展。總之,在客觀存在的病毒之外,也同樣有這樣一種病毒式的時刻,它與信息的極速廣泛傳播相關,也與隨之而來的主觀意識相關。

上述這個事實把我們再次帶到一個相似的情況:病毒疫情中在人群中不斷地傳播,非常相似於互聯網中某個熱點內容的爆紅,比如:一條推特上的推文、油管上的一個視頻、一種模因、Instagram 或者臉書的一條發佈信息,等等諸如此類。給這種火遍全網的內容貼上一個形容詞標籤——“病毒式的爆發”,這並非偶然,而是存在其一定的流行病學背景。

模因(meme, 又稱媒因),是指一個想法,行為或風格從一個人到另一個人的傳播過程。

因此,瞭解調節病毒傳播與網絡爆紅現象兩種現象的共同機制,就變得十分有趣:而在此探究多長之中中,數學是一種很重要的基本工具!

許多學者已經研究出一些有用的數學模型,來描述和預測這種流行現象傳播的趨勢與動向。

而這些模型又是如何建立出來的呢? 其實最主要是通過一種統計學分析:通過計算大規模收集而來的相關傳染進展的數據,對相應機制提出假設,然後再通過後續觀察,對其進行確認、完善或修改。尤其值得說明的是,一個好的模型必須能以較好減小模型估計值與實際值之間的差距,這樣重現一個地區疾病病例的時間序列。

傳染病與網絡爆紅熱點內容傳播背後的數學模型

▲ 丹尼爾·伯努利(Daniel Bernoulli,1700-1782), 著名數學家,約翰·伯努利之子,為伯努利家族代表人物之一。

歷史上,法國數學家丹尼爾·伯努利是最早一批嘗試進行這項數學研究的人,他曾嘗試對天花的傳播給出定量描述。大約十八世紀中葉,天花是一種具高度傳染性的疾病,其主要透過空氣傳播。在當時,它幾乎是全世界最嚴重的區域傳染病。在歐洲,它曾是主要的死亡原因——每年有 40 萬人染病死去。在法國,它也導致了無數的死亡案例,甚至包括太陽王路易十四的王室成員。

在他的 1760 年的論文《天花死亡率新分析以及對預防性接種疫苗的優勢研究》裡,伯努利提出了一個基於感染人數呈指數增長的數學模型,並在此基礎上證明了採用接種疫苗方式對於抵抗這種疾病是非常有效的。

伯努利的研究非常具有前瞻性,其發表比愛德華·詹納(Edward Jenner)引入天花疫苗還要早幾乎四十年。

目前,流行病的數學描述的參考範例是 1927 年由蘇格蘭科學家 William O. Kermack(1898-1970)和 Anderson G. McKendrick(1876-1943)提出的模型。

傳染病與網絡爆紅熱點內容傳播背後的數學模型

▲ W. Kermack 和 A.McKendrick 兩人頭像

在他們的文章"對流行病數學理論的貢獻 (A contribution to the mathematical theory of epidemics)"中,兩位研究人員觀察發現,要了解傳染的動態,不妨將人群分為三個流行病學類型:

  1. 易感人群(英文的 susceptible,用 S 表示):指那些尚未但很有可能被感染的個體群
  2. 感染人群(英文的 infectious,用 I 表示):指那些已感染且具有傳染性的個體群
  3. 治癒人群(英文的 recovered,用 R 表示):指那些已感染但不再具有傳染性的個體群,不再具有傳染性是因為被治癒或者已去世或者被隔離
傳染病與網絡爆紅熱點內容傳播背後的數學模型

Kermack 和 McKendrick 意識到,在大多數流行病中,一個人只能從類型 1 過渡到類型 2,或者從類型 2 過渡到類型 3,而不可能從類型 3 返回至類型 2(假設被治癒的人具有了對該疾病的免疫)。

由這兩位科學家所發佈的這個特定模型是基於微分方程組,該微分方程組能夠預測上述三種流行病學類型的數量隨時間的變化趨勢:S(t), I(t) e R(t) .

在阿爾弗雷德·洛特卡(Alfred Lotka)和維託·沃爾泰拉(Vito Volterra)提出了非常著名的模型之後不久,Kermack 和 McKendrick 模型問世也並非偶然。前兩者也是通過微分方程組來描述一個生態系統的動態,在這個生態系統中兩個動物物種相互作用,分別是捕食者及其獵物。

更一般地說,一個受 Kermack 和 McKendrick 的思想啟發而建立的基於 S, I 和 R 三種流行病學分類的流行病數學模型,被稱為 SIR 模型。當然,也存在其他不同類型的模型:例如,如果該疾病不涉及免疫接種(譬如感冒),則 R 類型沒有理由存在,那麼人們所探討的就是 SI 模型。

SIR 模型的主要目標是預測流行病的演變,並估計將會感染該疾病的人口比例。 如果存在某些假設,則可以使用 SIR 模型,具體如下:

  • (a) 在流行病期間,沒有新增人口;
  • (b) 在流行病期間,死亡的主要原因是該流行病本身;
  • (c) 人口是被隔離的,即對於外部來說沒有入流量與出流量;
  • (d) 該疾病沒有潛伏期;
  • (e) 治癒康復後立即獲得免疫力;
  • (f) 無論感染後經過多長時間,所有受感染的個體都具有相同的傳染性。

很容易直觀感受到,這些假設與現實中的實際情況相比非常簡化。比方說,新冠病毒所致的 COVID-19 的潛伏期有 14 天,而且,治癒後的免疫力也並沒有被證實,更何況,至少來說很顯然假設 a 與假設 b 是不現實的。從另一方面講,在建模的過程中,很自然地,會從著眼於現象的關鍵要素的描述而展開,從而忽略一些被認為是次要的細節:就有點像在確定彈道軌跡的時候忽略與空氣的摩擦阻力,因為這對計算不是很重要。

基於以上假設,SIR 模型的動態學非常簡單。在流行病疫情的開始,由於傳染,易感人群(即尚未感染的個體)的數量將會逐漸減少,而感染人群的數量將由於相同原因而增長。隨著感染人數的增長,一個易感個體被感染的可能性將會更大,因此,感染人群的增長將會從一開始就趨於加速。(儘管伯努利雖然從不同的假設著手,卻也預估到了指數趨勢)

但是,在某些時候,一些個體將會開始從感染群體這個類型轉變到治癒群體類型,因為與此同時,他們治癒康復了,或者死亡,也或者被隔離。從這個時候開始往後,所有的分析都遊走在這兩個轉變過程之間的差值上 : 只要感染者數量多於移出者數量 (移出者數量=治癒數+死亡數+被隔離數),該流行病將會處於其上升階段,但是,當移出者數量開始佔上風之後,就又會處於其下降階段。 有一個事實是確定的:易感人群的數量總是在減少而移出者數量總是在增加。

傳染病與網絡爆紅熱點內容傳播背後的數學模型

▲ 根據 SIR 模型呈現的一個流行病的典型趨勢

上面是一個用 SIR 呈現的一個流行病可能趨勢的圖:你會立即注意到感染數量的上升階段,該階段達到一個峰值,之後是一個下降階段。同時,易感數量總是減少,而治癒數量總是增加。

現在,我們花點時間回到之前的那個類比——互聯網中病毒式瘋傳的內容:人們能迅速理解 Kermack 和 McKendrick 的想法也能運用在這個場景下。

我們假設今天有人發佈了一個可能成為網絡爆紅的推文。

在發佈的時候,與模因的"病毒傳染"潛力相比,整個世界網絡社交人群都屬於易感人群類型,因為還沒有人看到模因但將來可能會。漸漸地,當人們發現這個模因並且他們也轉發分享的時候,就從易感人群變為感染人群:實際上,他們成為病毒性內容的“受害者”(轉發者),也就是說,他們對這些內容充滿熱情並積極地將其傳播給其他人。隨著時間的推移,總是會有越來越多的人將不再對這些內容感興趣並將停止傳播它,從而過渡到“治癒類”。

傳染病與網絡爆紅熱點內容傳播背後的數學模型

▲ "The dress"圖片

2015 年,Tumblr 上有一張因視錯覺而爆紅的的服裝圖片開始在平臺上瘋傳,引發了公眾一個問題:“這件衣服是白色和金色?或者是藍色和黑色?” |

這張圖片迅速在網上傳播開來:僅 48 小時內,帖子就獲得了 40 萬次互動;最隨後的幾天裡,成千上萬的人看到了該圖片並通過主要的社交網絡分享了它。

上面這張“Sharing of #TheDress”圖,以簡化的方式反映了名為“The Dress”的網絡爆紅現象是如何呈現在其病毒式瘋傳效應中的:同樣在這種情況下,也分為三類,即:

  • S :還沒有看到過那張圖片的人
  • I :看到了這張圖片並且熱衷於轉發分享它的人
  • R :對圖片上這件衣服到底是怎樣完全不感興趣的人


傳染病與網絡爆紅熱點內容傳播背後的數學模型

▲ “The dress”現象的病毒式瘋狂傳播

此時出現的問題是多方面的。為了能夠將一種傳染性的社會行為定義為流行性傳播,並由此按照如上圖所描述的"病毒式"傳播形式進行瘋傳,必然的先行條件是什麼? 還有哪些其他的可能變化趨勢? 這幾天新冠病毒所引發的恐慌是通過哪種類型的動態所反映出來的? 這些完全取決於表徵傳染性的一些基本參數:在下一部文章中,我們將探究它們是什麼,並找出 SIR 模型的可能動態。

作者:[遇見數學翻譯小組] 核心成員 Atena


分享到:


相關文章: