逆行武漢的「數據俠」

逆行武漢的「數據俠」

大數據抗疫進行時。


文 | Tech星球 馬微冰

一場突如其來的疫情令人始料未及,每天跌宕變化的疫情數據,牽動所有人的心。

感染者、密切接觸者數量、活動軌跡、時間節點等大數據,成為疫情防控的關鍵信息。而在備受矚目的數據背後,有這樣一群人,他們雖然不是醫生護士等一線抗疫人員,卻在疫情爆發後,逆行奔向疫情最嚴重的區域。

“真沒想到,我回到武漢,就再也沒離開過,而且一工作就是40多天。”說這句話的海致科技數據工程師許珂,就是許多逆行奔赴疫區的數據技術人員之一。

1月20日晚上8點,剛放年假的許珂抵達湖北鄂州的家中,正吃著晚飯時接到了公司的通知。

“武漢這邊疫情爆發,需要做一些疫情分析支撐工作,我們武漢這邊人手有限,需要8小時內到崗,你有沒有問題?”放下手機後,許珂告訴家人,接到緊急任務第二天要返回武漢。

翌日一早,許珂簡單收拾衣物,開車回武漢緊急待命。

彼時,各個城市還沒有拉響警報,甚至武漢街頭,戴口罩的人也不是很多,多數人和許珂一樣還不能意識到後來發生的一切。

緊接著,武漢封城,全國各地防疫管控,以數字為標準展開篩查隔離。在疫情籠罩的3個月裡,每一組數據、每一串代碼都發揮了重要的價值。

一場大數據抗疫戰,拉開了大幕,這是對大數據價值和“數據俠”成色的一次實戰檢閱。

臨危受命的逆行者

“前所未有”,當提到這次疫情的感受時,這是許珂用到的詞語。

“戰疫”打響後,阿里、騰訊、百度等很多互聯網公司開始向武漢,緊急運送支援物資。接到緊急召回的電話時,許珂並沒有想太多,以為和平時加班趕項目一樣,去幾天就回來。但沒想到,一直奮戰至今。

1月20日,海致湖北負責人高勇波接到需求,需要緊急抽派人手組建一支技術團隊參加武漢防疫指揮部的數據分析工作。

疫情中成立的防疫指揮部,是由政府部門、醫院、衛生防疫機構、衛健委等聯合組成的。防疫指揮部會下發一些數據核查、數據分析的需求,數據工程師們配合相關部門完成後,再把分析結果提供給指揮部,以供決策。

“因為年前也比較忙,最開始的時候我們今年準備提前放假,讓大家去休息一下的,沒想到遇上突發的疫情。”海致總裁楊娟對Tech星球說,“陸續接到來自於各地這樣的電話後,我們立刻開始內部討論。我們也很糾結,畢竟還是有風險,也很擔心員工會有情緒,但大家基本上沒有二話。”

接到緊急任務的高勇波,便在工作群裡問大家,誰能夠儘快來武漢,“有的是已經到家裡返回的,有的是在半路掉頭回來的,還有武漢當地不打算回家的,”沒過多久,就有6名同事表示,可以第一時間返回,許珂是他通知的第二個人。

“接到通知後,我們6個人在1天之內全部到崗”,高勇波對Tech星球(微信ID:tech618)說道。

1月21日上午11點,許珂與6名同事到武漢集結待命。“我不知道這次具體是要做什麼,只知道是疫情相關的事情。”剛到武漢的許珂,午飯還沒來得及吃,便立刻參加工作會。

僅僅一個小時的工作對接,讓擅長數據分析的許珂一下就意識到疫情的嚴重性,他知道即將開始的工作將會是前所未有的挑戰。。

各級政府部門有上百種數據,存儲總量極為龐大,分散在不同部門,同時各級醫療防疫機構,還擁有大量一手疫情數據的手工表格。這些冗雜紛繁的數據,要迅速的形成一套高效的數據接入、清洗、處理的機制,轉化為精準的防疫信息,傳遞到防疫指揮部,對於高勇波來說,最大壓力就是時間和每一條數據後面所代表的生命。後來有人問起高勇波當時的感受,“我從來沒有過這樣的體驗,腦子裡每一分鐘都是人命關天四個字。”高勇波說到。

海致網聚實施總監鄧華亮認為:前期工作是最難,也是最緊張的,“第一次會相對複雜一些,等我們把這些數據接入,以及處理的規則都建立好了之後,後續再進來新的數據隨時更新,這個過程就是自動的。”

“短時間內,我們要接入各個部門的數據,做數據處理、清洗、關聯,形成數據模型。數據流轉機制剛剛建立,模型也都是摸索著做,改動很頻繁,要的也很急。那是疫情爆發的第一階段,需要做很多東西去摸索。”許珂說道。

許珂與同事們沒日沒夜的工作,從1月21日開展第一次密接人員信息發佈開始,基本上每天都是凌晨三四點,甚至四五點才休息,早上八九點鐘又要開始工作。一線“戰疫”刻不容緩,許珂與同事們每天想著如何壓縮時間,更快的形成數據模型應用。

第一道「數據防線」

確診病例、疑似病例、發熱門診,這一些患者數據,如果能第一時間獲取,用於後續研判分析,比如去發現這些密切接觸者,及時通知他們,使數據及時下發到一線社區工作人員手中,都至關重要。

從1月21日開始,海致協助各地相關部門,通過海致的大數據挖掘系統,每天處理數據幾十億條,發出幾萬條關於“B類人群”(密切接觸者)的信息,為社區工作人員的精準排查提供支撐,當時基本上是半個小時就要更新一次。

疫情防控的數據模型非常重要,前線的同事們也感受到前所未有的壓力。高勇波說,“平常的工作會給一個時間,比如說一天或者兩天。可現在同等量的工作,會壓縮在一個小時之內就得完成。”

剛開始,他們下班後被安排在附近酒店休息,但隨著疫情爆發城市管制,外地人不允許住酒店,所有酒店都被騰出給援助的醫療隊。許珂與同事們直接在辦公室旁邊搭一張行軍床,累了直接休息。

逆行武漢的「數據俠」

數據工程師在辦公桌旁搭的行軍床

“我們只能分清白天黑夜,沒有其他的。”高勇波說。

防疫指揮部的第一步工作是要快速地把這些數據匯聚起來。鄧華亮向Tech星球(微信ID:tech618)說道:“匯聚起來以後,發現數據標準不統一,數據質量也參差不齊。然後接下來的工作就是,抓緊把這些數據都整理好、清洗好”,這無疑是一個工作量巨大且高強度的事情。

隨著確診人數不斷激增,23日上午十點鐘武漢封城。全國最關心問題是,武漢到底外流出去多少人?去了哪,乘坐什麼交通工具?每日的數據每日結清,每日的數據中各類關注對象信息都要當日上報。這些原始的一手資料,只能由武漢團隊第一時間進行歸納,相比較其他城市的防疫,武漢的工作量都是乘以百計、千計、甚至萬計。

鄧華亮說,“掌握了外流人員信息後,我們利用大數據建模手段,構建了上百個分析模型,有數據真實性的交叉驗證模型,有落地確診病例模型,有外流人員去向查找模型,有密切接觸人員身份落地模型等等。然後把這些模型的分析數據推送給一線防疫人員,抓緊去落地核查。可以說一個模型就是一個戰場,每個戰場都關乎生死。”

臨時團隊人員少,在巨量的數據處理信息面前,難免會出現各式各樣的問題。“因為是多部門、多系統向一個地方彙集,又從一個地方向外發送,相較於技術支撐的難度,在整個分析運行的協同機制上可能會存在更多的問題,每天除了解決技術問題,更多的時候我們還要跟不同的部門進行溝通,提醒數據上報,詢問接受反饋,確保工作順暢進行。機制運行之外,就是不斷地完善算法和功能,儘可能的壓縮技術處理的時間,每壓縮一點,就有更多的時間去處理更多的問題。”許珂向Tech星球解釋。

由於武漢交通管制,海致北京總部的技術人員無法到達武漢現場,但為了能夠保證及時協助武漢的團隊,技術同事們24小時在線,遠程幫忙排查解決問題。

1月30日,公司緊緊協調增援3名技術骨幹進駐武漢,進行輪崗。同日,海致為全國2.2萬名一線疫情防控人員,緊急開通了內網大數據分析平臺賬號,免費支持服務一線疫情防控數據分析。隨後,從南昌、南京以及湖北很多正在被封閉的村鎮,十幾位海致工程師在短短几天內向武漢、孝感、黃岡、鄂州等疫情前線集中。

一道大數據防疫城牆建立起來。

火線增援總攻

大約一個月的時間,9位工程師連軸轉,最終武漢的疫情防控數據模型逐漸穩定,“接下來要支撐湖北其他的地市,本地工程師人手已經不夠,只能從總部抽調人過來。”高勇波向Tech星球說道。

研發總監翟士丹介紹,“我天天都在和勇波電話,既害怕又期待,害怕的是系統臨時出現了什麼問題,耽誤了分析,期待的是按照前方要求新上線的功能,能帶來救人的好消息。就這樣,有時一晚上都睡不好,就想著能從哪兒下手,做的更好一點。”

2月19日,武漢全面啟用12家方艙醫院,醫療資源得到緩解後,武漢疫情防控戰役發起總攻,數據量倍增。應武漢疫情防控總指揮部要求,再次緊急增派數據分析師,火線支援。連明、張順民宋彥朝三位“數據俠”主動請纓。

連明是北方區負責人,常年在北京辦公。2月18日晚上8點,下班後的連明接到公司副總裁的電話。“武漢這邊的兄弟已經連續作戰30天了,為了保證大家的身體健康,我們得向醫護人員一樣強制替換,需要你現在支持武漢的疫情防控工作,明天清晨出發,OK麼?”突然接到通知的連明,直接回復“沒問題,馬上清行李。”

隨後,連明立即通知部門同事,“緊急去武漢支援,有沒有問題?明早出發。”大家都沒有任何遲疑。2月19日早上7點左右,連明與同事相約來到北京西站,往日人頭攢動的西站只有零星的乘客,各自相隔很遠。

7點26分,三人坐上了由北京開往深圳的G71高鐵。武漢封城後,G71便不在武漢經停,但當聽聞是派往武漢的支援人員時,武漢有關部門提前溝通,協調武漢站特批G71可以臨停武漢。

逆行武漢的「數據俠」

連明與同事在高鐵站

連明與同事們在同一截車廂,車廂內有七成的乘客。2月19日湖北以外的地區,疫情防控已經進入到中後階段,北京有些公司已經復工,但武漢仍在嚴密防控中。下午13點,高鐵抵達武漢,連明與同事拿著蓋滿印章的通行證,在武漢站下車,發現整個高鐵站都空空蕩蕩。

連明說,“原以為當時武漢疫情也會好轉些,但和想象中不一樣,差別太大了。”坐在車上的連明看到此時的武漢很是震撼,“從人流和車流這兩個角度,跟平時真的是天壤之別。”

在當地人員接應下,連明與同事直接到達防疫指揮部辦公室。看到已奮戰一個月的同事,並沒有明顯的疲態。“大家都在想把這個事做得更好,做得更精確、更精準一點,讓疫情早日結束。”

五天以後,海致CEO楊再飛帶著一批口罩、藥品和食品,乘坐與連明同一趟高鐵、也趕到了武漢。

高勇波說,“省市兩級的最高領導,這幾十天內都多次過來督戰疫情防控,察看工作進程,審閱數據。”

打一場持久戰

“這是一場持久戰”,在連明看來。

隨著疫情發展趨勢的變化,不同階段關注點是不一樣的,分析的側重點同樣也會產生變化。

鄧華亮說,“初步控制階段,沒有再集中爆發的情況下,我們會做一些基於流行病學的分析和研判,將以前全覆蓋的防控,變成分級分區域的一些精準防控,提供一些分析模型的支撐。可以判定,同一個地市不同的曲線,不同的社區、小區哪些是高風險,哪些是低風險,作為精準防控的決策依據。”

無論何時,這些逆行的數據俠們也絕不是孤軍奮戰。“看到同事在前方奮戰,開始自己沒辦法出力,心裡還是比較難受的”,徐培對Tech星球(微信ID:tech618)講道。

身為武漢團隊的一份子,徐培由於身體原因在家休養。1月21日,高勇波詢問是否有人能到達武漢時,徐培也積極響應,但年前剛做完心臟瓣膜手術,領導建議徐培暫時先不參與“前線”工作。

但隨著武漢的疫情每況愈下,徐培說,“既然不能在一線,我就做後勤保障工作,為大家改善一下伙食或者是營養,換一種方式並肩作戰。”

沒有家人陪伴、沒有年夜飯,一線的工程師們開足馬力工作,除夕、春節、元宵節等等,對於大家而言都沒有概念。“年夜飯就是在現場,坐在一起,每人一個自嗨鍋,當時覺得已經十分幸福了”,高勇波說道。

2月份,武漢甚至整個湖北的物資都比較匱乏,瞭解到前線同事們經常在吃泡麵,徐培和家人們發動所有的力量,每天通過各種渠道購買食材。

因為徐培在家靜養,採購和送東西的事情都是由妻子代勞,有些需要加工的,母親會一起幫忙。從2月初開始,徐培每隔一兩天就會到指揮部運送物資。一般早上出門,趕在同事吃中午飯時送到,這樣能吃到比較新鮮的食物。

“有一次,同事們說想喝可樂,後來我在一個店裡看到,把他們一整個櫃檯20多瓶可樂全買走了,第二天送去,他們見到可樂時特別開心。”

隨著物資逐漸豐富,疫情趨於平緩。各地都在有序復工復產,數據模型搭建的重心也在改變。

2月22日,許珂與同行的兩位同事,被安排去構建湖北全省的防疫大數據平臺。“我們會做一些風險預警的模型,及時發現一些可能的發熱患者,或者疑似病例,防止再次擴散。”鄧華亮對Tech星球說。

“抗疫”背後無形的手

“大數據這張看不見的抗疫網,可以說是決定生死,至關重要”,2月24日,海致網聚CEO楊再飛在朋友圈寫道。

一線工程師許珂家裡有兩位同樣在一線堅守的親屬,父親與大伯都是醫生。“從疫情開始,大伯就在鄂州一線救援。但1月26日開始發熱,確診感染,2月13日很不幸沒能挺過去,離開了我們,同樣被感染的大伯母還在隔離治療中。”

許珂說,“經歷過這個事之後,才真正的覺得我們每天看到的,手裡頭的那些數據,真的就是一個個活生生的生命。很多時候看到一個生命,從最初的密接人員數據表格一步一步挪到病亡人員表格,那種感覺是難以忍受的。我們從來沒有做過這樣的數據分析,這也是我們能超出個人極限,咬牙堅持下來的最終原因。如果說,有一點數據沒弄好或者弄錯了話,會導致非常嚴重的後果,就是一個生命沒辦法得到及時的救助。”

疫情是災難,同樣也是一種警醒。作為“抗疫”背後無形的手,大數據的重要作用,在這次疫情防控中愈發凸顯。之前,政府和企業往往覺得數據是一個輔助性的工具,僅僅是一個參考,但在這場“戰疫”中,許多人開始真正意識到大數據的重要性。

逆行武漢的「數據俠」

海致公司製作的智慧大屏效果圖

正如謝爾曼・斯坦因所闡釋的,數學化遠不止是“一堆數字的計算過程”。“當在一個突發的、超級複雜,不斷動態變化的過程當中,如果沒有大數據,就沒有辦法支撐決策,這時候大數據成了決策的本身”,楊娟對Tech星球(微信ID:tech618)說道。

疫情爆發後,互聯網科技公司都紛紛利用自己的大數據技術能力,快速地投入抗疫之中。

1月21日,丁香園推出了“疫情實時動態”信息頁面;22日,微信上線疫情實時搜索功能;23日,騰訊健康和百度地圖同時上線“發熱門診地圖”,推出了百度遷徙數據,騰訊看點上線“戰肺炎”頻道和“關注肺炎”專題,以及疫情地圖和預防手冊;阿里達摩院研發AI算法,將原來數小時的疑似病例基因分析縮短至半小時,大幅縮短確診時間。

“戰疫”接近尾聲,但尚未結束。一線戰鬥崗位仍需堅守,在這場“人命關天”的爭奪戰中,大數據工程師們擔負了重大而特殊的使命,保衛了許多人的健康。


分享到:


相關文章: