17歲C等生製作世界上最大的新冠追蹤網站之一,被CDC表揚

把科學帶回家” 提供

撰文 七君

現在國內在播報國外新冠疫情時,常常使用約翰霍普金斯大學建造的網站。這個網站的訪問量是每天10億,而建造和維護者是約翰霍普金斯大學的兩個中國博士生。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

約翰霍普金斯大學的網站實際上是在1月21日研發,1月22日上線的。不過,有一個網站比它更早開始追蹤全球新冠疫情,它也是現在世界上最大的新冠追蹤網站之一。而它的開發者,是一個17歲的高中生。

2019年12月底,就在川普還在佛羅里達度假,而媒體開始播報武漢出現奇怪的肺炎的時候,一個17歲的少年感到憂心忡忡,並開始建造一個追蹤疫情的網站。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

2019年12月30日,路透社援引中國政府的報道,武漢出現症狀類似SARS的27個病例。

這個少年叫做 Avi Schiffmann,來自華盛頓州的默瑟島高中(Mercer Island High School)。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

你可以在下面這個地址訪問他建造的這個網站:

ncov2019.live

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

他製作這個網站最初的動機是為了幫助人們更好更快地收穫各國政府發佈的新冠數據,因為閱讀中文和七七八八的外國網站實在是太難了。

此外,許多官方機構的數據更新並不及時,比如美國 CDC 週末不更新,而且顯示的是前一天下午4點的統計結果。

為了解決這些問題,他從世界衛生組織、美國疾病控制與預防中心(CDC)、韓國聯合通訊社(Yonhap News Agency)以及世界各國政府的網站上搜羅數據,然後整合起來發布。

而在他的網站上線的時候,新冠的感染人數還不到1千人,而且還沒有在中國以外的地方爆發。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

在這個網站上,你可以分大洲、分國家、分州瀏覽確診病例、死亡病例以及痊癒病例的數據。網站的更新速度也很快,每分鐘都會自動更新一次。

作為對比,而約翰霍普金斯大的網站是每天更新,而且數據是由博士生董恩盛、杜鴻儒和一些志願者共同蒐集的。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

結果,Avi 的網站爆紅,截止3月中旬一天有3千萬的訪問量,總共有3.5億訪問人次,網站流量的60%的來自美國以外的國家。

網站紅了以後,他也被媒體的郵件轟炸了,大家都想採訪他,其中包括《彭博社》、《紐約客》等大媒體。有很多醫藥公司和科技初創公司給他發了offer,邀請他去實習,有人甚至出價800萬美金要在他的網站上投廣告。美國 CDC 甚至給他發了慶賀函,誇他數據採集和更新做得好。

在接受採訪的時候,Avi Schiffmann 告訴《紐約客》:“我只是想讓人們容易獲取數據,但沒想到它會變這麼大。”

Avi 不但對於新冠疫情的重視比身邊人要早,也很早開始注意到口罩的重要性。他很早就開始自制口罩,連他的外科醫生老媽現在都後悔沒有早聽兒子的。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

所以,他是怎麼製作這個網站的呢?

Avi 使用的技術叫做抓取(web-scraping),你可以把它看作大型的自動複製黏貼。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

比如,微博上有人在評價某部青春愛情動作電影,而橫店影視城的某個分析師想看一看大家怎麼看這部劇。他可以僱傭很多人把帶有這部劇tag的微博都複製黏貼到一個表裡,也可以用抓取技術自動操作。

因為網站五花八門,所以抓取也不是一個簡單的工作。但是一般來說,抓取時要先獲取要搜刮的網站的 URL 地址,下載所有的 HTML 代碼,接著,要選擇需要篩選的數據,然後打包下載,並以特定格式輸出。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

抓取這個技術很常用,比如房產中介的網站就會用這個技術更新他們的房源。還有一些比較不同電商平臺價格的網站和APP用的也是這種技術。當然,這個技術還被用於舊網站的信息搬運,或者社交媒體分析。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

一些數據分析和市場調研公司也會用這個技術建造他們的數據庫,然後把數據庫賣給其他有需要的公司。

比如,有個數據分析公司 hiQ 就曾經從領英獲取失業人數的數據,然後賣給其他公司,結果它就被領英拉黑了。不過,2019年加州的上訴法院裁定,未經允許的情況下對公共領域的數據進行抓取的行為並不違法。所以說 Avi 小哥用抓取軟件搞事情是不會進局子的。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

那他的編程是在哪兒學的呢?

他是自學的編程。7歲開始,他就在油管上觀看編程的視頻,然後製作了30多個網站。在做這個網站的時候,小哥也是邊學邊練,不懂就問谷歌。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

在這次的新冠網站之前,他在小學就做過一個類似的網站,這個網站會廣播當地高中體育比賽的分數,還會展示火星的天氣。

光會編程不算什麼,為了網站好看又好用,他還自學了UI(用戶界面)、UX(用戶體驗)設計以及3D建模。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

別看 Avi 編程玩得賊溜,他同學在學校裡可不是什麼優等生,而是個C等生,他的愛好其實就是編程。為了製作這個網站,他還翹了一週的課。

關於學校的學習,Avi 感到很無奈,“我想早點畢業,這樣就能安心做網站了。有時候因為有數學考試,我的網站就耽擱了。”

但這並不意味著這個常拿C的少年不愛學習。在接受技術新聞網站 Geekwire 的採訪時他說,他99%的空餘時間都拿來學習新技術,現在在同時做10個項目。

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

也有人覺得,這娃是不是要成為下一個小扎啊。在這個問題上,Avi 倒是很務實:“下一個扎克伯格不會建社交網絡,下一個拉里佩奇也不會建搜索引擎。我要做我自己。”

他想把這個疫情追蹤網站繼續做下去,因為下一次疫情離人類並不遙遠,而並不是所有人都必須要精通十八國語言才能讀懂全世界。

他最喜歡的是喬布斯的那句話:“只有瘋狂到認為自己能改變世界的人,才能真正改變世界”。

佩奇因為找不到網站怒建谷歌,小扎因為找不到女票怒建臉書,小哥因為找不到統計怒建病毒追蹤網站,小學生因為找不到答案怒減100分。

為什麼菜油倒海上能救命?這道題美國學霸國父也不會做

WHO幫瘟疫公司出救世版本了,哈佛還用它當教具

17岁C等生制作世界上最大的新冠追踪网站之一,被CDC表扬

把科學帶回家

ID:steamforkids

“把科學帶回家”所有

轉載請聯繫 [email protected]

https://shimo.im/docs/J8JTwRJyDQWgYpWT/


分享到:


相關文章: