這一次,機器又打敗了人類——為了救治人類


這一次,機器又打敗了人類——為了救治人類

撰文| 哪嗒

圖源| 達摩院及網絡


你覺得有點兒胸悶,偶爾還伴有咳嗽和發燒。你擔心自己中招了。

聽從專業意見,你去做了 CT 檢測。這項技術已經非常成熟了,它不需要入侵身體,就能透過你的皮膚、骨骼,看見你的肺部。100 多年來,人類就是靠它確認器官是否一切正常。

1 小時後,你拿到了一張 CT 影像。圖上的陰影、紋理讓你困惑,你不知道這意味著什麼。這時候,你需要專業的解讀。

醫生用肉眼識別,一般需要 5 - 15 分鐘。

要不要試試機器自動診斷?但,它可信嗎?

答案是不一定。

準確地說,得看這臺機器是如何被訓練的。過去傳統的訓練方法,得事先輸入圖像特徵,機器需要重新學習人類經驗。但最新的深度學習機器可以“自學”。

如果手上只有 100 張 CT 樣本,依樣畫葫蘆的機器會聰明些。但如果有 1000 張,它的準確度就很難再有突破。學到頭了。

記住 1000 這個數字。它很重要。

超過 1000 張之後,使用深度學習的計算機在圖像識別上的準確度仍會持續上升。直到今天,人類還沒有發現它的極限。

2016 年,在 ImageNet 大規模視覺識別挑戰賽上,圖像識別錯誤率已經低到 2.9%,遠遠超越人類(5.1%)。2017 年 7 月 26 日,已進行了 7 年的 ImageNet 競賽宣佈停止。

一個挑戰圖像識別的時代終結。機器勝出,而且準確率驚人,再比下去已毫無意義。

這是圖像識別界的 Alpha Go 事件。

1

2020 年 1 月 20 日,農曆臘月二十六,距離新年還有五天。

這天晚上 9 點,鍾南山出現在央視節目《新聞1+1》裡。

16 年前,鍾南山因為SARS 期間的敢言敢為成了中國最具權威的流行病學專家和抗擊疫情的代言人。兩天前,他剛去了一趟武漢,和高級別專家組、衛健委、醫院和疾控中心的人碰面。當時沒有幾個人知道他的行蹤。但他的突然出現讓所有人都意識到了事態的嚴重。

鍾南山當晚宣佈:新冠肺炎存在人傳人。

新冠肺炎確診人數剛剛超過 200。對流行病學來說,這個數字已足夠引起重視。但對機器學習的樣本來說,200 實在微不足道。

但遲穎認為,應該做兩手準備。“特殊時期,少量樣本也可以訓練。”她不確定接下來會發生什麼。最好流行病能很快得到遏制;但如果確診人數不斷攀升,那她和團隊就有必要挺身而出。

遲穎是個圖像識別專家,一個時時被工作驅動的人。除此之外,她熱衷寫詩,最近的一首寫在達摩院年會後,年會的主題是突破。她記得團隊的負責人華先勝在年會上說,自勝者強。這讓她很是激動,想到 2020 年團隊立下的目標——要在下個財年初讓各項業務全面落地,忍不住寫了一首。

這一次,機器又打敗了人類——為了救治人類

遲穎在達摩院 AI 中心帶領醫療智能團隊。他們都是訓練機器的專家,經手的機器能識別各類疾病的CT 影像,其中以肺部、肝部、心血管和關節最是擅長。過去幾年,拿下肺結節檢測大賽LUNA16、肝結節診斷大賽LiTS、醫療自然語言處理關係提取ENLP BBtask比賽等多個國際大賽的冠軍。

平日裡,團隊通過遙控公司的雲上服務器,分駐北京、杭州兩地,在釘釘上辦公。所以即便在假期,要遠程訓練出一套自動檢測的系統,也不在話下。

只要有足夠多的樣本數據。

但問題也在這裡。工程師沒有 CT 影像,影像全在醫院。以往,醫療機構對這項新技術還持有觀望態度,它們不相信技術能為診療帶來實際的幫助,要是能照舊例行事,誰都不願意做改變。

信任的建立需要一個時機,這樣的時機一直沒有出現。

1 月 23 日公佈的確診人數超過了 500 人。凌晨 2 點,武漢市發佈“ 1 號 通告”,決定從早上 10 點起“封城”。

1 月 25 日,大年初一,確診人數增加至 1287 人。

不能再等了。遲穎打了三通電話,其中一通打給了鍾南山院士的團隊。在達摩院和阿里雲天池團隊一起舉辦的天池醫療 AI 大賽上,鍾南山曾受邀擔任肺綜合疾病組的顧問。平日的技術沉澱和生態建設,關鍵時候都成了助力。團隊還聯繫上國家衛建委,“主動請纓,希望做點事”。

“請保持電話暢通。”得到的回覆都一樣。

這表明,所有人都意識到這次的疫情不同以往,沒有新技術不行。但他們也在等待時機。

幾天後,達摩院 CT 影像分析算法小組從李蘭娟院士團隊看到兩個診斷視頻。這位被稱為“李奶奶”的院士在 SARS 期間同樣以果敢著稱。除夕夜,她飛往北京,參加了科技部一個關於新冠病毒研究的會議。22 日,建議武漢必須嚴格地“封城”。

診斷視頻顯示,重症病例的肺部 CT 出現了明顯的白化,就像照片曝光過度。這些特徵在健康的肺部、和其它肺部疾病的肺部上都不存在。

對機器學習來說,這些特徵差別就像 0 和 1 一樣明顯。

這讓遲穎和她的團隊確信,AI圖像診斷技術可以起作用。團隊叫停了手頭的所有其它工作。他們開始尋找更多新冠肺炎患者的 CT。

2

CT 是 X 射線成像的一種。1890 年代,X 射線的發現徹底改變了人類對身體的認知方式:不開刀、無痛苦,就能穿透皮膚,看到骨骼、器官的損傷和病變。

發現 x 射線的是威廉·康拉德·倫琴,他在 1895 年拍了第一張 X 光照片——妻子的手。當時一家醫院大膽地使用 X 射線,找到了進入患者手掌中的一根鐵針,並順利取出。不過這引起的轟動顯然比不上人們的擔心——X 射線會不會穿透婦女的衣服,進行不體面的窺探。

這一次,機器又打敗了人類——為了救治人類

1895年,德國物理學家倫琴拍攝的第一張X射線照片

現在我們都知道了,擔心是多餘的。新技術的推廣總會經歷這樣一個階段,這在人工智能的發展中被再次印證。

不過到了第二年, X 射線就被用於各種疾病的診斷和治療。一位哈佛大學醫學院的學生用它研究動物的消化系統。有人用它第一次拍到了子宮內胎兒的圖像。在英格蘭,醫生用它找到了手腕中彈的具體位置。在第一次世界大戰期間,瑪麗居里建立了移動放射攝影機構,協助前線的外科醫生。

X 射線最輝煌的時刻到了。新技術給了人們無所不能的感覺。女人拍 X 片互贈,鞋店推出“X射線試鞋鏡”。X 射線的商用在 1960 年代才被叫停,也是在差不多的時候,放射治療成為一個專門的領域。

這意味著,人們對輻射的風險和透視的好處做了權衡,認為在醫療領域 X 射線的好處大於潛在風險。

CT 在某種意義上是 X 光片的加強版。經過計算機對一組照片整合處理,CT 比 X 光更清晰準確,可以從多個平面觀察組織結構,也讓它擁有足夠多的數據信息,可供機器學習。

多年後,醫療 AI 公司紛紛選擇 CT 影像作為突破口就一點都不奇怪了。

達摩院的醫療影像小組是在 2016 年成立的。即便數據獲取艱難,可在新冠肺炎爆發前,他們手上也已經有積累豐富的肺部 CT 影像了。

2 月中,達摩院拿到了小几千的新冠肺炎、和與之區分的普通肺炎的 CT 影像,他們在兩天內就上線了全新的 AI 診斷系統。行動之迅速,就和這長期的數據積累和肺部算法沉澱有關。

3

一切可以從華先勝在 2015 年加入阿里巴巴負說起。

華先勝在視覺識別和搜索領域是個國際公認的專家,他的頭銜包括國際電氣與電子工程協會院士(IEEE Fellow)、美國計算機協會ACM2015年度傑出科學家。加入阿里巴巴後,華先勝責視覺計算團隊,這是件轟動業界的大事。

遲穎的專業是醫療影像,她在英國倫敦帝國理工和牛津大學拿到了博士和博士後學位,在長達 6 年的時間裡,她都在研究肝臟手術的、心肺建模的、乳腺癌良惡性區分的、以及運動傷害後足跟腱恢復的影像算法。畢業後,她加入西門子。

作為最早生產 CT機和核磁設備的廠商,這家老牌的德國公司醫療技術基礎雄厚。遲穎得到重用,擔任了西門子醫療系統AI的中國區經理。西門子的醫療AI不愁銷售,它可以把軟件嵌入硬件系統,打包賣出去。因為這個,它受到的行業不確定性的衝擊要小一些。

但有衝擊的地方,機會也多。“我特別想像衝浪一樣,體驗持續I在AI大趨勢前沿打拼的感覺。”遲穎離開西門子加入達摩院時,達摩院剛剛成立一年。

達摩院的前身是阿里巴巴 iDST 實驗室,經過幾年的摸索,新成立的達摩院明確了未來的願景:業務問題驅動科研。不只埋頭髮論文,在這眾多研究機構中獨樹一幟。

遲穎在加入醫療AI團隊的第一年就在肝結節診斷大賽LiTS拿了三項第一,但她還是時時覺得處於挫敗中。

她想幫團隊快速實現商業化,形成產品、服務,賣給需要它們的人——需求一定是存在的,她還意識到商業化需要形成“閉環”,他們不停地進行頭腦風暴,設定一個又一個新方向,但這些曾在商業故事中被描述過無數次的做法,都沒能改變團隊的迷茫。

商業化的難處有四點:一,醫療數據非常分散;二,對影像進行標註,這需要醫生或醫學背景的研究者配合;三,做完算法後,要找到醫院試用;四,監管嚴格,認證時間漫長,有時會超過一年半。

換句話說,都不是能靠算工程師獨立完成的。

同類型的初創公司不斷刷新融資神話。總部位於英國的人工智能健康服務商BabylonHealth公司在的 C 輪融資中籌集了 5.5 億美元。國內的公司依圖在 2018 年完成 2 億美元C+輪融資。估值超過 150 億。但他們就跟 1999 年前的互聯網公司一樣,只是搏了眼球,證明了投資者的遠見,卻賺不了錢。

在達摩院內部,CT影像分析算法小組就像一家內部投資的初創公司。“其他團隊把我們這個團隊的收入給扛了。”

4

疫情給整個團隊裝上了加速器。所有環節都被打通了。

第一個落地的醫院是有鄭州“小湯山”之稱的岐伯山醫院。

過去這裡是鄭州市第一人民醫院的港區醫院,因為新冠疫情爆發,臨時改建成定點救治醫院,並冠以“岐伯”之名。岐伯是上古神話裡的名醫。

物理空間的改建只花了 10 天,沒急著投入使用,又花了7天,讓醫院變得更智能。

在 2 月16 日正式接診之前,岐伯山醫院已經引入了與武漢火神山、雷神山醫院同款的智能配送機器人,它會自己開關門、搭乘電梯、避障,遞送化驗單、藥物。醫院裡還配備了智能體溫監測系統,並對入院患者的病例、診療、醫療影像進行全流程數字管理。

這些工作是阿里雲主導的。過去幾年,它在鄭州推行數字政府項目,改變了這座城市的信息網絡。疫情期間,這些努力有了成效。在所有與湖北接壤省份的省會城市中,鄭州的確診人數排名倒數第二。

不過對疫情期間的醫院來說,最立竿見影的是引入 CT 影像AI診斷技術。

一開始,核酸檢測被視為最權威、也是唯一的確診手段。在所有的醫院和醫療機構都是如此。人們最先意識到其中的問題,是因為核酸試劑盒數量遠遠不夠,太多人無法得到確診,當然也無法獲得救治。

然後,一些核酸檢測呈陰性的感染者出現了。核酸檢測的迷信被打破。2 月 5 日發佈的第五版診療方案把 CT 檢測顯示肺部具有肺炎影像學特徵的疑似患者,也納入統計。

8 天后,湖北省衛健委在 2 月 13 日上午 7:42 公佈的確診數據顯示:2 月 12 日,湖北省單日新增確診病例 14840 例。而在前一天,新增確診病例只有 1638。

兩天後,達摩院的 CT 影像AI診斷技術就開始在鄭州岐伯山醫院投入使用。

這一次,機器又打敗了人類——為了救治人類

醫護人員使用AI識別新冠肺炎病例新冠影像

新技術讓機器接近一位經驗老道的醫生,能從一大堆的肺部影像中很快找出感染新冠病毒的樣本,而且速度更快——醫生用肉眼識別,一般需要 5 - 15 分鐘;但使用 AI技術,一張 CT 的診斷只用 20 秒。實際計算時間只需要2秒。

準確率達到 96%。

除此之外,它有醫生不具備的本領:能準確追蹤病情變化。

新冠肺炎患者每 3-4 天就會進行一次 CT 檢查,他們的肺部影像變化很快,AI 系統設計了清晰的時間軸,幫助醫生在面對三天前、六天前甚至兩週前的肺部 CT 影像,做出定量分析。否則,他們只能拿尺子對著屏幕測量異常部位的面積、長度。

上線前一天,鄭州市委書記徐立毅在岐伯山醫院抽選了三個肺部CT樣本,想確認機器能否勝任接下來的艱鉅任務。

機器很快識別出其中的兩張是感染新冠肺炎的肺部影像。

準確率 100%。

5

2017 年,華先勝在一場行業會議上,被安排和依圖的 CEO 朱瓏對談。

華先勝問了一個所有人都想問、但不敢問的問題:人工智能的熱潮有過很多次,每次大家都很激動,“這一次人工智能起來以後,我怎麼能知道它不是一個虛假的春天呢?”

遲穎過去沒有把握,但現在她認為春天來了。

團隊做了一個顯示屏,實時展示CT 檢測 AI 系統的調用量。一開始平均每天三四千,到後來每天九千,最高時,一天的調用量超過了 13000。

到 3 月下旬,這套 AI診斷系統的累計調用量已經超過 29 萬,在169 家醫院落地。此時距離遲穎的團隊開始訓練這套系統,才過去了不到 40 天。

此時,中國已經連續多日沒有新增的本地確診病例,但達摩院的科學家們並沒有停下來。

2 月 24 日,達摩院的官方郵箱收到第一封海外郵件。郵件來自意大利的一家醫院,對方希望達摩院的AI技術可以在醫院儘快落地,助力他們抗擊已經日趨嚴峻的疫情。

這天,意大利封鎖了北部的 10 個城鎮。如果走在商業中心米蘭的街上,你看不到一間開著的商店和餐館。斯卡拉歌劇院、大教堂(Duomo Cathedral) 不再接待遊客。每年最熱鬧的威尼斯狂歡節提前結束了,最後一天,狂歡者戴上了兩層面具,外面一層是口罩。

這一次,機器又打敗了人類——為了救治人類

意大利警察用無人機進行巡查

意大利的確診病例達到了 229 例,報告有 6 人死亡。

之後的一個月,海外疫情告急。海外確診人數在 3 月 26 日超過了 38 萬,美國確診8.2 萬例,超過中國。意大利的病死率超過了 10%。每天都有各國政要感染的新聞。

來信不斷。

寫信人未必都是客戶。一個在美國大學任教的歐洲人寫信求助,他不代表醫院、也不代表政府,他只想知道達摩院的技術能不能幫助他的國家。

阿里巴巴上週向全球發佈了五大抗疫產品服務,有三個來自達摩院這支團隊,分別是新冠疫情預測服務、病毒全基因組測序數據分析服務、CT 影像分析服務。阿里雲提供算力支持。

也是一週前,釘釘上線了“國際醫生交流中心”。這是一個實時在線的平臺,各國醫務工作者可以選擇與中國醫生一對一溝通、會診,也可以參與中國醫院的經驗分享直播活動,並進行提問互動。遲穎的團隊也正在為此提供醫療專業的中英文翻譯支持。這涉及到自然語言處理,是達摩院醫療智能團隊的另一項看家本領。

遲穎想起她收到第一封海外來信時,因為不清楚哪些部門可以合作服務海外,不知道該如何回覆,寫了又刪。現在,科學家和工程師們形成了知識共同體,“有了燈塔(指馬雲),好像憋了一股勁,終於找到出口了。

疫情結束後,遲穎有兩個近期打算。

推出達摩院的醫療 AI 產品,爭取儘快通過各國食品藥品監督管理局的認證。這些產品在疫情中得到了很好的反饋,會幫助加速認證的過程。未來,產品還可以拓展到心肺一體、骨科的診斷。

她還打算寫首詩。疫情發生後,遲穎有很多感觸,但一直沒時間動筆,“每一天都在忙更重要的事,寫詩就顯得不重要了”。



分享到:


相關文章: