突破卡脖子技術:芯片夢

突破卡脖子技術:芯片夢

pixabay.com

撰文 | 邸利會

包雲崗的一天以運動開始。

7點鐘起床,用10分鐘做完100個仰臥起坐、30個俯臥撐、200個高抬腿、30個蛙跳以及200個垂直跳躍。緊接著送女兒苗苗上學。7點40開始跑步,大概跑5公里,20多分鐘,邊跑邊聽一些資料。

鍛鍊的結果是更強勁的心肺,讓他能經受較長時間的工作,同時,行動也更敏捷。

包雲崗是誰?他是中國科學院計算技術研究所的研究員。簡單說,他是做芯片的。

在過去的這些日子,由於中興事件,華為等公司被禁運,這個群體承受了不少壓力。有人說,芯片落後,做芯片的人要負責。

不過,這樣的看法也許有點過嚴苛。芯片這行的門檻確實很高,並不那麼容易趕超——

今天研製一款中檔芯片,往往需要數千萬甚至上億美金的投入。更嚴酷的現實是,長期以來,市場已被少數企業壟斷,他們構建了後來者難以逾越的軟硬件生態體系(如個人電腦的 window-intel生態,手機的arm-android生態)。

面對壟斷的市場和複雜的禁運,中國的芯片究竟該如何破局?

目前看,有堅持自主研發,從底層做起,一點點構建生態的“死磕”型,如龍芯;有從自身業務出發研製芯片,自產自用的系統商,如華為;也有找準特定領域發力者,如寒武紀、合肥長鑫等。

而包雲崗所代表的另外一些人則相信,構建開源芯片生態,引入硬件的敏捷開發,也可以是一條光明的道路。

充滿機遇的黃金時代

中國芯片的發展不太可能脫離世界技術發展的潮流與軌跡。在埋頭苦幹之前,先抬頭環顧下四周也許是十分必要的。

2018年的6月4日,在洛杉磯舉行的第45屆計算機體系結構國際研討會上,2017年圖靈獎得主 David Patterson 與 John L. Hennessy 登臺,發表了名為《計算機體系機構的黃金時代》的演講。

在演講中,他們回顧了1960年代以來的計算機的發展並指出了當前面臨的一些挑戰。其中引人注目的是,摩爾定律、登納德縮放定律正在失效,粗略地說,晶體管不太可能無限地小下去,同時還能保持低的能耗。

突破卡脖子技術:芯片夢

2017年圖靈獎得主、加州大學伯克利分校教授 David Patterson 在第45屆計算機體系結構國際研討會上發表演講

那麼,如何應對這一危機呢?

首先,他們建議可以著眼特定領域訂製架構。這一想法目前已經被業界廣泛採用,比如在紅火的人工智能領域,已經湧現出各種各樣的人工智能專用芯片,用於加速語音識別、圖像識別等任務。

他們的第二個建議是,在創建開源指令集的基礎上,構建開源硬件的生態。指令集可以看作是底層硬件和上層軟件之間的橋樑,實現了軟件和硬件的溝通。

這個思路是受了開源軟件的啟發。大家熟知的 Linux 和 Android,都是開源的典型案例。Android 也是基於Linux核,如果沒有開源,Android 手機便不會一夜間遍地開花,很快與蘋果分庭抗禮。

當前,開源指令集中最有名的當屬RISC-V,由 David Patterson 所帶領的加州伯克利分校的團隊在2010年所開發。

當時,該團隊為了啟動一項研究,需選一種指令集,在考察了ARM、X86等多款指令集後,發現不僅設計複雜,而且還有知識產權的障礙。他們臨時組建了一個四人小組,用3個月的時間從頭到尾設計了一套新的指令集。

之後,他們將RISC-V徹底開放,其選擇的開源協議允許使用者修改或重新發布開源代碼,也允許進一步開發商業軟件,且不用為指令集支付費用。

為了推廣RISC-V,David Patterson教授常年奔走,不遺餘力地進行宣傳。伯克利的研究團隊也在世界各地舉辦研討會,為開發者、使用者和研究者架設彼此交流的平臺。

2015年,非營利組織RISC-V基金會成立,旨在打造開發合作的軟硬件社區,構建完善的生態系統。

如今,該基金會的成員已經超過了325個,其中不乏阿里巴巴、華為、谷歌、高通、英偉達、三星、臺積電等產業巨頭,也包括了中科院計算所、加州大學伯克利分校、麻省理工學院、普林斯頓大學、蘇黎世聯邦理工學院、印度理工學院等學術機構。從世界範圍看,RISC-V正獲得越來越大的關注,處在快速發展當中。

兩位作者提出的第三條建議是,在硬件領域踐行敏捷開發。這一點也是受了軟件開發方法的啟發。

十幾年前敏捷軟件開發的興起,克服了傳統瀑布式開發頻繁失敗的情況,革新了軟件開發的方法。

一些老的程序員應該對事無鉅細的規劃和繁複的文檔記憶猶新。而敏捷開發下,幾個人的小團隊就可以快速給客戶展示一個原型,並根據客戶的反饋進行不斷的迭代,很大程度上保證了需求的貼合以及按時交付。

兩位作者分析後認為,儘管屬於硬件領域,芯片開發也可以實現敏捷開發。

包雲崗團隊也曾以一個項目(實現一個簡單的共享二級緩存)進行過實際的比較。他們發現,一個本科生新手用敏捷開發短時間內就可以完成項目,不僅代碼量少,而且代碼質量可以達到甚至超過工程師的水平。

“敏捷開發可以快速構建一個可以工作的原型,對項目開展來說是非常有意義的,從這點來說,確實大大降低了硬件開發的門檻。” 包雲崗說。

然而,與世界相比,中國在開源硬件和敏捷開發方面才剛剛起步。

今年6月,國際計算機體系結構旗艦會議ISCA在美國亞利桑那州鳳凰城召開。當時,與ISCA一起舉行的遠景研討會吸引了上百位聽眾,主題“面向下一代計算的敏捷開放硬件”。而11位報告人中有圖靈獎得主David Patterson教授,多位美國工程院院士,麻省理工學院、伯克利、斯坦福、加州大學聖迭戈分校、谷歌、英偉達、美國國防高級研究計劃局(DARPA)等頂尖大學、企業和政府機構的專家。

如此重要的會議從一個側面反映出,開源硬件以及敏捷開發已經是行業關注的前沿熱點。然而,包雲崗是唯一一位來自美國以外的報告人。

他說, “這多少有些勢單力薄”。

中國的開源行動

突破卡脖子技術:芯片夢

RISC-V中國聯盟推動者孫凝暉、倪光南、包雲崗、方之熙與David Patterson教授合影。

回顧歷史,中國軟件行業的迅速發展,一定程度上拜開源軟件所賜。以移動時代為例,如果沒有 Android,就沒有今天的中國移動手機廠商以及更大規模的移動應用市場——這意味著,如果你是Android用戶,將無法打車、無法購物、無法發朋友圈......

那麼,如果開源芯片是未來的趨勢,中國是否做好了準備?

在經過9個月的籌備後,2018年11月8日,在浙江烏鎮舉行的第五屆互聯網大會上,中國開放指令生態(RISC-V)聯盟正式宣佈成立。包雲崗擔任秘書長。

一年之後,在10月的第六屆世界互聯網大會“互聯網之光”博覽會上,中國開放指令生態(RISC-V)聯盟的多家成員單位,芯來科技、兆易創新、卡姆派樂等展示了他們基於RISC-V的成果。

兩週前舉辦的首屆中國RISC-V論壇,企業界的註冊人數佔到78%,企業界的投稿佔到60%。與會專家與David Patterson教授進一步討論瞭如何更好發揮中國在RISC-V開源方面的優勢,如何推動中國企業和機構更好地參與和貢獻國際社區,RISC-V國際基金會如何調整以支持更多的中國力量參與等等。

種種跡象表明,中國的學術界和產業界正逐步擁抱開源,尤其是參與RISC-V生態的構建。

在這眾多的參與者中,阿里平頭哥的身影引人關注。這家於去年10月31日成立、阿里全資控股的公司,標誌著阿里造芯的開始。

當然,從世界範圍看,系統公司造芯也不稀奇,谷歌、華為圍繞著自我的業務,都在研製芯片。華為更是在2004年就在之前研發專用集成電路的基礎上,成立了全資控股的子公司海思。

不過,阿里發展芯片的打法有所不同,它在自己造自己用的同時,也在打造平臺。

突破卡脖子技術:芯片夢

今年10月15日,阿里達摩院計算技術實驗室負責人、平頭哥芯片公司CTO及首席科學家謝源在計算所介紹平頭哥的戰略。(攝影:邸利會)


今年8月,阿里發佈了無劍平臺,其主要目的據稱是幫助大量的中小企業,以一半的開發成本,一半的研發週期滿足系統級芯片的設計需求。

過了兩個月,在第六屆互聯網大會上,平頭哥宣佈,正式開源低功耗微控制芯片設計平臺。開發者可以基於該平臺設計面向細分領域的定製化芯片,IP供應商可以研發原生於該平臺的核心IP,高校和科研院所則可開展芯片相關的教學及科研活動。

更早前的7月25日,平頭哥也發佈了號稱性能最強的RISC-V架構處理器玄鐵。

阿里這樣大企業的一系列舉動,除了構建自我生態外,無疑也會促進中國整個開源芯片的發展。

在學術界,中科院計算所也研發了一套基於RISC-V、面向開源芯片設計的系統級驗證和原型平臺SERVE。

“SERVE平臺在國際上和已有的最先進的企業和大學的系統相比,也是有其優勢的,而且已經給國科大200多位本科生使用了2年,論文發表在國際計算機教育旗艦會議SIGCSE上。” 包雲崗告訴《知識分子》。

直面挑戰

儘管學界和工業界都所有行動,但就目前的開源芯片而言,也還面臨著不少的挑戰。

比如,即使是阿里這樣的巨頭,在其打造的芯片設計平臺中,也沒有自己去設計EDA工具,而是與美國這一領域的巨頭Cadence等合作,藉助阿里雲的方式讓中小企業用起來。可以說,缺少了開源的EDA工具鏈,就算不上完整的開源芯片平臺。

EDA工具在芯片設計中扮演著重要的角色,如果把設計、製造、封裝芯片的過程比喻成寫書、印書和裝訂書,EDA就相當於寫書的工具,如同筆和墨。

可如此重要的工具一直以來被 Synopsys 和 Candence 等巨頭壟斷,後來者要追趕十分不易。從研發投入看,兩家公司2018年就已達60至70多億人民幣。在人才方面,一個公司每年至少需要3000名研發工程師才能達到和巨頭們匹配的創新能力,可估計下來國內的EDA領域的博士生只有約50名。

一方面,沒人沒錢、高門檻、市場小,少有企業願意進入EDA領域,可另一方面,即使學校培養了大量學生,也沒有企業可以消化。中國EDA的發展進入了尷尬的“死鎖”狀態。

今年8月,隨著 Synopsys、Cadence、Mentor 三家EDA公司停止與華為合作,EDA的困境引發了廣泛關注。當時,華為輪值董事長徐直軍表示,“大家都很清楚,這些公司都不能和我們合作了,但天下也不是隻有他們。歷史上,即使沒有工具,也可以生產出芯片,當然對我們有挑戰,效率不會那麼高了,也不會那麼輕鬆了。英特爾70年代就生產CPU了,這些公司都還沒有成立。”

雖然如此,EDA領域的一位專業人士向《知識分子》表示,“華為所說的是可以做到的,但如果是考慮到更先進的7納米,7-plus的話,還是需要國外廠商的支持。”

這一 “卡脖子” 的工具究竟該如何破局?

在今年8月14日於北京九華山莊召開的CCF容錯大會上,北京大學、中科院計算所、清華大學和復旦大學等自主發起了開源EDA框架——OpenBelt倡議。來自北京大學高性能與應用中心的羅國傑副教授重點介紹了這樣一個開源EDA框架的設計動機和思路。

突破卡脖子技術:芯片夢

羅國傑介紹開源EDA框架

他表示,做開源EDA框架的想法兩年前就產生了。面對EDA這樣一個前途黯淡的小方向,羅國傑一直在考慮如何讓其他領域,比如更廣的芯片設計領域的人也參與進來。

“EDA領域有很多都是很難的問題,也許給做數學的擅長這個問題的人,說不定一下子就解決了,但他們下一步要試一試這個方法是否好用,可能又要了解微電子芯片設計,還要寫代碼,拿數據,其實都是很大的障礙,但如果有一個很好的基礎設施,就能馬上測一測是不是對解決問題適用,就很好。” 羅國傑告訴《知識分子》。

目前,市面上已有的開源EDA工具鏈已經可以滿足小規模芯片的開發需求,但與商業版本相比,在先進工藝支持、穩定性和可用性方面依然有不小的差距。羅國傑等人的倡議可說正當其時,利於凝聚各界的智慧和力量,為打破目前這一領域的壟斷局面貢獻力量。

開源EDA工具鏈是構建開源生態的其中一個重要因素,其他的重要的因素還包括高質量的IP核,更完善的芯片開發、驗證、測試平臺,以及硬件之上的系統軟件和開發環境等,每個要素都不可或缺。

但羅馬並非一天建成,開源生態的建設也並非一日之功。

芯片人才困境

突破卡脖子技術:芯片夢

今年7月的中國科學院大學錄取通知書,附著一枚“龍芯”,被網上稱為“最硬核”錄取通知書。

發展芯片,可做的事情很多,但培養人才恐怕都是排第一位的。中國芯片人才的匱乏一直也是制約芯片行業發展的重要因素。

在過去,整個芯片行業,也存在著類似EDA領域的死結,即使大學培養了足夠多的人才,由於整個行業客觀上的疲軟,也難以容納或留得住這些人才。事實上,據包雲崗他們做的一個簡單統計,不少做硬件的中國學生,畢業後去了其他的國家,尤其是美國。

隨著這些年人工智能、物聯網時代的到來,加之美國的禁運,不少人認為,中國的芯片行業迎來了難得的發展機遇。海思、寒武紀、平頭哥等眾多芯片公司的強勁人才需求為打破死結提供了有利條件。

然而,人才的培養仍然面臨一些障礙。比如,一個需要克服的障礙是人們的舊觀念——與軟件行業相比,做硬件沒前途。

2018年6月,在美國商務部公佈了與中興通訊和解協議後幾天,CCF舉辦了一次小型論壇。組織者問,假如你的孩子今年上大學,會推薦選擇芯片領域嗎?聽眾回答不會的佔到55.3%。

“學生最後的取向是市場決定的,很難靠情懷靠機制阻止學生去高薪資的互聯網企業。” 中國科學院計算所研究員韓銀和說。觀念的改變需要時間。

另一重挑戰是,與中國信息產業頭重腳輕相對應,中國信息人才的培養也是頭重腳輕。

比如,在人工智能火紅的今天,中國的人工智能產業獲得了不錯的發展,但底層研究能力的缺失以及人才的匱乏依然是突出問題。

中國科學院計算技術研究所研究員陳雲霽,這位AI芯片的先鋒人物在今年發表的一篇文章中尖銳地指出——

“越是人工智能上層(算法層、應用層)的研究,我國研究者對世界作出的貢獻越多;越是底層(系統層、芯片層),我國研究者的貢獻越少。在各種 ImageNet 比賽中,我國很多機構的算法模型已經呈現‘霸榜’的趨勢,可以說代表了世界前沿水平。但這些算法模型絕大部份都是在CUDA 編程語言、Tensorflow 編程框架以及 GPU 之上開發的。在這些底層的’硬科技’中,我國研究者對世界的貢獻就相對少了很多。底層研究能力的缺失不僅給我國人工智能基礎研究拖後腿,更重要的是,將使得我國智能產業成為一個空中樓閣,走上信息產業受核心芯片和操作系統制約的老路。”

鑑於此,本沒有教學義務的陳雲霽已經在全國十個高校開設了智能計算系統的課程,從上層的算法到編譯框架、再到操作系統、芯片,把整個的技術棧串起來。

“在不同的學校上這門課的感覺是不一樣的,北大上的效果比較好,基礎好的話比較快能理解我怎麼把知識點串起來,但有的學校單個的知識點都沒有完全理解,還想結合起來解決問題就非常困難。” 陳雲霽說。

一場事關未來芯片發展的教育實驗正在展開。

今年7月,一封“最強錄取通知書”刷屏網絡,中國科學院大學校長李樹深給2019級本科新生的信中,嵌入了一枚“龍芯三號”的實物芯片。這枚芯片的象徵意義不言而喻——中國芯片的未來是在年輕人身上。

包雲崗記得,去年11月8日的烏鎮,在中國開放指令生態(RISC-V)聯盟成立儀式結束後的慶祝酒會上,聯盟的成員覺得,推動開源芯片可以先從教育入手。

之後,包雲崗等人在科大啟動了一個計劃,希望讓本科生能在全開源的EDA工具鏈上設計出開源處理器芯片,並完成流片,實現帶著自己設計的芯片畢業,從超硬核錄取通知書變成超硬核畢業證書的夢想。

儘管中國芯片設計的人才十分匱乏,很多芯片企業抱怨找不到人,但傳統上培養一個芯片設計師實際上耗資巨大。該計劃某種程度可以看做是較為廉價、快速大量培養芯片設計人才的辦法。

在今年10月31日智源研究院舉辦的智能體系架構與芯片專題論壇上,陳雲霽不無感慨地說——

“我就想了一下,我自己在計算所幹了17年的芯片設計,耗了國家多少錢?我的博士生導師跟我說,一個小的芯片設計師就是拿錢砸出來的,就是拿失敗,拿bug耗出來的,從這個角度上看,我確實也耗了國家不少錢,肯定是付了一些學費的。一個好的芯片設計者,比如一個海思的芯片設計者耗了多少錢,是以億計的。反過來說,如果把培養一個頂級的設計師花的一億塊錢,反過來用五萬塊錢培養一個人,怎麼樣?雖然不是最頂級的,但這五萬塊錢的一個人就可以從邏輯設計到封裝,到後來在板子上調的問題全部一串搞完,這樣為國家培養一個人才挺划算的。培養兩千個還不錯的人才,對我們國家不是浪費錢的事情,而是造福國家,造福企業的事情。”

包雲崗也在這個論壇上。他透露,目前給本科生做的芯片,選的是比較低端的110納米工藝,這樣開源EDA工具鏈資源更豐富一些,設計的複雜度也會降低一點。

“這個事情從來沒有想過短期內能夠看到一個很重大的突破,我是覺得只要日積月累的去做,去迭代,把EDA工具鏈做強起來,把流程積累起來,十年左右的時間預計可以把這個開源芯片的生態建起來。” 包雲崗說。

確實,開源芯片是一個美好的願景,到要變成現實還面臨觀念、技術、資金、商業模式、知識產權、協作機制等多方面的挑戰。

包雲崗記得,去年11月8日的烏鎮,當中國開放指令生態(RISC-V)聯盟剛成立時,不管是在理解上還是實施計劃上,對開源芯片他其實都還處於朦朧狀態,但那時已經做好了4500天每天進步千分之二的長遠打算。

“到2030年還有約4500天,我們努力讓每一天哪怕提高千分之二,到時也會比今天強8000倍。” 他說。

每天提高一點點,哪怕不多。這似乎已是包雲崗的人生格言,就像他從事的另一項“事業”——跑步減肥。從一年前的決定開始,他就時不時在朋友圈記錄下最新的進展。一年下來,他的體重降了約9公斤,腹部的呼啦圈也消失了。身體輕盈的好處是他可以跑得更快,更為敏捷——昨天他的速度已經是平均每公里4分34秒,我特意翻閱了他去年十一國慶時候的成績,6分09秒。不經意間,時間可以回答一切。

1. https://www.sigarch.org/riscy-history/

2. https://cacm.acm.org/magazines/2019/2/234352-a-new-golden-age-for-computer-architecture/fulltext#R11

3. https://riscv.org/members-at-a-glance/

4. https://agilemanifesto.org/

5. Lee, Y.,Waterman, A., Cook, H., Zimmer, B., Keller, B., Puggelli, A. ... and Chiu, P.An agile approach to building RISC-V microprocessors. IEEE Micro 36, 2 (Feb.2016), 8–20.

6. 包雲崗等,處理器芯片開源設計與敏捷開發方法思考與實踐,《中國計算機學會通訊》,第15卷,第10期。

7. 陳雲霽,智能計算系統——一門人工智能專業的系統課程,《中國計算機學會通訊》,第15卷,第6期


分享到:


相關文章: