09.11 摩爾定律的新動力:礦機芯片江湖背後的“全定製方法學”


摩爾定律的新動力:礦機芯片江湖背後的“全定製方法學”

一邊是比特大陸螞蟻礦機的停滯不前,一邊是比特微電子的神馬礦機的異軍突起;一邊是芯片製程工藝逼近物理極限,摩爾定律逐漸失效,一邊是比特微電子的基於全定製方法學的芯片,在能效比上的持續的成倍提升。這一切的變數的關鍵卻都是因為清華工程物理系博士楊作興和他的力推的全定製方法學。而這個年輕人,改變的不止是礦機芯片市場,或許還將影響半導體芯片行業的未來。

“全定製方法學”背後的礦機芯片“江湖”

2017年3月,深圳比特微電子科技有限公司(以下簡稱“比特微”)在成立8個月之後,就推出了基於“全定製方法”設計的礦機芯片的神馬M3,上市一個月就售出了1000臺,銷售額近千萬,全年銷售額超過5億。

比特微董事長、總經理兼CTO楊作興告訴芯智訊:“我們去年的銷售是五個億,淨利潤是七千多萬,今年上半年也已經有了十幾個億的銷售額,好幾個億的淨利潤,交了將近一個億的稅。”隨著新的神馬M10的即將上市,楊作興更是信心滿滿:“M10目前的算力指標是33T到35T,這是目前市面上最好的。”楊作興預計今年比特微的銷售額將會突破30億元。

雖然今年以來比特幣價格持續走低,礦機市場景氣度大幅下滑,但是從比特微公佈的銷售額數據來看,其礦機銷量仍處於快速增長當中。

相比之下,比特幣礦機市場老大——比特大陸的螞蟻礦機的銷量卻遭到了重挫。目前螞蟻S9礦機的現貨價相比高峰時已跌去了近80%。而且,根據比特大陸2018年一季度公佈總資產數據顯示,存貨為12.4億美元,超過了2017年銷售額的一半。這麼大的庫存量,顯然,礦機銷量確實出現了下滑。而且今年二、三季度礦機市場更是低迷,比特大陸的礦機銷量進一步下滑。

一邊是比特大陸礦機的銷量的大幅下滑,一邊是比特微的神馬礦機的異軍突起,冥冥之中,楊作興和他的全定製方法學,成為了其中的關鍵。

什麼是“全定製方法學”?

下面這張圖上半部分的流程,就是我們目前大家比較熟悉的芯片的設計流程,用高級語言寫一個代碼,還有代工廠單元庫,綜合成一個門級網表,做好以後再產生時鐘,再佈線,形成GDS。這就是傳統的芯片設計的流程。

摩爾定律的新動力:礦機芯片江湖背後的“全定製方法學”


眾所周知,目前的芯片設計公司乃至芯片代工廠,在芯片設計上製造上基本都是依賴於EDA(Electronic Design Automation,電子設計自動化)工具來進行電路設計與仿真、自動佈局佈線,網表文件自動生成等等。

而楊作興提出的“全定製方法學”則打破了原有的芯片設計流程和方法。

首先,其針對自己的芯片應用範圍和場景,採用了自己設計的單元庫。因為代工廠的單元庫是面向所有的客戶,做出來的東西要考慮各種應用範圍,所以在一些局部特殊的場景的時候,可能在面積、功耗、功能方面不是最優的。

第二,採用手動佈局。在芯片內部每一個地方都是寸土寸金,如果能夠將版圖裡面的空餘地方都利用起來,必然有助於提升性能。

第三,是時鐘優化,傳統設計方法是時鐘相位離散性越小越好,但是在全定製裡面卻是反過來的,所有的計算單元不要再同一個時間工作,要按照一定的規劃,錯峰執行,這樣的話在功耗和速度方面會有很大的好處。

最後是手動門級網表,傳統的芯片設計是邏輯設計和物理設計分開做,寫代碼的人不知道單元庫是什麼東西,不知道長什麼樣,不知道自己的作品是什麼樣的。工程師也不知道這個功能怎麼一回事,中間有很大的隔閡。而全定製設計在這方面則是需要前後端耦合一起設計的。即在寫代碼的時候要求你必須要知道你所寫的器件的面積、功耗,速度,是不是唯一的,如果不是唯一的,要問一下有沒有更好的選擇。在設計一個庫的時候,你需要知道你跟誰連,線有多長,它的速度是多少,它的功耗多少,會不會不平衡。

這個事情很多人會覺得比較瘋狂,因為在芯片裡面,幾千萬個器件的情況下,用手動去布效率將會非常低下。但是比特微還是這樣幹了。

“有一些時候,不可能的事情它其實是有可能的,我們做了一個手動的佈局,用自己的庫手動寫門級網表,手動佈局,這就是全定製設計。”在8月31日的2018第二屆集微半導體峰會上,楊作興針對其“全定製方法學”解釋稱:“當然,我們並不是真的所有的都是一個個手動去佈局,一些對性能影響很小的接口邏輯也可以自動佈局。一般芯片的器件面積利用率能做到50%-70%,我們一般是做到50%-70%的手動,在我們全定製裡面最好的記錄是能做到97%。同時我們有一些自己的設計腳本,我們也在慢慢做自己的設計工具來加速這個過程。”

實際上,用通俗易懂的話來說,全定製方法學就是根據芯片的具體應用領域和需求,在各方面都進行定製化的設計,使得芯片內部的每一個晶體管都能夠發揮出最優的效果。

那麼,同樣一個芯片,採用全定製方法學的設計週期,相比傳統採用EDA軟件設計的週期大概要差多久呢?

楊作興表示:“對於小芯片是差不多的,基本上3-6個月就可以完成,如果沒有做過的話大概需要6個月,對於比較大和複雜的CPU、AI芯片會慢一些,這需要一個積累過程。一個是IP積累,以前沒有這塊的IP,未來把這些編碼、簡碼積累起來;第二是會全定製方法的人很少,不是自己看個書就可以,要師傅帶徒弟,不能像以前看一下書就好了。這塊人才的積累更是需要時間的。”

初入礦機芯片江湖,“全定製方法學”大放異彩

時間撥回到2011年,當時還在清華工程物理系讀博的楊作興開始接觸全定製方法學,並且實驗性的做了一款主頻900MHz的RFID TAG芯片,它有一個重要的特點,是無源的,所有的電能來自電磁波,從空中吸收電磁波,雖然這並不是全定製設計,只是採用手動門級網表,把幾千門的邏輯手動地寫了一下,但是效果非常不錯,功耗優化了五倍,功耗×面積優化比例達到了11倍。經此一役之後,堅定了楊作興採用全定製方法學來設計芯片的決心。

摩爾定律的新動力:礦機芯片江湖背後的“全定製方法學”


2013年基於定製型ASIC芯片的比特幣礦機市場開始興起。2013年2月,比特幣礦機領域傳奇人物“烤貓”——蔣信宇成立的深圳比特泉信息科技有限公司推出了第一代比特幣礦機芯片和礦機,並很快獲得了成功。

2014年中,楊作興進入礦機芯片設計領域,加盟了比特泉公司,希望通過自己“全定製的方法學”來幫助“烤貓”優化其第三代礦機芯片BE300的能效比。

因為對於礦機芯片來說,除了礦機硬件之外,最大的成本就是電費成本,所以單位算力下的能耗是礦機芯片極為關鍵的指標。

很快,楊作興利用全定製方法完成了自己針對BE300的優化設計,但是隨後發生的事情卻讓楊作興始料未及——“烤貓”失蹤了,比特泉公司解散了。這也使得基於楊作興全定製方法學設計的優化版的BE300沒能流片。

面對自己的心血付諸東流,楊作興非常的不甘。2015年楊作興帶著其“全定製方法學”與比特大陸技術負責人詹克團進行了交流,並很快以兼職的工作形式幫助比特大陸研發了螞蟻S7礦機的芯片——基於28nm工藝的BM1385。

摩爾定律的新動力:礦機芯片江湖背後的“全定製方法學”


根據楊作興公佈的數據顯示,基於其全定製方法學設計的28nm礦機芯片(即比特大陸S7礦機搭載的BM1385)與傳統APR方法設計的礦機芯片相比,功耗優化比例提升了1.71倍,成本優化比例提高了2.5倍,功耗×成本優化比例高達4.28倍。楊作興的全定製方法學第一次得到了成功驗證,隨著S7的大賣,成功幫助比特大陸在2015年開始一枝獨秀。

隨後,楊作興為了拿到比特大陸的融資來做自己感興趣的無源攝像頭芯片,再度幫助比特大陸設計了螞蟻S9礦機所採用的16nm的BM1387芯片,當BM1387流片成功後,楊作興希望全職加入比特大陸,結果遭到了拒絕。雙方於是便一拍兩散。

自立門戶,“神馬”問世

在8月31日集微半導體峰會之後的,楊作興接受芯智訊採訪時也透露,當時希望加入比特大陸,但是經過5輪談判,股份一直沒有談妥。無奈之下,楊作興選擇帶著自己的全定製方法學自立門戶,於2016年7月創立了深圳比特微電子科技有限公司,很快“神馬礦機”也橫空出世。

摩爾定律的新動力:礦機芯片江湖背後的“全定製方法學”


楊作興接受芯智訊採訪

2017年2月,楊作興研發的新的28nm礦機芯片BT1000成功投片,2017年3月,基於該礦機芯片的礦機——神馬M3正式量產。

從前面那張圖上的數據對比我們可以看到,得益於楊作興的全定製方法學設計,比特微電子推出的神馬M3相比同樣採用28nm工藝、同樣由其採用全定製方法學設計的螞蟻S7,在功耗×成本優化比例上,提升了近2.7倍。

今年5月,比特微電子的第二代16nm礦機芯片BT1800也正式投片,而基於這款芯片的神馬M10礦機也將於9月19日正式發佈。

摩爾定律的新動力:礦機芯片江湖背後的“全定製方法學”


根據楊作興公佈的數據(上圖)顯示,神馬M10與同樣由其採用全定製方法設計的礦機芯片比特大陸的螞蟻S9相比,功耗×成本優化比提升了超過2.5倍。

楊作興表示:“神馬M10將是目前市面上最好的比特幣礦機!”

比特微的“起”與比特大陸的“落”

在比特幣價格持續低迷的當下,單位算力功耗更低、硬件成本也更低的礦機產品的價值將更加凸顯,自然也成為了礦工們繼續“生存”的首選。

因此,我們也看到,去年全年銷售額只有5億的神馬礦機,今年上班半年銷售額就已經猛增到了近十幾億,全年銷售額預計突破30億元,相比去年暴漲了600%。

值得注意的是,在楊作興與比特大陸分手之後,比特大陸除了有推出基於S1387進行改進的螞蟻S9i礦機外,到目前為止仍未推出新的礦機芯片和新的礦機。而之前處於研發當中的比特大陸16nm BM1X89芯片、12nm BM1X90芯片、10nm BM1X93芯片設計都似乎以失敗告終,即便比特大陸的7nm的礦機芯片獲得了成功,但是在此之前,其主要競爭對手嘉楠耘智已搶先推出了7nm礦機芯片和礦機。這也使得比特大陸進一步丟失了競爭優勢。

更為要命的是,比特大陸的萊特幣礦機L3、以太坊礦機D3、Zcash Z9等技術指標也被競爭對手所超越。而去年比特大陸推出的全新AI芯片Sophon BM1682在能效比上也遠低於競爭對手。

摩爾定律的新動力:礦機芯片江湖背後的“全定製方法學”


從上面的財報數據也可也看到,今年一季度的時候,比特大陸的S9、L3、D3礦機都出現了毛利率的大幅下滑。雖然今年一季度S9的銷售數據還不錯,但是,因為此前比特幣市場火爆,導致比特大陸的礦機銷售大都是全額預售,大部分在2018年Q1記錄的收入實際上是來自2017年Q4的訂單。 而隨著今年以來,比特幣價格的暴跌,比特大陸螞蟻礦機價格大幅下滑,礦機銷量也出現了暴跌。據自媒體陶石資本研究表示,“比特大陸2018年Q1起碼有10億美金的收入來自於2017年,2018年的真實銷售最多11億美金左右,環比下滑65%以上”。

那麼為何比特大陸在與楊作興合作了兩款芯片之後,仍未掌握“全定製方法學”,成功推出新一代的基於全定製設計的礦機芯片呢?

對此,楊作興解釋稱:“之前的芯片都是我自己做的。全定製方法學,對設計人員的要求很高,需要一流設計工程師,經過項目磨鍊後,才能夠掌握。在做的過程中,其實有一種說法比較好,叫做極致,其實就像喬布斯一樣,要做到極致和變態,把每個細節都做到極致。可以說全世界目前能夠完全掌握全定製方法學的不超過10個人。我們公司大概有1.7個,有一個(楊作興自己),有半個,還有一個算是三分之一個。”

一邊是神馬礦機的異軍突起,一邊是比特大陸的沉寂。而這一切的變數的關鍵卻都是因為楊作興和他的全定製方法學。而這個年輕人,改變的不止是礦機芯片市場,或許還將影響整個半導體芯片行業的未來。在8月底的2018第二屆集微半導體峰會上,楊作興還信心滿滿的表示:“全定製方法學將完全能夠繼續推動摩爾定律前行5-10年。”

“全定製方法學”將成“摩爾定律”前行新動力?


早在20世紀70年代,英特爾公司創始人之一戈登·摩爾就提出著名的“摩爾定律”,即“當價格不變時,集成電路上可容納的晶體管的數目,約每隔18-24個月便會增加一倍”。與此同時,計算機性能通常也將提升一倍。

自摩爾定律提出之後的幾十年,整個半導體產業也確實按著摩爾定律在持續快速的前進,但是自28nm之後,摩爾定律便開始呈放緩態勢,其所帶來的經濟效益也開始降低。

2014年上半年,英特爾的14nm工藝才正式發佈(二季度末才量產),而此時,距其22nm發佈的時間,已經過了近2年半。一直在奮力推動摩爾定律的英特爾首次出現了時間點上的推遲。隨後英特爾從14nm走向10nm的過程中,再度遇到了困難,量產時間一拖再拖,預計2019年才能正式量產。

雖然今年上半年臺積電的7nm工藝已經量產,但是臺積電的7nm工藝實際上與英特爾的10nm工藝相近。而接下來的5nm、3nm甚至是1nm,或許仍然還有路可以走,但是這毫無疑問將會更加的困難。

而更為令人悲觀的是,雖然隨著工藝的提升,晶體管密度還可以進一步增加,但是能夠帶來的性能提升或功耗的降低卻越來越少。比如從28nm到16nm,面積縮小了40%,速度提高了30%-40%,但是如果選擇提升速度,那麼功耗就沒法降低多少。而在28nm之前,每一代製程工藝的升級,功耗都能夠降一半多,面積降一半多,速度提升一倍多。但現在,這樣的好事情已經一去不復返了。

除此之外,隨著工藝製程從10nm向5nm、3nm、1nm的繼續演進,所需要付出的代價也更具高昂。摩爾定律所帶來的經濟效益可能也將會不復存在。

摩爾定律的新動力:礦機芯片江湖背後的“全定製方法學”


此前,國外Semiengingeering網站曾發佈過一篇工藝和芯片開發費用的文章。文中指出28nm節點的芯片開發成本為5130萬美元;16nm節點則需要1億美元;7nm節點需要2.97億美元;5nm節點,開發芯片的費用將達到5.42億美元;由於3nm還處於最初期的開發階段,所以其開發成本至今還難以確定,3nm的開發費用有可能超過10億美元。此外,晶圓廠建設同樣需要大量的現金支持,這將進一步拉高芯片的製造成本。

摩爾定律的新動力:礦機芯片江湖背後的“全定製方法學”


顯然,隨著製程工藝的不斷逼近物理極限,芯片開發成本也急劇增長,如果芯片廠商沒有足夠的實力,芯片出貨沒有足夠的出貨量,將很難承擔高昂的成本。

在“摩爾定律”的推進越來越困難,甚至“摩爾定律已死”的說法越來越被外界所認可的當下,包括英特爾在內的眾多半導體企業和專業也紛紛寄希望於“架構創新”來實現“超越摩爾”。

而所謂的“架構創新”此前芯智訊在《聯電/格芯相繼放棄7nm,後摩爾時代如何超越摩爾?》一文當中就指出,主要有以下三個方面:1、芯片工藝由原來的2D轉向2.5D/3D堆疊;2、內核架構上的創新,比如採用非馮·諾伊曼系統架構。主要包括ASIC(寒武紀1A、谷歌TPU等)、FPGA和部分新型GPU(Nvidia的Tesla系列等),以及類腦芯片(IBM的TrueNorth、英特爾的Loihi等);3、異構的SoC片上系統。

而楊作興提出的“全定製方法學”則似乎成為了以上三種方式之外的一種全新的“架構創新”方向。

可以看到,由楊作興採用全定製方法學設計的S7、S9、神馬M3、神馬M10,每一代產品的推出,與同樣製程工藝的採用傳統APR方法設計的礦機芯片相比,在功耗×成本優化比例上,都提升了4倍以上。這遠超出了單純依靠先進製程工藝所帶來的提升。

而且全定製方法學並不僅僅適用於ASIC礦機芯片,也同樣適用於CPU、GPU和AI芯片。同樣,楊作興也希望將全定製方法學從比特幣礦機芯片領域,進一步擴展到其他芯片領域。楊作興表示:“全制定方法學,會先在虛擬貨幣和AI領域成為主要方法學,然後逐步擴展到手機、PC、服務器和IoT領域。全定製設計目前雖然是手動,但是也進入到模塊化的概念,只是跟以前模塊不一樣的地方,以前的模塊只有邏輯信息,沒有物理信息,現在除了邏輯信息,還有物理信息,這樣一層一層壘出來。”

“之前我們做芯片基本都是要依靠EDA軟件,但是以後的芯片設計可能更是要精雕細刻去做,每個細節都要恰到好處。未來設計芯片是要做藝術品!”在楊作興看來,全制定方法學帶來了芯片設計上的創新,將有望繼續推動摩爾定律前行5-10年。

“近幾十年以來,一直是我們的芯片代工廠,是他們帶動我們這個行業迅猛發展,但是他們現在累了,現在輪到我們做芯片設計的工程師為這個產業作貢獻的時候到了。在半導體產業遇到瓶頸的時候,我們設計師應該扛起這個大旗繼續前行。我認為這個裡面有很大的空間,這個空間能夠使摩爾定律再前行五年十年,我覺得是有希望的。”在楊作興在講臺上慷慨講完這段話之後,臺下的瑞芯微董事長勵民率先鼓起了掌。


分享到:


相關文章: