下一代汽車晶片已在路上,要做到零缺陷有多難?

通向零缺陷的道路上需要一些新的策略。

用於輔助駕駛和自主駕駛系統的下一代汽車芯片這波浪潮正在推動關鍵性的異常檢測新方法的開發進程。

KLA-Tencor、Optimal+以及西門子子公司的Mentor正在進入或擴大在異常檢測市場或相關領域的工作。異常檢測技術在各種行業已經使用多年,是實現芯片生產質量零缺陷的主要技術之一,零缺陷對汽車領域至關重要。

通常,異常檢測本身使用硬件和統計篩選算法來定位所謂的異常。簡單來講,芯片異常指的是芯片本身可能會通過各種標準測試,但是有時會表現出功能異常。這種芯片可能會影響系統性能或導致系統失效。

下一代汽車芯片已在路上,要做到零缺陷有多難?

圖1 PAT極限和極限值圖形顯示

異常芯片或帶缺陷芯片的出現有若干原因,其中包括出現潛在性的可靠性缺陷。這一類缺陷在芯片出貨時不會被發現,但它們會在應用現場以某種方式激活,最終可能會反應在實際運行的系統中。

為了幫助捕捉芯片中這樣或那樣的問題,業界通常使用各種異常檢測方法,例如零件平均測試法(PAT)。在PAT中,首先對晶圓進行電氣測試,然後,組合使用硬件方法和PAT算法,檢測出違反特定測試規範的異常或故障芯片,然後把它丟掉。

但是,PAT方法很難滿足汽車行業的苛刻要求。Optimal+公司首席技術官Michael Schuldenfrei表示:“汽車和其他類型的任務關鍵型設備的半導體產品使用量正在呈指數級增長。這種趨勢推升了對芯片質量和可靠性的要求。使用PAT或零件平均值測試方法的異常檢測技術作為保證質量和可靠性的一個主要手段,已經存在了幾十年。但在很多情況下,它們並不是非常有效,或者在防止漏檢方面測試成本過高。”

漏檢指的是芯片通過了測試離開了晶圓廠。為了避免這種情況的發生,多年來,異常檢測專家們開發出了新的更先進的技術來防止芯片漏檢和其它問題。比如,異常檢測通常是在芯片封裝測試階段進行,但是在一個新的方案中,KLA-Tencor開發了一種用於在晶圓廠中測試的技術。

儘管如此,這個行業目前仍然面臨一系列重大挑戰,其中包括:

1、隨著更多先進芯片被用於汽車中,迫切需要新的先進的異常檢測算法;

2、異常檢測技術必須緊跟輔助駕駛和自動駕駛技術的發展趨勢;

3、英偉達和其它沒有異常檢測經驗的IC製造商正在蜂擁進入汽車市場,這意味著他們需要提高學習曲線。

這個飛速增長的汽車半導體市場還面臨許多其它挑戰。除了汽車市場,異常檢測也應用在醫療和其它領域中。根據西門子子公司Mentor的說法,總體而言,商業性的異常檢測軟件業務的規模在每年2500萬美元到5000萬美元之間。Mentor Quantix事業部總經理Bertrand Renaud表示:“這個數字可能僅代表實際軟件的三分之一,因為許多大型IDM廠商已經構建了自己的專有工具,他們的軟件沒有統計在內。”目前,這個市場上的選手有KLA-Tencor、Mentor、Optimal+和yieldWerx等公司。

汽車芯片趨勢

2018年,汽車市場增速可能會放緩。根據IHS Markit的數據,2018年輕量級汽車的全球總銷量預計將達到9590萬輛,同比2017年增長1.5%。根據該公司的數據,2017年同比2016年增長了2.4%。

汽車銷量的增長如何對應於汽車半導體市場增速目前尚不完全清楚。儘管目前汽車芯片業務僅佔整個半導體市場規模的10%左右,但這並不能說明問題的全貌,因為根據IHS Markit的數據,每輛汽車的電子器件的價值將從2013年的312美元增長到2022年的460美元,年複合增長率為7.1%。

“從十年前的幾百個控制器和其他類型電子器件開始,現代的汽車中可能包含超過3,500個半導體產品,這些半導體器件的總體成本正在持續上升。”KLA-Tencor高級營銷總監Rob Cappel在一篇博客中說道。

一輛高級汽車擁有超過7000顆芯片。芯片廠商正在向高端車型中引入14nm和10nm器件,同時也正在研發用在汽車上的7nm芯片。

但是,在汽車領域,有兩個因素是亙古不變的 - 可靠性和質量。對於商用芯片而言,消費者對缺陷尚有一定的容忍度。但是,汽車芯片對缺陷和故障是不存在絲毫容忍度的。

這倒不是什麼新鮮事兒。“比如ABS系統,”TEL的高級技術合夥人Ben Rathsack說。 “由於事關安全,汽車的可靠性要求總是較高。”

因此,汽車芯片製造商和代工廠必須遵守各種質量標準,例如AEC-Q100,這項標準主要涉及芯片的失效機理壓力測試。

高級駕駛輔助系統(ADAS)和自主駕駛汽車對可靠性的要求更加嚴苛。ADAS涉及汽車中的各種安全功能,如自動緊急制動、車道檢測和後方物體警告。

例如,全球最大的汽車芯片製造商恩智浦最近宣佈推出了一款用於汽車應用的高分辨率雷達芯片。該芯片被稱為MR3003雷達收發器,是一款77GHz雷達器件。該器件基於硅鍺(SiGe)工藝,適用於需要高分辨率和遠距離功能的自動駕駛系統的前端或轉角雷達應用。

這種雷達技術能夠同時跟蹤數千個目標,能夠實時感測周圍環境,這正是L4/L5級別的自動駕駛所必需的。“這些類型的應用對我們和芯片本身都提出了較高的要求。我們非常謹慎地設計了系統內部的安全協議和一系列Hook,以便傳感器和汽車能夠在某些情況下進行自我診斷,”恩智浦ADAS調制解調器產品線副總裁兼總經理Patrick Morgan在最近的一次採訪中表示。“當我們開始銷售這些芯片時,我們需要付出很大的努力來保證每個芯片符合規格。我們對缺陷絕對抱有一種零容忍的心態。安全攸關,不容任何錯誤的出現。”

恩智浦半導體ADAS技術副總裁兼總經理Kamal Khouri補充說:“我們在這裡所做的一切都必須滿足非常非常嚴格的汽車安全性和可靠性標準。為了確保我們推薦的所有產品和方案都安全可靠,需要做大量的工作。”

安全確實非常關鍵。例如,根據Optimal+提供的數據,奧迪的高檔汽車中擁有7,000個芯片。假設,每個芯片的故障率都達到百萬分之一,那麼奧迪每生產1000輛汽車就會有7個故障車。如果奧迪每天製造4,000輛汽車,這就意味著,它每個小時都會生產出一臺故障車。

因此,汽車行業正在努力實現零缺陷和其他質量計劃,但是隨著系統、芯片甚至軟件變得越來越複雜,這個目標很難實現。

在其最新的車輛可靠性研究工作中,J.D. Power對過去12個月2015年款車型和2017年款車型每100輛車遇到的問題數量進行了統計調查,結果發現,2017年款汽車整體可靠性提高了9%,但是各種電子系統依然存在問題。據調查,音頻/通訊/娛樂/導航系統仍然是業主遇到麻煩最多的產品類別,業主的投訴數量也最多,其中,內置語音識別和藍牙連接是最大的問題。

這些問題可能與採用最新的半導體器件有關,這就是為什麼異常檢測至關重要的原因所在。在異常檢測中,在晶圓廠處理完晶圓後,首先進行一些電氣測試,然後把它們送到測試部門進行評估。

這種方法只能解決一部分潛在的問題。“你不可能測試器件的每一條執行路徑,因此不可能覆蓋完整的場景。不過,現在可以運行許多不同的測試。有時候,測試結果也不是很明確。我們只是知道,目前的方法還不夠好。”KLA-Tencor戰略合作高級主管Jay Rathert說。

另外,測試可能會發現,也可能不會發現可怕的潛在可靠性缺陷。“潛在的可靠性缺陷是指離開了晶圓廠才暴露出來的缺陷,它們在某種程度上是通過環境激活的,包括振動、溼度、電流、電遷移或者熱量。隨著時間的推移,它們可能暴露出來。”Rathert說。

下一代汽車芯片已在路上,要做到零缺陷有多難?

圖2 隨機缺陷

既然這樣,那麼,為什麼不在這些芯片離開晶圓廠之前就檢測出來這些缺陷呢?

在晶圓廠測試

根據加州大學伯克利分校的統計,理論上來講,一個月產5萬片晶圓的晶圓廠需要以下設備:

50臺掃描儀/步進器和晶圓軌道;

10個高電流離子注入器和8箇中等電流離子注入器;

40臺蝕刻機;

30個CVD工具。

此外,300毫米晶圓廠也是自動化工廠,使用各種自動化材料處理系統和晶圓傳輸機制,使用各種設備分步驟地在晶圓廠中處理晶圓。一個先進工藝的晶圓製造過程可能有多達600-1000個步驟,甚至更多,相比之下,成熟工藝的步驟更少。

在先進工藝節點中,半導體設備必須處理更小且更加精確的特徵,隨著工藝尺寸的縮減,缺陷也變得越來越難找到。

每種應用都有各自不同的缺陷要求。一般來說,面向消費者的OEM廠商對缺陷的控制要求不是太嚴格,但是,在汽車領域,芯片製造商們必須在其器件的製造工藝中實施更加嚴苛的控制措施,並部署持續的缺陷改進計劃。

“有一些先決條件(在汽車領域),”聯電副總裁溫文婷說。“你必須有一個管理良好的工廠和維護良好的工具。 最重要的是,您需要一個強大的質量體系,並貫徹高質量的理念,這將使您能夠獲得製造汽車產品所需的認證。這些很複雜。在汽車行業裡,質量控制始於工藝設計和工廠規劃,並一直延伸到實際生產芯片的時候。”

在晶圓廠中,人們使用檢測系統定位晶圓缺陷。一般來講,芯片製造商不會檢查每一片晶圓,因為那樣需要很長時間,而且成本高昂,他們會抽樣檢測某些晶圓或者部分芯片。

對於消費級芯片來說,這個過程很簡單。“當我們開發一項技術時,我們會認證它,通常來講,抽樣的樣本數量總是有限的。”溫文婷說。

汽車級芯片要求就不同了。“你必須測試大量的樣本才能得出故障率,這個過程的成本非常高。”她說。“人們正在考慮如何在成本可承受的程度下實現這一目標,每個方面都有很多挑戰。”

所有這些都是實打實的時間和真金白銀。如果芯片在經過檢測和其它過程之後符合規範,就可以把晶圓從晶圓廠發給封測廠了。

這時候,壓力就轉到封測廠了。為了幫助測試,KLA-Tencor設計了一種技術方案來捕捉晶圓廠中的問題。該技術被稱為在線零件平均測試(I-PAT),它利用了PAT的概念。但是,與在測試部門進行的PAT及其變體不同,I-PAT在晶圓廠中執行。

I-PAT不一定會與傳統的第三方異常檢測供應商競爭。它的目標是提供更多的測試數據,補充既有的測試組合。通常來講,您仍然需要執行傳統的異常檢測。

KLA-Tencor的技術涉及硬件和數據分析軟件包。簡而言之,先把檢驗數據輸入到計算機建模程序中,然後分解數據,並查看晶圓圖上的硅片,然後在晶圓廠的多個檢查步驟中查找異常缺陷。

在一個簡單的例子中,該技術將顯示具有五個層的芯片的晶圓圖,比如有源區、柵極、觸點層、金屬層1和金屬層2。假設金屬層1上可能會有800個缺陷。計算機從晶圓上隨機選擇10個芯片,然後,使用各種I-PAT算法,系統最終確定這10個芯片中有9個存在潛在的可靠性缺陷。

這個過程可以重複好幾遍。 “你可以一遍又一遍重複這個步驟,”KLA-Tencor高級營銷總監David Price說。 “通過一遍又一遍地重複,你可以看到缺陷的統計性質如何幫助你找到最有可能包含可靠性缺陷的芯片。”

I-PAT可用於挑選有問題的硅片。 另外,這些數據可以與其他異常檢測方法結合使用,以改進測試通過/不通過的決策。Price說:“通過在晶圓廠中實施I-PAT技術,你將能夠減少傳統PAT方法所帶來的矯枉過正和不足之處。”

從晶圓廠到測試廠

晶圓從晶圓廠移動到測試部門後,在那裡進行晶圓分類、最終測試,有時也會進行系統級測試。

檢查和測試會產生巨大的數據量。但是,在這些數據面前,您如何知道器件是否仍存在潛在的可靠性缺陷或其他問題呢?

這就是為什麼汽車OEM廠商希望他們的供應商在測試過程中執行傳統異常檢測的原因。Mentor公司的Renaud說:“

在整個晶圓經過測試之後,在晶圓分類中進行的PAT分揀,是在服務器上作為離線處理完成的。對每個部分進行測試後,最終測試中的PAT分揀是在測試儀上在線執行的,當然,整個流程都是由服務器管理並控制的。”

通常,異常檢測技術從晶圓廠得到電子數據,然後分析數據。KLA-Tencor的新技術將向測試混合提供更多數據。“我們能夠從KLA等公司的機器中收集檢測數據,”Optimal+的Schuldenfrei說。“將所有這些數據結合在一起使用,顯然會進一步提高檢測的準確度。”

PAT是最基本的邊界檢測形式,應該可以檢測出一個超出不合格閾值的芯片。測試閾值可以設置為靜態(SPAT)或動態(DPAT)模式。

在SPAT中,測試閾值是基於該批次的數量決定的,在DPAT中,則會在每次晶圓測試時計算閾值。在SPAT和DPAT中,都會執行一個算法,最終得出測試通過或失敗的結果。

但是,這些算法可能在某些情況下會失敗。有的器件的特徵可能和其它器件明顯不同,但是它也在規範範圍內。有的器件可能是遠離正態分佈的極端異常。“這種情況可能會嚴重影響整個特徵分佈,然後,你可能會漏掉接近特徵分佈中心的異常。”Optimal+的Schuldenfrei說。

異常檢測專家已經加入了一些程序來解決這些問題。但是,多年來,這些芯片變得越來越複雜,因此需要更先進的異常檢測技術。“客戶要求越來越複雜的算法來識別真正的異常,而不會造成不必要的產能損失,”Mentor的Renaud說。“需要先進的自動形狀檢測來識別非高斯分佈。”

有一些基於幾何分佈、多變量和其它方案的複雜異常檢測算法,許多算法甚至可以和DPAT和SPAT結合一起使用。

一種先進類型的幾何分佈PAT(GPAT)可以根據它的幾何分佈鄰近度來查看芯片質量。

GPAT有一個複雜版本,被稱為好芯片/壞鄰居(GDBN)。GDBN基於這樣一種理念,缺陷總是趨向於集中出現在晶圓的某些特定位置上。簡單來說,缺陷較多的區域可能會找出一些壞芯片。

還有一種被稱為最差鄰居殘差(NNR)的技術。“最近鄰居殘差技術是在每個芯片的每次測試中檢查所有值,它不僅考慮整體晶圓,還考慮臨近芯片的情況。”Optimal+的Schuldenfrei說。

還有一些其他方法,如多變量技術。“地理空間算法檢查晶圓上的失效模式,以確定掩模版缺陷和失效芯片的集群。同時,多變量算法測量多次測試之間的相關性,而不是一次只考慮一個測試結果,”Mentor的Renaud說。

所有這些方法都可以結合使用。

下一步

展望未來,ADAS和自主駕駛將進一步推動對更多檢測技術的需求。Optimal+的Schuldenfrei表示:“隨著汽車的自主化程度越來越高,芯片缺陷檢測也將變得越來越重要。”

此外,這些檢測技術也會加入人工智能和機器學習。“隨著機器學習和人工智能帶來新的運算能力和功能,我們相信,它們也會更多地參與到異常檢測中來。”Schuldenfrei說。

最後,把所有的數據集成在一起也許是最大的挑戰。“想象一下,從芯片獲取數據,並將其與多個不同公司的電路板數據關聯起來,”他說。“您需要共享數據才能實現更好的異常檢測。”


分享到:


相關文章: