產經情報

製程越進步,bug 卻越難預測!AI 如何解決先進晶片製程的衍生問題?

日期:2021-07-07

先進製程將晶片逼近極限,導致失效難以預測


雖然晶片在絕大多數的情況下是可靠的,但晶片運算錯誤並不罕見,只不過產業界也開發工具來識別、處理這類錯誤。然而根據 Google 工程師 Peter Hochschild 近期發表的,名為《Cores that don’t count》的 論文 ,隨著電晶體的縮小並逼近 CMOS 的極限,再加上晶片架構的複雜性不斷增加,導致現有的工具無法識別晶片的錯誤運算。

Facebook 也在今年 2 月發表一篇名為《Silent Data Corruption at Scale》的 論文 ,指出晶片問題造成數據損壞,而且在數據中心觀察到的次數比以往更多。

為了處理晶片的錯誤問題,產業界正積極研究更先進的預測工具,例如嘗試導入 AI ,透過晶片結構來預測可能的錯誤。這是羅拉多大學波德分校的工程師進行的研究。

AI 能夠從原子尺度組件,預測電子元件可能發生的錯誤

在研究中,研究團隊繪製由原子組成的小型組件的物理圖,然後使用機器學習,來預測由這些組件建構而成的更大結構的物理特性。這很像是從一塊樂高來預測拼湊出來的城堡的強度。透過該技術,能夠從原子尺度的組件,來預測電子元件可能出現的錯誤,協助人們打造更可靠的電子設備。

研究團隊領導人 Sanghamitra Neogi 表示,該研究可以協助產業界在打造設備之前,就預測它會如何工作,而不是要過上好幾年,才會知道設備失效的原因。

Neogi 舉例,現在的電子設備都有缺陷,導致熱量在某些地方聚集,造成效率降低。這很像是在崎嶇的道路上騎腳踏車,速度會被路上的坑洞拖慢。在過去,工程師會使用模型或電腦模擬,但很難預測缺陷可能會出現的地方,因為模型僅能處理約 100 個原子的系統,但實際設備卻有數十億以上的原子。Neogi 說道,AI 能協助工程師提前確認電子元件設計的薄弱環節,設計出更可靠的產品。