產經情報

簡單的AI模型不需要深度學習

日期:2023-10-18

芬蘭于韋斯屈萊大學(University of Jyväskylä)的研究人員利用18世紀的數學,簡化了人工智慧(AI)中最普遍使用的技術——深度學習(deep learning)。他們還發現,50年前的經典訓練演算法比近來流行的技術效果更好。這種更簡單的方法推進了綠色資訊技術(IT)的發展,而且更易於使用和理解。

AI最近的成功主要基於一項核心技術的使用:深度學習。深度學習是指AI技術利用大量資料集和運算資源訓練具有大量資料處理層的網路。

深度學習使電腦能夠執行複雜的任務,如分析和生成影像和音樂、玩數位遊戲,以及最近與ChatGPT和其他生成式AI技術相關的任務。

University of Jyväskylä教授Tommi Kärkkäinen和博士研究生Jan Hänninen從六年前起對資料精簡進行了初步研究。其研究結果令人驚訝:如果以新穎的方式組合簡單的網路結構,就不需要進行深度學習。使用淺層模型可以獲得類似甚至更好的結果。

「深度學習技術的使用是一項複雜且容易出錯的工作,由此產生的模型難以維護和解釋。」Kärkkäinen說:「我們的新模型在淺層形式上更具表現力,能夠可靠地減少大型資料集,同時保留其中的所有必要資訊。」

新的AI技術結構可以追溯到18世紀的數學。Kärkkäinen和Hänninen還發現,相較於深度學習中所使用的21世紀技術,1970年代傳統最佳化方法在準備其模型時的效果更好。


詳細內文請參考網址...