在數發部數產署的支持下,工研院宣布成立台灣首座 AI 測試實驗室,協助國內廠商評估及改善語言模型,為產業界提供可信任性的測試與評估,確保 AI 語言模型輸出的結果,更加準確、穩定且可靠。
工研院表示,隨著生成式 AI 應用範圍不斷拓展,數位科技正在重新塑造人類的生活與商業模式,所以為了確保 AI 發展上的安全,並且提升民眾、企業對 AI 應用的信賴,因此選擇成立全新的 AI 測試實驗室,協助產業界客戶的語言模型變得更為安全且值得信任。
工研院指出,語言模型是自然語言處理(NLP)不可或缺的關鍵,更是現行 AI 應用理解文本、生成內容、語音辨識、情感分析的重要依據;語言模型會經由大規模文本學習,掌握語法、語意及上下文關聯性等語言特徵,進而產生類似人類的自然語言。
只不過,AI 模型卻可能因為數據偏差或失真,導致主動產生錯誤或不當資訊,甚至在處理敏感數據時,出現一定的資安風險;因此,即便生成式 AI 蓬勃發展,但使用者對於語言模型的開發和部署依然得謹慎小心,確保最終輸出結果準確、穩定且可靠。
參考國際標準,測試 AI 可靠性與資安
為了服務產業界對於 AI 驗證的需求,工研院與數產署參考國際可信賴 AI 的相關框架及標準,借助 AI 產品與系統評測中心(AIEC)專家及技術委員會,開發出可信任的語言模型評測工具。
工研院指出,成立台灣首座 AI 測試實驗室,將為業界廠商提供於準確性、公平性、可靠性、隱私及資安等領域,透過自動化方式進行語言模型測試的解決方案;未來 AI 測試實驗室將能協助國內廠商評估與改善語言模型,以確保語言模型及 AI 應用,並確保 AI 模型可以於不同場景下,皆保持穩定與可靠並滿足企業和使用者需求。
工研院量測技術發展中心執行長藍玉屏指出,針對 AI 模型進行可信任性的測試與評估十分重要,因此工研院才打造出,針對語言模型提供評測工具開發和導入的 AI 測試實驗室,同時也會參考國際及國內專家審議的測試題庫,評估送測 AI 模型生成內容的可信任性,促進企業在應用 AI 技術時更具信心。
工研院擘畫 2035 技術策略與藍圖
此外,為了強化國際交流合作,工研院也同時與法國國家計量院(LNE)簽署合作協議,針對 AI 進行國際合作與技術交流,希望助力台灣 AI 評測技術接軌國際。
日前工研院擘畫出台灣「2035 技術策略與藍圖」,以發展「人工智慧與資安」、「半導體晶片」、「通訊」、「智慧感測」等 4 大智慧化致能技術,協助我國各產業在 AI 領域持續發展,並且推動技術創新。
工研院指出,成立 AI 測試實驗室將成為「2035 技術策略與藍圖」的重要支柱,透過嚴謹的測試與評估,為台灣 AI 技術發展提供穩固基石,推動本土科技向更高層次邁進。