知識分享

可提升分類正確率的基於特徵空間圖資訊的集群間距調整方法

建立日期:2020/11/09
  • 作者: 輔仁大學統計系/邵皓強、邱韵瓴
  • 出處: 2020 AOI論壇與展覽
  • 內容: 本篇為「2020 AOI論壇與展覽」論文集,摘要如下:

    本真實世界中的資料集大多類別分布不平衡,若無法解決此問題模型的預測結果往往會偏向多數類別,因此少數類別的預測準確性就會降低。過去常見的處理方法多為採用重抽樣或是加權法,然而上採樣容易出現過擬合的風險,下採樣剔除部分資料導致模型只能學習到部分特徵;加權法雖然無此弊端,但是最大的難點在於如何合理設置權重,算法實現成本高。

    本研究嘗試透過重新聚類樣本特徵並調整特徵域中類別和群別的邊距來解決此問題。為了實現此目標,本研究方法分為三階段,首先利用預訓練的卷積神經網路提取資料集的樣本特徵;其次,本研究近似出特徵流行的圖結構、並在資料特徵的分布流型上重新計算特徵的聚類狀況;最後藉由一個 LeNet 等級的小網路和損失函數微調特徵分布以提升分類正確率。

    實驗表明,本研究方法可以成功調整類別及群別的邊距,並且能夠重新聚類特徵分布。由實驗結果得知,本研究方法在自動光學檢查資料集上可以達到 99.21085% 的正確率,而經由預訓練模型的正確率僅達 99.81540084%,證明本研究調整特徵的策略確實可以提升分類正確率。
  • 檔案下載:全文下載
  • 下載次數:31