基于條件對抗生成網絡的對抗樣本防御方法
【摘要】:人工智能目前在諸多領域均得到較好應用,然而通過對抗樣本會使神經網絡模型輸出錯誤的分類。研究提升神經網絡模型魯棒性的同時如何兼顧算法運行效率,對于深度學習在現實中的落地使用意義重大。針對上述問題,本文提出一種基于條件對抗生成網絡的對抗樣本防御方法 Defense-CGAN。首先使用對抗生成網絡生成器根據輸入噪聲與標簽信息生成重構圖像,然后計算重構前后圖像均方誤差,對比選取重構圖像饋送到分類器進行分類從而去除對抗性擾動,實現對抗樣本防御,最后,在MNIST數據集上進行大量實驗。實驗結果表明本文提出的防御方法更加具備通用性,能夠防御多種對抗攻擊,且時間消耗低,可應用于對時間要求極其苛刻的實際場景中。