基于動態雙子種群的差分進化K中心點聚類算法
【摘要】:隨著海量大數據的出現,聚類算法需要新型計算模式來提高計算速度與運行效率。本文提出一種基于動態雙子種群的差分進化K中心點聚類算法DGP-DE-K-mediods(Dynamic Gemini Population based DE-K-mediods)。DGP-DE-K-mediods利用動態雙子種群方法,解決聚類算法在維持種群密度的時候避免陷入局部最優的問題;采用差分進化(Differential Evolution,DE)算法來提高全局最優能力的強健性;基于Hadoop云平臺來并行處理DGP-DE-K-mediods,加快算法的運行速度和效率;描述基于MapReduce的并行聚類算法的編程過程; DGP-DE-K-mediods利用UIC的大數據分類的案例數據和網絡入侵檢測這種大數據應用來仿真算法的效果。實驗結果表明,與已有的聚類算法相比,DGP-DE-K-mediods在檢測精度、運行時間上有明顯的優勢。