

成都康喬電子攻關核心技術基于密度半徑的改進K-means聚類算法
康喬電子攻關技術涉及聚類算法領域,公開了一種基于密度半徑的改進K means聚類算法,解決現有K means聚類算法存在的局部最優解、對噪聲和離群點比較敏感、k值選取不準確問題。本發明首先按照密度半徑對所有樣本點進行排序,選取密度半徑最大的樣本點作為初始值,重復前述述步驟,選出所有的初始點以及類別數量k,并開始聚類操作;從聚類后的類別質心中選出距離最近的兩個質心,將這兩個質心所在的類別單獨拿出來看成一個二分類,并計算其二分類的貝葉斯得分,然后將這個兩個類別合并為一個類別,并計算合并后的貝葉斯得分,再根據得分判斷是否需要合并這兩個類別,重復前述步驟直到不用合并為止。本發明適用于大數據聚類處理。