模糊聚類

維基百科,自由的百科全書

硬聚類(hard clustering)是指把數據點劃分到確切的某一聚類中,如K-均值聚類。而模糊聚類(Fuzzy clustering,亦稱軟聚類,Soft clustering)中,數據點則可能歸屬於不止一個聚類中。這些聚類與數據點通過一個成員水平(實際上類似於模糊集合中隸屬度的概念)聯繫起來。成員水平顯示了數據點與某一聚類之間的聯繫有多強。模糊聚類就是計算這些成員水平,按照成員水平來決定數據點屬於哪一個或哪些聚類的過程。

模糊C-均值算法(FCM)是應用最為廣泛的模糊聚類算法之一。詳見模糊C-均值算法

與硬聚類的對比[編輯]

非模糊聚類(硬聚類)會將數據分到不同類別中,即每個數據僅屬於一個確定的類別。模糊聚類會將數據點分到多個可能的類別中。例如,一個蘋果可以是紅的綠的(硬聚類);一個蘋果可以是紅的綠的(模糊聚類)。這個蘋果可能是某種程度的紅同時另一種程度的綠。與蘋果是綠的而非紅的(green=1,red=0)相比,蘋果可以既綠又紅(green=0.5,red=0.5)。這些值被歸一化到0-1之間,但它們並非概率,因此並不需要相加為1。