知識分享之Python——sklearn中K-means聚類算法輸出各個簇中包含的樣本數據
背景
日常我們開發(fā)時,我們會遇到各種各樣的奇奇怪怪的問題(踩坑o(╯□╰)o),這個常見問題系列就是我日常遇到的一些問題的記錄文章系列,這里整理匯總后分享給大家,讓其還在深坑中的小伙伴有繩索能爬出來。
同時在這里也歡迎大家把自己遇到的問題留言或私信給我,我看看其能否給大家解決。
開發(fā)環(huán)境
- 系統(tǒng):windows10
- 版本:Python3
內容
本節(jié)分享一個在sklearn中使用聚類算法時,比較常用的輸出工具,輸出各個簇中包含的樣本數據,以下是其具體的實現方式:
kmeans_model = KMeans(init="k-means++",n_clusters=t)
kmeans_model.fit(tf_matrix) # 訓練是t簇,指定數據源
# 輸出各個簇中包含的樣本數據
labels = kmeans_model.predict(tf_matrix)
clusters = {}
n = 0
for item in labels:
if item in clusters:
clusters[item].append(all_data[n])
else:
clusters[item] = [all_data[n]]
n +=1
for item in clusters:
print("輸出簇: ", item)
for i2 in clusters[item]:
print(i2)
本文聲明:

88x31.png
知識共享許可協(xié)議
本作品由 cn華少 采用 知識共享署名-非商業(yè)性使用 4.0 國際許可協(xié)議 進行許可。