偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<pre id="tg2lz"></pre>

<var id="tg2lz"><strong id="tg2lz"></strong></var>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

快速學(xué)會一個機器學(xué)習(xí)算法：層次聚類法

寶寶數(shù)模AI

發(fā)布于 2025-3-20 07:37

瀏覽

0收藏

在機器學(xué)習(xí)領(lǐng)域，聚類分析是一種重要的無監(jiān)督學(xué)習(xí)方法，廣泛應(yīng)用于數(shù)據(jù)挖掘、圖像處理、市場細分等多個領(lǐng)域。本文將深入探討層次聚類算法，包括其基本介紹、算法原理以及一個完整的案例分析，幫助讀者全面理解和掌握這一經(jīng)典的聚類方法。

一、算法介紹

1.1 什么是層次聚類

層次聚類（Hierarchical Clustering）是一種通過構(gòu)建層次結(jié)構(gòu)來組織數(shù)據(jù)的聚類方法。與其他聚類算法不同，層次聚類不需要預(yù)先指定簇的數(shù)量，而是通過構(gòu)建一個樹狀結(jié)構(gòu)（樹狀圖，Dendrogram）來展示數(shù)據(jù)的分層關(guān)系。層次聚類主要分為兩類：

凝聚層次聚類（Agglomerative Hierarchical Clustering）：自底向上，先將每個數(shù)據(jù)點視為一個單獨的簇，然后逐步合并最相似的簇，直到所有數(shù)據(jù)點合并為一個簇或達到預(yù)定的簇數(shù)量。
分裂層次聚類（Divisive Hierarchical Clustering）：自頂向下，先將所有數(shù)據(jù)點視為一個整體簇，然后逐步分裂成更小的簇，直到每個簇僅包含一個數(shù)據(jù)點或達到預(yù)定的簇數(shù)量。

二、算法原理

層次聚類的核心在于如何衡量簇與簇之間的相似性或距離，以及如何選擇合適的鏈接方法來決定簇的合并或分裂。以下將詳細介紹這些關(guān)鍵概念。

快速學(xué)會一個機器學(xué)習(xí)算法：層次聚類法-AI.x社區(qū)

2.3 算法流程

以凝聚層次聚類為例，其基本流程如下：

初始化：將每個數(shù)據(jù)點作為一個獨立的簇。
計算距離：計算所有簇之間的距離，根據(jù)選擇的鏈接方法確定簇間距離。
合并簇：找到距離最近的兩個簇，將它們合并為一個新的簇。
更新距離矩陣：更新新簇與其他簇之間的距離。
重復(fù)步驟3-4，直到所有數(shù)據(jù)點合并為一個簇，或達到預(yù)定的簇數(shù)量。

三、案例分析

為了更好地理解層次聚類的應(yīng)用，下面我們通過一個具體的案例進行分析。我們將使用Python中的??scikit-learn??庫生成模擬數(shù)據(jù)，并實現(xiàn)層次聚類算法。

3.1 生成模擬數(shù)據(jù)

我們將生成一個包含三簇數(shù)據(jù)的二維數(shù)據(jù)集，每個簇的數(shù)據(jù)點呈現(xiàn)高斯分布。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from scipy.cluster.hierarchy import dendrogram, linkage
from sklearn.cluster import AgglomerativeClustering

# 1. 生成模擬數(shù)據(jù)
X, y_true = make_blobs(n_samples=50, centers=1, cluster_std=0.60, random_state=0)

# 可視化數(shù)據(jù)
plt.figure(figsize=(8, 5))
plt.scatter(X[:, 0], X[:, 1], s=50, color='gray')
plt.title("模擬數(shù)據(jù)分布")
plt.xlabel("特征1")
plt.ylabel("特征2")
plt.show()

3.2 實現(xiàn)層次聚類

我們將使用??scipy???庫中的??linkage???和??dendrogram??函數(shù)來實現(xiàn)層次聚類，并使用不同的鏈接方法進行比較。

# 2. 構(gòu)建層次聚類模型
linked = linkage(X, method='ward')

# 3. 繪制樹狀圖
plt.figure(figsize=(10, 7))
dendrogram(linked,
           orientation='top',
           distance_sort='descending',
           show_leaf_counts=True)
plt.title("層次聚類樹狀圖（Ward法）")
plt.xlabel("樣本點索引")
plt.ylabel("距離")
plt.show()

3.3 確定簇的數(shù)量

通過觀察樹狀圖，我們可以選擇一個合適的距離閾值來確定簇的數(shù)量。我們選擇將數(shù)據(jù)分為3個簇。

# 4. 確定簇的數(shù)量并進行聚類
n_clusters = 3
cluster = AgglomerativeClustering(n_clusters=n_clusters, linkage='ward')  
cluster_labels = cluster.fit_predict(X)

# 5. 可視化聚類結(jié)果
plt.figure(figsize=(8, 5))
plt.scatter(X[:, 0], X[:, 1], c=cluster_labels, cmap='viridis', s=50)
plt.title(f"層次聚類結(jié)果（{n_clusters}個簇）")
plt.xlabel("特征1")
plt.ylabel("特征2")
plt.show()

3.5 運行結(jié)果

生成的模擬數(shù)據(jù)圖：

快速學(xué)會一個機器學(xué)習(xí)算法：層次聚類法-AI.x社區(qū)

層次聚類樹狀圖：

快速學(xué)會一個機器學(xué)習(xí)算法：層次聚類法-AI.x社區(qū)

層次聚類結(jié)果：

快速學(xué)會一個機器學(xué)習(xí)算法：層次聚類法-AI.x社區(qū)

通過上述代碼，我們生成了一個二維數(shù)據(jù)集，并使用層次聚類方法將其分為三個簇。樹狀圖清晰地展示了數(shù)據(jù)的分層結(jié)構(gòu)，選擇合適的距離閾值后，聚類結(jié)果與真實簇的分布高度吻合，驗證了層次聚類的有效性。

四、總結(jié)

層次聚類作為一種經(jīng)典的聚類方法，具有以下優(yōu)缺點：

優(yōu)點

無需預(yù)先指定簇的數(shù)量：通過樹狀圖可以靈活選擇簇的數(shù)量。
能夠發(fā)現(xiàn)數(shù)據(jù)的層次結(jié)構(gòu)：適用于需要多層次分析的數(shù)據(jù)。
適用于不同形狀的簇：尤其是在選擇合適的鏈接方法時。

缺點

計算復(fù)雜度高：對于大規(guī)模數(shù)據(jù)集，計算和存儲成本較高。
對噪聲和異常值敏感：可能會影響聚類結(jié)果的準(zhǔn)確性。
鏈接方法的選擇依賴經(jīng)驗：不同的鏈接方法可能導(dǎo)致不同的聚類結(jié)果。

在實際應(yīng)用中，層次聚類適用于中小規(guī)模的數(shù)據(jù)集，特別是當(dāng)需要理解數(shù)據(jù)的層次結(jié)構(gòu)時。然而，對于大規(guī)模數(shù)據(jù)集，可能需要考慮其他更高效的聚類算法，如K-Means或DBSCAN。

本文轉(zhuǎn)載自??寶寶數(shù)模AI??，作者：BBSM

標(biāo)簽

機器學(xué)習(xí)

層次聚類法

已于2025-3-20 09:39:36修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

手動實現(xiàn)一個擴散模型DDPM

pangguiyu ? 6558瀏覽 ? 0回復(fù)
ICML 2024 Oral｜外部引導(dǎo)的深度聚類新范式

輕薄滴假象 ? 3158瀏覽 ? 0回復(fù)
世界上第一個聊天機器人并非旨在成為聊天機器人

xuxiangda ? 5171瀏覽 ? 0回復(fù)
CLUSTERLLM：將大型語言模型作為文本聚類的指南

AIRoobt ? 5140瀏覽 ? 0回復(fù)
LLooM：大語言模型時代文本聚類新思路

大語言模型論文跟蹤 ? 4726瀏覽 ? 0回復(fù)
一個關(guān)于學(xué)習(xí)大模型技術(shù)的方法論

AI探索時代 ? 2338瀏覽 ? 0回復(fù)
一文了解11種最常見的機器學(xué)習(xí)算法應(yīng)用場景

石映飛云 ? 5988瀏覽 ? 0回復(fù)
一個很強大的集成學(xué)習(xí)算法：XGBoost!

寶寶數(shù)模AI ? 3143瀏覽 ? 0回復(fù)
使用大模型實現(xiàn)一個聊天機器人思路以及困難點

AI探索時代 ? 3013瀏覽 ? 0回復(fù)
一文詳解集成學(xué)習(xí)算法原理

寶寶數(shù)模AI ? 2484瀏覽 ? 0回復(fù)
我們一起聊聊分類模型：層次聚類

寶寶數(shù)模AI ? 2234瀏覽 ? 0回復(fù)
機器學(xué)習(xí)的下一個前沿—量子擴展

51CTO內(nèi)容精選 ? 2325瀏覽 ? 0回復(fù)
一個強大的集成學(xué)習(xí)算法：隨機森林

寶寶數(shù)模AI ? 3376瀏覽 ? 0回復(fù)
一個強大的集成學(xué)習(xí)算法：梯度提升樹！

寶寶數(shù)模AI ? 2194瀏覽 ? 0回復(fù)
快速學(xué)會一個機器學(xué)習(xí)算法：t-SNE降維

寶寶數(shù)模AI ? 2283瀏覽 ? 0回復(fù)
基于DeepSeek推理的文本聚類

51CTO內(nèi)容精選 ? 1471瀏覽 ? 0回復(fù)
快速學(xué)會一個機器學(xué)習(xí)算法：高斯混合模型

寶寶數(shù)模AI ? 1542瀏覽 ? 0回復(fù)
EDC2-RAG：利用聚類和壓縮技術(shù)提升RAG準(zhǔn)確性

大語言模型論文跟蹤 ? 2079瀏覽 ? 0回復(fù)
部署一個大模型，到底需要多大機器？

hm673c38238a021 ? 1964瀏覽 ? 0回復(fù)

寶寶數(shù)模AI

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

快速學(xué)會一個機器學(xué)習(xí)算法：高斯混合模型 2025-04-01 01:07:56發(fā)布
快速學(xué)會一個機器學(xué)習(xí)算法：t-SNE降維 2025-03-07 11:35:22發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

AI Agents開源工具棧全解析~ 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實測：真·超DS！ 1回復(fù)

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復(fù)

我把DeepSeek微調(diào)參數(shù)扒光了，顯存和性能優(yōu)化的秘密都在這 0回復(fù)

上一篇：快速學(xué)會一個機器學(xué)習(xí)算法：t-SNE降維

下一篇：快速學(xué)會一個機器學(xué)習(xí)算法：高斯混合模型

社區(qū)精華內(nèi)容

目錄

<style id="d41t5"></style>