偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

數(shù)據(jù)挖掘領(lǐng)域十大經(jīng)典算法之—K-Means算法(超詳細(xì)附代碼)

大數(shù)據(jù) 算法
k-means算法比較簡(jiǎn)單。在k-means算法中,用cluster來(lái)表示簇;容易證明k-means算法收斂等同于所有質(zhì)心不再發(fā)生變化。本文為您帶來(lái)基本的k-means算法流程

k-means算法比較簡(jiǎn)單。在k-means算法中,用cluster來(lái)表示簇;容易證明k-means算法收斂等同于所有質(zhì)心不再發(fā)生變化?;镜膋-means算法流程如下:

簡(jiǎn)介

又叫K-均值算法,是非監(jiān)督學(xué)習(xí)中的聚類算法。

數(shù)據(jù)挖掘領(lǐng)域十大經(jīng)典算法之—K-Means算法(超詳細(xì)附代碼)

基本思想

k-means算法比較簡(jiǎn)單。在k-means算法中,用cluster來(lái)表示簇;容易證明k-means算法收斂等同于所有質(zhì)心不再發(fā)生變化?;镜膋-means算法流程如下:

選取k個(gè)初始質(zhì)心(作為初始cluster,每個(gè)初始cluster只包含一個(gè)點(diǎn));

repeat:

  • 對(duì)每個(gè)樣本點(diǎn),計(jì)算得到距其最近的質(zhì)心,將其類別標(biāo)為該質(zhì)心所對(duì)應(yīng)的cluster;
  • 重新計(jì)算k個(gè)cluster對(duì)應(yīng)的質(zhì)心(質(zhì)心是cluster中樣本點(diǎn)的均值);
  • until 質(zhì)心不再發(fā)生變化 12345

repeat的次數(shù)決定了算法的迭代次數(shù)。實(shí)際上,k-means的本質(zhì)是最小化目標(biāo)函數(shù),目標(biāo)函數(shù)為每個(gè)點(diǎn)到其簇質(zhì)心的距離的平方和:

 

  • N是元素個(gè)數(shù),x表示元素,c(j)表示第j簇的質(zhì)心
  • 算法復(fù)雜度
  • 時(shí)間復(fù)雜度是O(nkt) ,其中n代表元素個(gè)數(shù),t代表算法迭代的次數(shù),k代表簇的數(shù)目

優(yōu)缺點(diǎn)

  • 優(yōu)點(diǎn)
  • 簡(jiǎn)單、快速;
  • 對(duì)大數(shù)據(jù)集有較高的效率并且是可伸縮性的;
  • 時(shí)間復(fù)雜度近于線性,適合挖掘大規(guī)模數(shù)據(jù)集。

缺點(diǎn)

  • k-means是局部***,因而對(duì)初始質(zhì)心的選取敏感;
  • 選擇能達(dá)到目標(biāo)函數(shù)***的k值是非常困難的。

代碼

代碼已在github上實(shí)現(xiàn),這里也貼出來(lái)

 

測(cè)試數(shù)據(jù)集獲取地址為testSet

責(zé)任編輯:未麗燕 來(lái)源: 網(wǎng)絡(luò)大數(shù)據(jù)
相關(guān)推薦

2018-05-03 09:36:53

算法數(shù)據(jù)挖掘C4.5

2018-10-27 15:47:35

CART算法決策樹

2016-01-29 11:00:55

數(shù)據(jù)挖掘算法大數(shù)據(jù)

2018-09-13 12:51:58

數(shù)據(jù)挖掘算法樸素貝葉斯

2013-02-25 09:46:35

數(shù)據(jù)挖掘算法ICDM

2011-01-26 09:14:43

數(shù)據(jù)挖掘

2012-08-09 09:57:54

K-means

2018-11-14 09:40:05

排序算法Java編程語(yǔ)言

2021-10-31 07:38:37

排序算法代碼

2019-08-28 11:08:51

排序算法Java

2017-07-18 10:50:38

前端JavaScript排序算法

2022-03-10 12:03:33

Python算法代碼

2021-11-08 15:12:48

排序算法面試

2010-08-31 14:01:48

CSS

2024-04-18 15:44:20

2017-07-27 14:21:44

2018-02-01 18:45:12

機(jī)器學(xué)習(xí)算法線性回歸

2021-01-26 05:33:07

排序算法快速

2011-05-17 13:39:01

算法

2011-03-10 10:45:05

算法
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)