偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

淺談數(shù)據(jù)挖掘的基本概念及其最常用算法

大數(shù)據(jù) 算法
當(dāng)前,大數(shù)據(jù)的理論和應(yīng)用正在國(guó)民經(jīng)濟(jì)和生活的各個(gè)領(lǐng)域如火如荼的進(jìn)行。很多人對(duì)大數(shù)據(jù)的基本概念和特點(diǎn)已經(jīng)有所了解,那么我們僅僅將大數(shù)據(jù)進(jìn)行獲取、存儲(chǔ)、檢索和共享是不夠的,怎么樣才能在大數(shù)據(jù)中找出未知的且有價(jià)值的信息和知識(shí)呢?

當(dāng)前,大數(shù)據(jù)的理論和應(yīng)用正在國(guó)民經(jīng)濟(jì)和生活的各個(gè)領(lǐng)域如火如荼的進(jìn)行。很多人對(duì)大數(shù)據(jù)的基本概念和特點(diǎn)已經(jīng)有所了解,那么我們僅僅將大數(shù)據(jù)進(jìn)行獲取、存儲(chǔ)、檢索和共享是不夠的,怎么樣才能在大數(shù)據(jù)中找出未知的且有價(jià)值的信息和知識(shí)呢?

知識(shí)發(fā)現(xiàn)(KDD)就是從大數(shù)據(jù)中識(shí)別出有效的、新穎的、潛在有用的,以及最終可理解的模式的過(guò)程。

 

淺談數(shù)據(jù)挖掘的基本概念及其最常用算法
知識(shí)發(fā)現(xiàn)的流程圖

數(shù)據(jù)挖掘是大數(shù)據(jù)知識(shí)發(fā)現(xiàn)(KDD)中不可缺少一部分,是大數(shù)據(jù)理論和應(yīng)用中非常重要的一部分。數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但潛在的有用信息和知識(shí)的過(guò)程。大部分人是通過(guò)一個(gè)案例認(rèn)識(shí)到數(shù)據(jù)挖掘:這是因?yàn)槲譅柆斖ㄟ^(guò)數(shù)據(jù)分析發(fā)現(xiàn),男性顧客在購(gòu)買嬰兒尿片時(shí),常常會(huì)順便搭配幾瓶啤酒來(lái)犒勞自己,于是嘗試推出了將啤酒和尿布擺在一起的促銷手段;沒(méi)想到這個(gè)舉措居然使尿布和啤酒的銷量都大幅增加了。雖然這個(gè)故事很可能是假的, 但是確實(shí)讓不少人開(kāi)始接觸數(shù)據(jù)挖掘。

 

淺談數(shù)據(jù)挖掘的基本概念及其最常用算法
數(shù)據(jù)挖掘基本框架

數(shù)據(jù)挖掘的最常用的幾種算法:

(1)預(yù)測(cè)建模:將已有數(shù)據(jù)和模型用于對(duì)未知變量的語(yǔ)言。

  • 分類,用于預(yù)測(cè)離散的目標(biāo)變量
  • 回歸,用于預(yù)測(cè)連續(xù)的目標(biāo)變量

(2)聚類分析:發(fā)現(xiàn)緊密相關(guān)的觀測(cè)值組群,使得與屬于不同簇的觀測(cè)值相比,屬于同一簇的觀測(cè)值相互之間盡可能類似。

(3)關(guān)聯(lián)分析(又稱關(guān)系模式):反映一個(gè)事物與其他事物之間的相互依存性和關(guān)聯(lián)性。用來(lái)發(fā)現(xiàn)描述數(shù)據(jù)中強(qiáng)關(guān)聯(lián)特征的模式。

(4)異常檢測(cè):識(shí)別其特征顯著不同于其他數(shù)據(jù)的觀測(cè)值。

有時(shí)也把數(shù)據(jù)挖掘分為:分類,回歸,聚類,關(guān)聯(lián)分析。

 

淺談數(shù)據(jù)挖掘的基本概念及其最常用算法
數(shù)據(jù)挖掘的四種典型算法

數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)有區(qū)別,也有關(guān)系,我們將在以后的文章中對(duì)其進(jìn)行介紹。

責(zé)任編輯:未麗燕 來(lái)源: 今日頭條
相關(guān)推薦

2021-05-17 07:22:05

Elasticsear架構(gòu)存儲(chǔ)

2017-02-20 23:12:16

Flexbox

2017-05-02 14:45:11

深度學(xué)習(xí)機(jī)器學(xué)習(xí)人工神經(jīng)網(wǎng)絡(luò)

2022-11-24 14:06:51

網(wǎng)絡(luò)藍(lán)牙

2010-02-03 11:11:18

C++類型轉(zhuǎn)換

2010-10-08 14:54:22

JavaScript特

2020-12-31 05:31:01

數(shù)據(jù)結(jié)構(gòu)算法

2010-01-13 16:34:57

VB.NET動(dòng)態(tài)屬性

2011-03-28 11:05:17

ODBC

2009-10-22 17:15:51

linux gcc

2010-08-23 16:23:53

CSS+DIV

2010-06-24 13:26:53

FTP協(xié)議

2017-06-15 13:15:39

Python協(xié)程

2010-06-03 18:32:51

Hadoop

2010-07-07 15:17:40

LDAP協(xié)議

2010-08-23 16:58:17

DHCP協(xié)議

2014-04-16 15:11:19

Spark

2012-09-11 14:39:03

Moosefs

2009-03-20 11:46:10

MGCP協(xié)議網(wǎng)關(guān)

2010-01-22 10:37:38

第三層交換機(jī)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)