偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

數(shù)據(jù)挖掘技術(shù)在沃爾瑪?shù)膽?yīng)用

數(shù)據(jù)庫
數(shù)據(jù)挖掘(Data Mining),又稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Database, KDD),就是從大量數(shù)據(jù)中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程,簡單的說,數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中提取或“挖掘”知識。本文將講述數(shù)據(jù)挖掘技術(shù)在沃爾瑪?shù)膽?yīng)用。

總部位于美國阿肯色州的世界著名商業(yè)零售連鎖企業(yè)沃爾瑪(Wal Mart)擁有世界上***的數(shù)據(jù)倉庫系統(tǒng)。為了能夠準(zhǔn)確了解顧客在其門店的購買習(xí)慣,沃爾瑪利對其顧客的購物行為進(jìn)行購物籃分析,想知道顧客經(jīng)常一起購買的商品有哪些。沃爾瑪數(shù)據(jù)倉庫里集中了其各門店的詳細(xì)原始交易數(shù)據(jù)。在這些原始交易數(shù)據(jù)的基礎(chǔ)上,沃爾瑪利用NCR數(shù)據(jù)挖掘工具對這些數(shù)據(jù)進(jìn)行分析和挖掘。一個(gè)意外的發(fā)現(xiàn)是:"跟尿布一起購買最多的商品竟是啤酒!"

這是數(shù)據(jù)挖掘技術(shù)對歷史數(shù)據(jù)進(jìn)行分析的結(jié)果,反映數(shù)據(jù)內(nèi)在的規(guī)律。那么這個(gè)結(jié)果符合現(xiàn)實(shí)情況嗎?是否是一個(gè)有用的知識?是否有利用價(jià)值?

于是,沃爾瑪派出市場調(diào)查人員和分析師對這一數(shù)據(jù)挖掘結(jié)果進(jìn)行調(diào)查分析。經(jīng)過大量實(shí)際調(diào)查和分析,揭示了一個(gè)隱藏在"尿布與啤酒"背后的美國人的一種行為模式:在美國,一些年輕的父親下班后經(jīng)常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時(shí)也為自己買一些啤酒。產(chǎn)生這一現(xiàn)象的原因是:美國的太太們常叮囑她們的丈夫下班后為小孩買尿布,而丈夫們在買尿布后又隨手帶回了他們喜歡的啤酒。

既然尿布與啤酒一起被購買的機(jī)會(huì)很多,于是沃爾瑪就在其一個(gè)個(gè)門店將尿布與啤酒并排擺放在一起,結(jié)果是尿布與啤酒的銷售量雙雙增長。

按常規(guī)思維,尿布與啤酒風(fēng)馬牛不相及,若不是借助數(shù)據(jù)挖掘技術(shù)對大量交易數(shù)據(jù)進(jìn)行挖掘分析,沃爾瑪是不可能發(fā)現(xiàn)數(shù)據(jù)內(nèi)在這一有價(jià)值的規(guī)律的。

數(shù)據(jù)"的含義很廣,不僅指321、897這樣一些數(shù)字,還指"abc"、"李明"、"96/10/11"等符號、字符、日期形式的數(shù)據(jù)。我們討論的數(shù)據(jù)是指存放在計(jì)算機(jī)系統(tǒng)中的任何東西,如:"數(shù)字"、"字符"、"聲音"、"圖像"、"照片"、……等等,甚至處理數(shù)據(jù)的計(jì)算機(jī)程序本身也作為計(jì)算機(jī)的"數(shù)據(jù)"。隨著國民經(jīng)濟(jì)和社會(huì)信息化的發(fā)展,人們在計(jì)算機(jī)系統(tǒng)中存放的數(shù)據(jù)量越來越大。我們發(fā)現(xiàn)這些數(shù)據(jù)是人們工作、生活和其他行為的記錄,是企業(yè)和社會(huì)發(fā)展的記錄,也是人與自然界本身的描述。這就是說在計(jì)算機(jī)系統(tǒng)中形成了龐大的"數(shù)據(jù)資源"。因此,發(fā)現(xiàn)這些數(shù)據(jù)所含的規(guī)律也就是發(fā)現(xiàn)我們工作、生活和社會(huì)發(fā)展中的規(guī)律,發(fā)現(xiàn)人與自然界的規(guī)律,就相當(dāng)于在數(shù)據(jù)資源中發(fā)現(xiàn)金礦。這就是數(shù)據(jù)資源的開發(fā)利用,是非常有價(jià)值的工作。而數(shù)據(jù)挖掘是目前***進(jìn)的數(shù)據(jù)資源開發(fā)利用技術(shù)。

什么是數(shù)據(jù)挖掘

我們先來看一個(gè)數(shù)據(jù)挖掘的故事, "尿布與啤酒"的故事是關(guān)于數(shù)據(jù)挖掘最經(jīng)典和流傳最廣的故事。

那么數(shù)據(jù)挖掘是什么樣的技術(shù)呢?

數(shù)據(jù)挖掘是從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),主要有數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示三個(gè)步驟。數(shù)據(jù)準(zhǔn)備是從各種數(shù)據(jù)源中選取和集成用于數(shù)據(jù)挖掘的數(shù)據(jù);規(guī)律尋找是用某種方法將數(shù)據(jù)中的規(guī)律找出來;規(guī)律表示是用盡可能符合用戶習(xí)慣的方式(如可視化)將找出的規(guī)律表示出來。

但在具體實(shí)施數(shù)據(jù)挖掘應(yīng)用時(shí),還要有一個(gè)步驟就是結(jié)果評價(jià)。這是因?yàn)閿?shù)據(jù)算法尋找出來的是數(shù)據(jù)的規(guī)律,其中有些是人們感興趣的有用的,還有一些可能是不感興趣的沒有用的。這就要對尋找出的規(guī)律進(jìn)行評估。例如:"跟尿布一起購買最多的商品是啤酒"這樣一條規(guī)律是否有用呢?這就需要市場調(diào)查和評估工程師根據(jù)實(shí)際情況做出評估判斷。這是一個(gè)人工步驟,還難以自動(dòng)化。

數(shù)據(jù)挖掘在自身發(fā)展的過程中,吸收了數(shù)理統(tǒng)計(jì)、數(shù)據(jù)庫和人工智能中的大量技術(shù)。

【編輯推薦】

  1. 基于數(shù)據(jù)挖掘技術(shù)的客戶關(guān)系管理
  2. 深入探討數(shù)據(jù)倉庫緩慢變化維的解決方案
  3. Oracle中OSFA和數(shù)據(jù)倉庫簡介
  4. 建立數(shù)據(jù)倉庫的八條基本準(zhǔn)則
  5. Sybase數(shù)據(jù)倉庫大鵬證券應(yīng)用案例
  6. 嵌入式數(shù)據(jù)庫的現(xiàn)狀和未來
責(zé)任編輯:楊鵬飛 來源: 網(wǎng)絡(luò)
相關(guān)推薦

2020-09-28 10:05:57

數(shù)據(jù)工具技術(shù)

2016-05-23 15:42:07

數(shù)據(jù)挖掘

2017-01-19 14:45:34

數(shù)據(jù)挖掘Google再營銷

2009-01-18 15:43:29

數(shù)據(jù)挖掘電子商務(wù)WEB

2009-01-20 13:51:16

數(shù)據(jù)挖掘知識發(fā)現(xiàn)方法

2011-04-01 12:19:21

SQL Server商業(yè)智能

2022-09-01 10:10:27

數(shù)據(jù)編排技術(shù)

2025-03-24 08:00:00

Kafka開源企業(yè)場景

2018-05-29 09:38:40

大數(shù)據(jù)金融行業(yè)銀行業(yè)

2018-10-24 14:36:59

2020-09-21 09:34:20

大數(shù)據(jù)

2015-07-20 17:00:45

VXLAN云數(shù)據(jù)中心

2009-01-15 10:28:35

XMLWeb數(shù)據(jù)挖掘

2022-03-24 10:12:48

大數(shù)據(jù)大數(shù)據(jù)技術(shù)

2011-11-30 07:38:07

存儲(chǔ)虛擬化

2009-01-19 16:30:52

數(shù)據(jù)挖掘客戶關(guān)系管理營銷管理

2013-04-23 09:33:49

ZARA亞馬遜沃爾瑪

2020-11-17 14:50:34

大數(shù)據(jù)

2018-12-07 14:59:37

2016-12-01 13:44:19

iosandroid
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號