偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

R數(shù)據(jù)分析:如何理解模型中的“控制”,圖例展示

大數(shù)據(jù) 數(shù)據(jù)分析
如果兩個(gè)變量有共變關(guān)系,我們就可以用其中一個(gè)變量來預(yù)測另外一個(gè)變量的走勢,如果這種共變關(guān)系是一種因果關(guān)系,我們就可以在統(tǒng)計(jì)分析中對(duì)其進(jìn)行控制。有點(diǎn)不好理解,所以今天給大家準(zhǔn)備了實(shí)例,并且用圖形給大家說明這個(gè)問題。

如果兩個(gè)變量有共變關(guān)系,我們就可以用其中一個(gè)變量來預(yù)測另外一個(gè)變量的走勢,如果這種共變關(guān)系是一種因果關(guān)系,我們就可以在統(tǒng)計(jì)分析中對(duì)其進(jìn)行控制。

有點(diǎn)不好理解,所以今天給大家準(zhǔn)備了實(shí)例,并且用圖形給大家說明這個(gè)問題。

實(shí)例操練

今天用的數(shù)據(jù)依然是R自帶的diamonds數(shù)據(jù)集,數(shù)據(jù)變量什么意思請(qǐng)大家自行百度。

在上一篇文章中,我們用箱型圖畫出不同的cut上鉆石價(jià)格的分布如下圖 

R數(shù)據(jù)分析:如何理解模型中的“控制”,圖例展示

在上面的圖中我們可以看到隨著鉆石的cut越好,似乎鉆石的價(jià)格越低,這個(gè)關(guān)系明顯是不符合常理的,值得探討一下。

其實(shí)探討cut、price之間的關(guān)系是挺復(fù)雜的一個(gè)事情,因?yàn)閏ut和carat, carat和price之間都有緊密的關(guān)系,所以我們現(xiàn)在的思路就是說,希望能夠在去除了carat對(duì)price的效應(yīng)之后,再看cut和price的關(guān)系。

下面的代碼建立了carat和price的模型,并且計(jì)算了模型的殘差(就是預(yù)測值和實(shí)際值的區(qū)別),殘差就反映了因變量未被自變量解釋的部分,在本例中就是price的變異中carat解釋不了的部分。

  1. library(modelr) 
  2. mod <- lm(log(price) ~ log(carat), data = diamonds) 
  3. diamonds2 <- diamonds %>%   add_residuals(mod) %>%  
  4.   mutate(resid = exp(resid)) 
  5. ggplot(data = diamonds2) +   geom_point(mapping = aes(x = carat, y = resid)) 

 R數(shù)據(jù)分析:如何理解模型中的“控制”,圖例展示

上面的代碼同時(shí)還做出了carat與模型殘差的散點(diǎn)圖,可以看出只用carat來解釋price是不太好的。

那么摳掉了carat和price的關(guān)系之后,怎么看cut和price的關(guān)系呢?代碼如下:

  1. ggplot(data = diamonds2) +  
  2.   geom_boxplot(mapping = aes(x = cut, y = resid)) 

 R數(shù)據(jù)分析:如何理解模型中的“控制”,圖例展示

這個(gè)時(shí)候我們是用cut為自變量,殘差為因變量進(jìn)行了作圖,也就是看一看摳掉了carat對(duì)price的效應(yīng)后,cut對(duì)price的實(shí)際的關(guān)系,可以看到這回隨著cut越來越好,price也愈來愈高,這下就對(duì)了。

實(shí)際上,上面的過程就是一個(gè)統(tǒng)計(jì)控制的過程,我們?cè)诳碿ut對(duì)price的關(guān)系的時(shí)候需要控制掉carat對(duì)price的關(guān)系,這樣得到的結(jié)果才是純凈的結(jié)果,有興趣的同學(xué)還可以去看一看控制變量和混雜變量的區(qū)別,嘿嘿。

小結(jié)

今天用一個(gè)實(shí)際的例子給大家寫了統(tǒng)計(jì)控制,感謝大家耐心看完。發(fā)表這些東西的主要目的就是督促自己,希望大家關(guān)注評(píng)論指出不足,一起進(jìn)步。內(nèi)容我都會(huì)寫的很細(xì),用到的數(shù)據(jù)集也會(huì)在原文中給出鏈接,你只要按照文章中的代碼自己也可以做出一樣的結(jié)果,一個(gè)目的就是零基礎(chǔ)也能懂,因?yàn)樽约壕褪鞘裁椿A(chǔ)沒有從零學(xué)Python和R的,加油。

 

責(zé)任編輯:未麗燕 來源: 今日頭條
相關(guān)推薦

2024-07-01 08:51:19

可視化數(shù)據(jù)分析漏斗

2021-01-14 12:17:52

大數(shù)據(jù)數(shù)據(jù)分析技術(shù)

2019-07-31 14:16:35

大數(shù)據(jù)人工智能算法

2020-05-15 15:09:51

R語言數(shù)據(jù)分析

2024-03-04 11:10:01

2017-05-19 08:45:34

R用戶Python數(shù)據(jù)分析

2017-10-14 14:49:46

RPython數(shù)據(jù)分析

2024-08-06 11:32:07

2017-09-28 16:31:02

大數(shù)據(jù)數(shù)據(jù)分析漏斗模型

2017-07-24 09:18:55

大數(shù)據(jù)數(shù)據(jù)分析行為事件分析

2018-07-05 14:18:12

數(shù)據(jù)分析神經(jīng)網(wǎng)絡(luò)模型

2014-03-12 10:17:22

R語言Hadoop

2024-10-10 11:59:11

2024-10-30 12:21:18

2022-02-21 17:35:50

漏斗模型流程數(shù)據(jù)

2024-02-26 12:34:52

模型數(shù)據(jù)決策模型

2022-05-09 18:46:28

EOQ模型數(shù)據(jù)分析

2020-08-20 20:33:57

大數(shù)據(jù)R假設(shè)檢驗(yàn)

2015-09-23 09:55:26

數(shù)據(jù)分析分類變量

2013-05-22 08:55:14

R語言
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)