偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

大數(shù)據(jù) 數(shù)據(jù)分析
本文的文字及圖片來源于網(wǎng)絡,僅供學習、交流使用,不具有任何商業(yè)用途,版權歸原作者所有,如有問題請及時聯(lián)系我們以作處理。

[[324555]]

前言

本文的文字及圖片來源于網(wǎng)絡,僅供學習、交流使用,不具有任何商業(yè)用途,版權歸原作者所有,如有問題請及時聯(lián)系我們以作處理。

如果你處于想學Python或者正在學習Python,Python的教程不少了吧,但是是最新的嗎?說不定你學了可能是兩年前人家就學過的內(nèi)容,在這小編分享一波2020最新的Python教程。

一、項目背景

  • 案例類型:練習
  • 案例工具:Python、Qgis
  • 案例目的:通過實戰(zhàn)進行學習,讓大家綜合運用基礎知識,加深印象鞏固記憶。

二 、提出問題

  • 通過餐飲數(shù)據(jù)分析選出最具有競爭力的品類;
  • 通過建立綜合分數(shù)指標的計算公式來挑選出最適合地址。

三、理解數(shù)據(jù)

讀取數(shù)據(jù)集后,通過info()和describe()方法來查看一下數(shù)據(jù)的基本情況。

  1. data.info() 
  2. —————————————————————————— 
  3. <class 'pandas.core.frame.DataFrame'
  4. RangeIndex: 96398 entries, 0 to 96397 
  5. Data columns (total 10 columns): 
  6. 類別      96258 non-null object 
  7. 行政區(qū)     96255 non-null object 
  8. 點評數(shù)     96398 non-null int64 
  9. 口味      96398 non-null float64 
  10. 環(huán)境      96398 non-null float64 
  11. 服務      96398 non-null float64 
  12. 人均消費    96398 non-null int64 
  13. 城市      96398 non-null object 
  14. Lng     96398 non-null float64 
  15. Lat     96398 non-null float64 
  16. dtypes: float64(5), int64(2), object(3) 
  17. memory usage: 7.4+ MB 
  18. 數(shù)據(jù)共計96398個,10個變量/特征,數(shù)據(jù)類型數(shù)量為 float64(5), int64(2), object(3),粗略觀察,數(shù)據(jù)明顯有缺失值的情況,需要進行數(shù)據(jù)的清洗。 

四、數(shù)據(jù)處理

使用data.isnull().values.sum()檢查空值數(shù)量,檢查出283個空值。

由于空值占數(shù)據(jù)總量比例為283/96398 = 0.0029,刪除空值并不影響整體的數(shù)據(jù)情況,所以這里采用刪除的辦法來處理空值。

使用data.dropna()對空值進行刪除,再使用data.isnull().values.sum()進行檢查,結(jié)果為0。

數(shù)據(jù)清洗后的數(shù)據(jù)共計96255個。根據(jù)①通過餐飲數(shù)據(jù)分析選出最具有競爭力的品類的要求,選擇相關的變量,選擇['類別', '口味', '環(huán)境', '服務', '人均消費’]5個變量。

建立['類別', '口味', '環(huán)境', '服務', '人均消費’]的DataFrame,并且篩選出所有評分和消費大于0的情況。因為根據(jù)實際情況,評分和消費為0的數(shù)據(jù)對此沒有參考作用。

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

引入’性價比’這一列,性價比的計算方式將所有的評分相加再除以人均消費金額,計算出 分/元 為單位的數(shù)值,表示單位價格獲得的分數(shù) 來表示其性價比。

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

這樣獲得了df如下,篩選出了需要的數(shù)據(jù)54886個。

  1. df.info() 
  2. —————————————————————————— 
  3. <class 'pandas.core.frame.DataFrame'
  4. Int64Index: 54886 entries, 0 to 96395 
  5. Data columns (total 6 columns): 
  6. 類別      54886 non-null object 
  7. 口味      54886 non-null float64 
  8. 環(huán)境      54886 non-null float64 
  9. 服務      54886 non-null float64 
  10. 人均消費    54886 non-null int64 
  11. 性價比     54886 non-null float64 
  12. dtypes: float64(4), int64(1), object(1) 
  13. memory usage: 2.9+ MB 

五、構(gòu)建模型

得到數(shù)據(jù)集df,選擇'類別'進行groupby分組再進行mean值等到每個類別的值。

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

使用箱型圖進行異常值的排查。

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

箱型圖使用異常值刪除的函數(shù),對異常值進行刪除。

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

構(gòu)建一個選擇具有競爭力的品類的公式的因素,例如’口味','人均消費’,'性價比’,然后通過異常值刪除的函數(shù)得出數(shù)據(jù)集。

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

將三組數(shù)據(jù)集放在同一張圖上面。

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

很明顯是由于沒有做 數(shù)據(jù)標準化處理。

數(shù)據(jù)標準化處理之后

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

設計了一個計算公式,權重自己設計 分數(shù)的計算式 比如按照 口味:人均消費:性價比 = 2:5:3 的比例去計算。

先合并df_kw_max_min、df_rj_max_min、df_xjb_max_min,通過pd.merge合并。

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

計算最后的得分

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

得出【甜品】是最佳的品類。

使用Qgis制作出關于'人口密度'、'道路密度'、'餐飲密度'、'競品密度’、'經(jīng)度’、’維度'相關的數(shù)據(jù)集。

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

數(shù)據(jù)集有空值,使用dealdata.fillna(0,inplace=True)進行0的填充。

觀察數(shù)據(jù)得知,'人口密度'、'道路密度'、'餐飲密度'、'競品密度’不在同一緯度上,所以進行數(shù)據(jù)標準化處理。再計算['綜合指標’]這一新列的數(shù)值。按照’人口密度’:'道路密度’:'餐飲密度’:'競品密度’=4:3:2:1的比例。

六、數(shù)據(jù)可視化

利用matplotlib進行制圖,使用散點圖。

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

補充:使用bokeh繪制空間互動圖形。

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

 

Python數(shù)據(jù)分析:大眾點評數(shù)據(jù)進行選址

得出結(jié)論:

甜品店選址在(121°472′E,31°301′N)、(121°473′E,31°274′N)、(121°493′E,31°244′N)等地方開設最優(yōu)

 

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2013-06-20 14:29:49

2016-09-29 15:03:50

大眾 點評

2015-10-12 11:25:20

android大眾點評下拉動畫

2015-07-16 13:23:13

2013-03-18 16:49:50

大眾點評315央視

2016-05-23 16:22:49

大眾點評支付網(wǎng)關系統(tǒng)

2022-07-07 11:27:14

技術搜索模型

2013-06-19 09:51:00

大眾點評網(wǎng)大眾點評網(wǎng)被黑

2016-01-14 10:33:35

FusionServe華為大眾點評網(wǎng)

2012-07-18 10:41:35

語音功能

2016-02-16 17:14:13

高可用系統(tǒng)大眾點評

2012-04-25 18:07:17

大眾點評網(wǎng)王宏網(wǎng)站平臺遷移

2012-09-04 11:09:20

2014-02-17 09:38:42

大眾點評股權微信入口

2012-04-20 18:26:09

大眾點評網(wǎng)王宏.Net

2019-05-28 14:43:25

CIO大眾點評APP

2015-10-08 10:09:16

2012-03-12 09:51:42

上市

2016-03-22 16:11:31

高可用性系統(tǒng)實踐經(jīng)驗

2019-01-15 14:21:13

Python數(shù)據(jù)分析數(shù)據(jù)
點贊
收藏

51CTO技術棧公眾號