偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

大數(shù)據(jù) 數(shù)據(jù)可視化
本次通過對網(wǎng)易云音樂華語歌單數(shù)據(jù)的獲取,對華語歌單數(shù)據(jù)進(jìn)行可視化分析??梢暬瘞觳徊捎胮yecharts,來點(diǎn)新東西。使用matplotlib可視化庫,利用這個底層庫來進(jìn)行可視化展示。

網(wǎng)易云音樂2018年度聽歌報告—遇見你,真好。

相信有不少人在上周,應(yīng)該已經(jīng)看過自己網(wǎng)易云音樂的年度報告了。

小F也是去湊湊熱鬧,瞅了一波自己的年度聽歌報告。

那么你在云村又聽了多少首歌,聽到最多的歌詞又是什么呢?

2018年你的年度歌手又是誰,哪些又是你***的歌呢?

不過相比去年,我的票圈并沒有很多發(fā)自己年度報告的朋友。

不得不說,版權(quán)之爭開始,網(wǎng)易云音樂似乎就在走下坡路。

很多喜歡的歌聽不了,這應(yīng)該是大家共同的痛點(diǎn)。

***的印象就是周董的歌,在愚人節(jié)時下架了,原以為只是個玩笑,不想?yún)s是真的。

本次通過對網(wǎng)易云音樂華語歌單數(shù)據(jù)的獲取,對華語歌單數(shù)據(jù)進(jìn)行可視化分析。

可視化庫不采用pyecharts,來點(diǎn)新東西。

使用matplotlib可視化庫,利用這個底層庫來進(jìn)行可視化展示。

一、網(wǎng)頁分析

01 歌單索引頁

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

選取華語熱門歌單頁面。

獲取歌單播放量,名稱,及作者,還有歌單詳情頁鏈接。

本次一共獲取了1302張華語歌單。

02 歌單詳情頁

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

獲取歌單詳情頁信息,信息比較多。

有歌單名,收藏量,評論數(shù),標(biāo)簽,介紹,歌曲總數(shù),播放量,收錄的歌名。

這里歌曲的時長、歌手、專輯信息在網(wǎng)頁的iframe中。

需要用selenium去獲取信息,鑒于耗時過長,小F選擇放棄...

有興趣的小伙伴,可以試一下哈...

二、數(shù)據(jù)獲取

01 歌單索引頁

  1. from bs4 import BeautifulSoup 
  2. import requests 
  3. import time 
  4.  
  5. headers = { 
  6.     'User-Agent''Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36' 
  7.  
  8. for i in range(0, 1330, 35): 
  9.     print(i) 
  10.     time.sleep(2) 
  11.     url = 'https://music.163.com/discover/playlist/?cat=歐美&order=hot&limit=35&offset=' + str(i) 
  12.     response = requests.get(url=url, headers=headers) 
  13.     html = response.text 
  14.     soup = BeautifulSoup(html, 'html.parser'
  15.     # 獲取包含歌單詳情頁網(wǎng)址的標(biāo)簽 
  16.     ids = soup.select('.dec a'
  17.     # 獲取包含歌單索引頁信息的標(biāo)簽 
  18.     lis = soup.select('#m-pl-container li'
  19.     print(len(lis)) 
  20.     for j in range(len(lis)): 
  21.         # 獲取歌單詳情頁地址 
  22.         url = ids[j]['href'
  23.         # 獲取歌單標(biāo)題 
  24.         title = ids[j]['title'
  25.         # 獲取歌單播放量 
  26.         play = lis[j].select('.nb')[0].get_text() 
  27.         # 獲取歌單貢獻(xiàn)者名字 
  28.         user = lis[j].select('p')[1].select('a')[0].get_text() 
  29.         # 輸出歌單索引頁信息 
  30.         print(url, title, play, user
  31.         # 將信息寫入CSV文件中 
  32.         with open('playlist.csv''a+', encoding='utf-8-sig'as f: 
  33.             f.write(url + ',' + title + ',' + play + ',' + user + '\n')

獲取歌單索引頁信息如下,共1302張華語歌單。

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

02、歌單詳情頁

  1. from bs4 import BeautifulSoup 
  2. import pandas as pd 
  3. import requests 
  4. import time 
  5.  
  6. df = pd.read_csv('playlist.csv', header=None, error_bad_lines=False, names=['url''title''play''user']) 
  7.  
  8. headers = { 
  9.     'User-Agent''Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36' 
  10.  
  11. for i in df['url']: 
  12.     time.sleep(2) 
  13.     url = 'https://music.163.com' + i 
  14.     response = requests.get(url=url, headers=headers) 
  15.     html = response.text 
  16.     soup = BeautifulSoup(html, 'html.parser'
  17.     # 獲取歌單標(biāo)題 
  18.     title = soup.select('h2')[0].get_text().replace(','','
  19.     # 獲取標(biāo)簽 
  20.     tags = [] 
  21.     tags_message = soup.select('.u-tag i'
  22.     for p in tags_message: 
  23.         tags.append(p.get_text()) 
  24.     # 對標(biāo)簽進(jìn)行格式化 
  25.     if len(tags) > 1: 
  26.         tag = '-'.join(tags) 
  27.     else
  28.         tag = tags[0] 
  29.     # 獲取歌單介紹 
  30.     if soup.select('#album-desc-more'): 
  31.         text = soup.select('#album-desc-more')[0].get_text().replace('\n''').replace(','','
  32.     else
  33.         text = '無' 
  34.     # 獲取歌單收藏量 
  35.     collection = soup.select('#content-operation i')[1].get_text().replace('(''').replace(')'''
  36.     # 歌單播放量 
  37.     play = soup.select('.s-fc6')[0].get_text() 
  38.     # 歌單內(nèi)歌曲數(shù) 
  39.     songs = soup.select('#playlist-track-count')[0].get_text() 
  40.     # 歌單評論數(shù) 
  41.     comments = soup.select('#cnt_comment_count')[0].get_text() 
  42.     # 輸出歌單詳情頁信息 
  43.     print(title, tag, text, collection, play, songs, comments) 
  44.     # 將詳情頁信息寫入CSV文件中 
  45.     with open('music_message.csv''a+', encoding='utf-8-sig'as f: 
  46.         f.write(title + ',' + tag + ',' + text + ',' + collection + ',' + play + ',' + songs + ',' + comments + '\n'
  47.     # 獲取歌單內(nèi)歌曲名稱 
  48.     li = soup.select('.f-hide li a'
  49.     for j in li: 
  50.         with open('music_name.csv''a+', encoding='utf-8-sig'as f: 
  51.             f.write(j.get_text() + '\n'

獲取的1302張華語歌單的詳情。

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

 

 

1302張歌單里的121118首歌。

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

 

 

三、數(shù)據(jù)可視化

可視化代碼已上傳GitHub,點(diǎn)擊左下角閱讀原文即可訪問!!!

01 歌曲出現(xiàn)次數(shù) ***0

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

 

榜上的十首歌,除了「水星記」,小F聽得次數(shù)都不少。

那么你又是如何的呢?

在小F的印象里,這些歌都曾在網(wǎng)易云音樂熱歌榜的榜首出現(xiàn)過。

02 歌單貢獻(xiàn)UP主 ***0

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

 

10大歌單貢獻(xiàn)UP主,感謝這些辛勤的“搬運(yùn)工”,給大家?guī)韮?yōu)質(zhì)的歌單。

給廣大懶人癌患者,亦或選擇困難癥患者,帶來福利。

03 歌單播放量 ***0

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

 

歌單播放量前十名單,***名7000多萬播放量。

其實(shí)matplotlib生成的圖是挺清楚的,只不過一上傳就變模糊了。

所以這里你可能會覺得圖片質(zhì)量不行...

其實(shí)并不是,為此小F做了相應(yīng)的圖表,具體見文末~

04 歌單收藏量 ***0

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

 

同樣是好東西,收藏收藏!!!

有一些歌單和播放量***0里歌單有重復(fù)。

05 歌單評論數(shù) ***0

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

 

歌單「再見大俠:武俠小說泰斗金庸逝世」評論數(shù)最多。

相信不少人的閱讀時光,就是與金庸前輩的武俠小說一起度過。

飛雪連天射白鹿,笑書神俠倚碧鴛。

還有由小說改編成的電視劇,都是經(jīng)典!!!

小F武俠小說看的少,武俠電視劇看的多...

06 歌單收藏數(shù)量分布情況

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

 

將收藏數(shù)做對數(shù)處理,使得能直觀看出歌單收藏數(shù)的分布。

主要分布在0-15萬之間(ln(150000)=12)。

07 歌單播放數(shù)量分布情況

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

 

歌單播放數(shù)主要分布在0-1000萬。

其中l(wèi)n(10000000)=16。

08 歌單標(biāo)簽圖

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

 

既然選取的是華語歌單,那么華語這二字必不可少,而且還占大頭。

那么就看看除了華語,還有什么其他標(biāo)簽。

「流行」沒啥好說的。

「古風(fēng)」「說唱」「民謠」近些年來熱度是越來越高,不過也有玩壞的時候。

比如「離人愁」、「一人我飲酒醉」,小F作為吃瓜群眾,只能說且行且珍惜...

09 歌單介紹詞云圖

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

 

歌單介紹詞云圖,希望你能找到你喜歡某首歌的原因!!!

到底是希望,還是青春,亦或是回憶呢?

四、總結(jié)

***,把本次搜刮的干貨,分享給大家。

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

Python數(shù)據(jù)可視化:網(wǎng)易云音樂歌單

可視化及相關(guān)代碼都放「GitHub」上頭了。

GitHub:https://github.com/Tobby-star/music_163

作者:法納斯特,Python愛好者,喜歡爬蟲,數(shù)據(jù)分析以及可視化。

責(zé)任編輯:未麗燕 來源: 法納斯特
相關(guān)推薦

2018-05-14 14:02:41

Python爬蟲網(wǎng)易云音樂

2023-06-12 07:44:21

大數(shù)據(jù)數(shù)據(jù)治理

2020-03-11 14:39:26

數(shù)據(jù)可視化地圖可視化地理信息

2017-10-14 13:54:26

數(shù)據(jù)可視化數(shù)據(jù)信息可視化

2022-08-26 09:15:58

Python可視化plotly

2020-05-26 11:34:46

可視化WordCloud

2022-02-23 09:50:52

PythonEchartspyecharts

2013-03-04 10:57:01

網(wǎng)易云音樂

2022-09-21 23:29:15

Python點(diǎn)云數(shù)據(jù)

2017-10-31 09:38:53

大數(shù)據(jù)數(shù)據(jù)可視化Python

2024-08-20 18:16:49

數(shù)據(jù)可視化Python

2018-11-30 10:28:44

Python反爬網(wǎng)頁

2021-05-26 10:21:31

Python音樂軟件包

2015-08-20 10:00:45

可視化

2023-02-08 19:32:27

大數(shù)據(jù)

2018-12-03 16:50:23

數(shù)據(jù)可視化數(shù)據(jù)分析薪水

2019-01-21 15:10:11

佩奇可視化數(shù)據(jù)

2018-03-07 11:35:49

Python可視化數(shù)據(jù)

2021-10-11 08:04:22

Python數(shù)據(jù)行程

2020-09-02 13:56:03

Python可視化數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號