用數(shù)據(jù)分析大家都喜歡什么類型的抖音視頻
之前有個(gè)朋友提到了抖音數(shù)據(jù)的獲取。
問(wèn)我這樣的行業(yè)前景如何,說(shuō)實(shí)話我哪知道啊...
不過(guò)也算是給我提供了一些分析思路,感謝。
所以本次就來(lái)分析一下抖音的那些大V們。
來(lái)探索一下什么樣的視頻在抖音里***。
這里不得不吐槽一下抖音,體驗(yàn)越來(lái)越差。
從一開(kāi)始的打開(kāi)App沒(méi)廣告,再到現(xiàn)在啟動(dòng)頁(yè)面有廣告,刷視頻也有廣告,還有商品櫥窗的存在。
當(dāng)然這只是吐槽一下而已,其實(shí)無(wú)論什么產(chǎn)品,廣告必不可少~
否則,日子估摸著一天比一天難過(guò)。
或許,某一天我的公眾號(hào)也會(huì)出現(xiàn)廣告...
一、獲取分析
信息肯定不是去抖音獲取的,而是從某平臺(tái)爬取的。
具體的就不透露了,萬(wàn)一哪天被查水表了該怎么辦。
主要包含了大V們的昵稱、性別、類型、點(diǎn)贊數(shù)、粉絲數(shù)以及視頻數(shù)。
一共有2840位抖音大V,粉絲數(shù)都是50w+。
二、數(shù)據(jù)可視化
01 性別分布情況
2000多位大V,除去未知性別的,男女比例基本在「1:1」。
可視化代碼如下。
- def create_gender(df):
- """
- 性別
- """
- df = df.copy()
- df.loc[df.gender == 0, 'gender'] = '未知'
- df.loc[df.gender == 1, 'gender'] = '男性'
- df.loc[df.gender == 2, 'gender'] = '女性'
- gender_message = df.groupby(['gender'])
- gender_com = gender_message['gender'].agg(['count'])
- gender_com.reset_index(inplace=True)
- # 生成餅圖
- attr = gender_com['gender']
- v1 = gender_com['count']
- pie = Pie("抖音大V性別分布情況", title_pos='center', title_top=0)
- pie.add("", attr, v1, radius=[40, 75], label_text_color=None, is_label_show=True, legend_orient="vertical", legend_pos="left", legend_top="%10")
- pie.render("抖音大V性別分布情況.html")
02 點(diǎn)贊數(shù)***0
點(diǎn)贊數(shù)都是過(guò)億的存在,就問(wèn)你怕不怕。
其中「浙有正能量」和「人民日?qǐng)?bào)」這兩個(gè)都是屬于弘揚(yáng)中國(guó)正能量的。
泱泱大中華,復(fù)興在當(dāng)下,國(guó)強(qiáng)則無(wú)懼,龍行在天涯。
可視化代碼如下。
- def create_likes(df):
- """
- 點(diǎn)贊數(shù)
- """
- df = df.sort_values('likes', ascending=False)
- attr = df['name'][0:10]
- v1 = ["{}".format(float('%.1f' % (float(i) / 100000000))) for i in df['likes'][0:10]]
- # 生成柱狀圖
- bar = Bar("抖音大V點(diǎn)贊數(shù)***0(億)", title_pos='center', title_top='18', width=800, height=400)
- bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
- bar.render("抖音大V點(diǎn)贊數(shù)***0.html")
03 粉絲數(shù)***0
粉絲數(shù)前十,大部分大V都是娛樂(lè)圈的。
這也是當(dāng)下所流行的~
可視化代碼如下。
- def create_fans(df):
- """
- 粉絲數(shù)
- """
- df = df.sort_values('fans', ascending=False)
- attr = df['name'][0:10]
- v1 = ["{}".format(float('%.1f' % (float(i) / 10000))) for i in df['fans'][0:10]]
- # 生成柱狀圖
- bar = Bar("抖音大V粉絲數(shù)***0(萬(wàn))", title_pos='center', title_top='18', width=800, height=400)
- bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
- bar.render("抖音大V粉絲數(shù)***0.html")
04 各類型點(diǎn)贊數(shù)匯總分布圖
「藍(lán)V」「娛樂(lè)」「生活」「美女」「搞笑」「帥哥」「音樂(lè)」這些類型的抖音視頻,應(yīng)該算是在抖音里較受歡迎的。
藍(lán)V是抖音上的一個(gè)認(rèn)證方式,主要是針對(duì)企業(yè)。
從上面可以看出大部分是媒體這一塊,內(nèi)容則主要是一些時(shí)事以及那些正能量視頻。
可視化代碼如下。
- def create_type_likes(df):
- """
- 類型點(diǎn)贊數(shù)
- """
- dom = []
- likes_type_message = df.groupby(['type'])
- likes_type_com = likes_type_message['likes'].agg(['sum'])
- likes_type_com.reset_index(inplace=True)
- for name, num in zip(likes_type_com['type'], likes_type_com['sum']):
- data = {}
- data['name'] = name
- data['value'] = num
- dom.append(data)
- # 生成矩形樹(shù)圖
- treemap = TreeMap("各類型抖音大V點(diǎn)贊數(shù)匯總圖", title_pos='center', title_top='5', width=800, height=400)
- treemap.add('各類型抖音大V點(diǎn)贊數(shù)匯總圖', dom, is_label_show=True, label_pos='inside', is_legend_show=False)
- treemap.render('各類型抖音大V點(diǎn)贊數(shù)匯總圖.html')
05 各類型粉絲數(shù)匯總分布圖
「娛樂(lè)」類型大V的粉絲數(shù)***,位居***。
其次便是「美女」「生活」「音樂(lè)」「帥哥」「文化」「藍(lán)V」類型的。
結(jié)合一下點(diǎn)贊數(shù)的數(shù)據(jù),我們就能知道在抖音里什么樣的視頻大家比較喜歡。
便是「娛樂(lè)」「生活」「美女」「帥哥」「音樂(lè)」「藍(lán)V」這幾個(gè)類型。
可視化代碼如下。
- def create_type_fans(df):
- """
- 類型粉絲數(shù)
- """
- dom = []
- fans_type_message = df.groupby(['type'])
- fans_type_com = fans_type_message['fans'].agg(['sum'])
- fans_type_com.reset_index(inplace=True)
- for name, num in zip(fans_type_com['type'], fans_type_com['sum']):
- data = {}
- data['name'] = name
- data['value'] = num
- dom.append(data)
- # 生成矩形樹(shù)圖
- treemap = TreeMap("各類型抖音大V粉絲數(shù)匯總圖", title_pos='center', title_top='5', width=800, height=400)
- treemap.add('各類型抖音大V粉絲數(shù)匯總圖', dom, is_label_show=True, label_pos='inside', is_legend_show=False)
- treemap.render('各類型抖音大V粉絲數(shù)匯總圖.html')
06 視頻粉絲點(diǎn)贊三維度圖
視頻越多并不意味著點(diǎn)贊數(shù)就越多,粉絲數(shù)就越多。
不過(guò)還是會(huì)有個(gè)例出現(xiàn),比如「浙有正能量」,1744個(gè)視頻,4.6億點(diǎn)贊數(shù)。
可視化代碼如下。
- def create_scatter(df):
- """
- 三維度散點(diǎn)圖
- """
- # 生成數(shù)據(jù)列表
- data = [list(i) for i in zip(df['videos'], df['fans'], df['likes'], df['name'])]
- # 生成散點(diǎn)圖
- x_lst = [v[0] for v in data]
- y_lst = [v[1] for v in data]
- extra_data = [v[2] for v in data]
- sc = Scatter("抖音大V視頻數(shù)粉絲數(shù)點(diǎn)贊數(shù)三維度", title_pos='center', title_top='5', width=800, height=400)
- sc.add("", x_lst, y_lst, extra_data=extra_data, is_visualmap=True, visual_dimension=2, visual_orient="horizontal", visual_type="size", visual_range=[0, 500000000], visual_text_color="#000", visual_range_size=[5, 30])
- sc.render('抖音大V視頻數(shù)粉絲數(shù)點(diǎn)贊數(shù)三維度.html')
07 平均視頻點(diǎn)贊數(shù)***0
***居然被一個(gè)珠寶商給霸占了,我覺(jué)得肯定有貓膩。
于是便去抖音看了一眼。
鬼知道它的粉絲和點(diǎn)贊數(shù)怎么來(lái)的。
或許和圈內(nèi)的刪庫(kù)一樣,小哥刪視頻跑路了。
可視化代碼如下。
- def create_avg_likes(df):
- """
- 平均點(diǎn)贊數(shù)
- """
- df = df[df['videos'] > 0]
- df.eval('result = likes/(videos*10000)', inplace=True)
- df['result'] = df['result'].round(decimals=1)
- df = df.sort_values('result', ascending=False)
- attr = df['name'][0:10]
- v1 = df['result'][0:10]
- # 生成柱狀圖
- bar = Bar("抖音大V平均視頻點(diǎn)贊數(shù)***0(萬(wàn))", title_pos='center', title_top='18', width=800, height=400)
- bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
- bar.render("抖音大V平均視頻點(diǎn)贊數(shù)***0.html")
08 平均視頻粉絲數(shù)***0
妥妥的娛樂(lè)圈大佬。
反正我是一個(gè)沒(méi)關(guān)注,你們呢?
可視化代碼如下。
- def create_avg_fans(df):
- """
- 平均粉絲數(shù)
- """
- df = df[df['videos'] > 0]
- df.eval('result = fans/(videos*10000)', inplace=True)
- df['result'] = df['result'].round(decimals=1)
- df = df.sort_values('result', ascending=False)
- attr = df['name'][0:10]
- v1 = df['result'][0:10]
- # 生成柱狀圖
- bar = Bar("抖音大V平均視頻粉絲數(shù)***0(萬(wàn))", title_pos='center', title_top='18', width=800, height=400)
- bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False)
- bar.render("抖音大V平均視頻粉絲數(shù)***0.html")
三、總結(jié)
我們常說(shuō),刷抖音就是浪費(fèi)時(shí)間。
講道理,抖音上也是有不少技術(shù)流的大佬,當(dāng)然內(nèi)容上更趨向于視頻制作。
比如下面這幾位,鼎鼎大名的「黑臉V」。
所以,抖音也并不是一無(wú)是處。
如果哪天你也能學(xué)會(huì)制作出那些吊炸天的視頻,也是一種收獲。
當(dāng)然路很長(zhǎng),慢慢走~