使用PyGWalker可視化分析表格型數(shù)據(jù)
簡介
想象一下,在Jupyter Notebook中擁有大量數(shù)據(jù),想要對其進行分析和可視化。PyGWalker就像一個神奇的工具,能讓這項工作變得超級簡單。它能獲取用戶的數(shù)據(jù),并將其轉(zhuǎn)化為一種特殊的表格,可以與之交互,就像使用Tableau一樣。可以直觀地探索數(shù)據(jù),玩轉(zhuǎn)數(shù)據(jù),查看模式和洞察力,而不會迷失在復(fù)雜的代碼中。PyGWalker簡化了一切,讓用戶可以毫不費力地快速分析和理解數(shù)據(jù)。PyGWalker由Kanaries開發(fā)。

【官方GitHub代碼庫】:
https://github.com/Kanaries/pygwalker
【代碼】:
Google Colab(https://colab.research.google.com/drive/171QUQeq-uTLgSj1u-P9DQig7Md1kpXQ2?usp=sharing)
Kaggle Notebook(https://www.kaggle.com/code/asmdef/pygwalker-test/notebook)
【開發(fā)者簡介】:
https://github.com/ObservedObserver
具體探索
通過pip安裝PyGWalker庫。
!pip install pygwalker -q要開始在Jupyter Notebook中使用PyGWalker,需要導(dǎo)入兩個基本庫:pandas和pygwalker。
import pandas as pd
import pygwalker as pygimport pandas as pd這一行允許你處理表格格式的數(shù)據(jù),而import pygwalker as pyg則引入了PyGWalker庫。
導(dǎo)入后,你就可以將PyGWalker無縫地集成到現(xiàn)有工作流程中。
例如,你可以使用pandas加載數(shù)據(jù)。
df = pd.read_csv('my_data.csv')然后,你可以創(chuàng)建一個PyGWalker實例,命名為“gwalker”,將數(shù)據(jù)幀作為參數(shù)傳遞,如下所示:
gwalker = pyg.walk(df)執(zhí)行提供的命令后,代碼單元格下方會出現(xiàn)一個新的輸出。該輸出將包含一個交互式用戶界面。
圖片
該界面提供了各種拖放功能,可用于分析和探索數(shù)據(jù)。它提供了一種與數(shù)據(jù)交互的便捷互動方式,讓你能夠執(zhí)行可視化數(shù)據(jù)、探索關(guān)系等任務(wù)。
有了PyGWalker,你現(xiàn)在就擁有了一個類似于Tableau的用戶界面,可以對數(shù)據(jù)進行分析和可視化。
圖片
PyGWalker提供了改變標(biāo)記類型的靈活性,使你能夠創(chuàng)建不同的圖表。例如,你可以通過選擇所需的變量和線條標(biāo)記類型,輕松切換到折線圖。
圖片
你還可以通過創(chuàng)建拼接視圖來比較不同的測量值。通過將多個測量值添加到行或列,可以輕松地對它們進行并排分析和比較。
圖片
你可以根據(jù)特定類別或特征將數(shù)據(jù)整理成不同的部分。這有助于對數(shù)據(jù)的不同子集進行單獨分析和比較。
圖片
PyGWalker允許你以表格格式查看數(shù)據(jù),并自定義分析類型和語義類型。你可以輕松地以結(jié)構(gòu)化的方式將數(shù)據(jù)可視化,并根據(jù)具體需求調(diào)整數(shù)據(jù)分析和解釋的方式。
圖片
你還可以將數(shù)據(jù)探索結(jié)果保存到本地文件中。
總結(jié)
PyGWalker是一個提供多種功能的通用庫。探索這個強大的工具可以提高你在數(shù)據(jù)分析和可視化方面的技能。















 
 
 








 
 
 
 