使用這些 Python 工具可視化地探索數(shù)據(jù)

開(kāi)源工具在推動(dòng)技術(shù)進(jìn)步和使其更加普及方面發(fā)揮了重要作用。數(shù)據(jù)分析也不例外。隨著數(shù)據(jù)變得越來(lái)越豐富和復(fù)雜,數(shù)據(jù)科學(xué)家 始終在尋找簡(jiǎn)化工作流程并創(chuàng)建交互式和吸引人的可視化的方式。PyGWalker 就是為解決此類問(wèn)題而設(shè)計(jì)的。
PyGWalker(Graphic Walker 的 Python 綁定)將 Python Jupyter Notebook 的工作環(huán)境連接到 Graphic Walker,以創(chuàng)建開(kāi)源數(shù)據(jù)可視化工具。你可以通過(guò)簡(jiǎn)單的拖放操作將 Pandas 數(shù)據(jù)幀 轉(zhuǎn)化為精美的數(shù)據(jù)可視化。

Exploring data through a visual interface with Pygwalker
開(kāi)始使用 PyGWalker
使用 pip 安裝 PyGWalker:
$ python3 -m pip install pygwalker導(dǎo)入 pygwalker 和 pandas 以在項(xiàng)目中使用它:
import pandas as pd
import pygwalker as pyg將數(shù)據(jù)加載到 Pandas 數(shù)據(jù)報(bào)中并調(diào)用 PyGWalker:
df = pd.read_csv('./bike_sharing_dc.csv', parse_dates=['date'])
gwalker = pyg.walk(df)你現(xiàn)在有一個(gè)圖形用戶界面來(lái)探索和可視化你的 Pandas 數(shù)據(jù)幀!
使用 Graphic Walker 探索數(shù)據(jù)
Graphic Walker 的主要功能之一是能夠更改標(biāo)記類型以創(chuàng)建不同類型的圖表。例如,通過(guò)將標(biāo)記類型更改為折線來(lái)創(chuàng)建折線圖。

Line charts generated by Pygwalker
你還可以通過(guò)創(chuàng)建 concat 視圖來(lái)比較不同的度量,該視圖將多個(gè)度量添加到行和列中。

Comparing data in the Graphic Walker interface.
將維度放入行或列中,以創(chuàng)建一個(gè) facet 視圖,這個(gè)視圖包含多個(gè)子視圖,這些子視圖由一個(gè)維度中的值分隔開(kāi)。

The facets view in Graphic Walker.
在 數(shù)據(jù)Data

Table data in Graphic Walker.
使用 PyGWalker 進(jìn)行數(shù)據(jù)探索
你可以使用 PyGWalker 將 Pandas 數(shù)據(jù)轉(zhuǎn)換為高度可定制的圖形圖表。你也可以使用 PyGWalker 作為探索數(shù)據(jù)的強(qiáng)大工具,以發(fā)現(xiàn)潛在的模式、趨勢(shì)和洞察力。
數(shù)據(jù)探索選項(xiàng)可以在“探索模式Exploration Mode”選項(xiàng)(工具欄中)中找到。它們可以設(shè)置為點(diǎn)模式或刷模式。
- 點(diǎn)模式:通過(guò)將你的鼠標(biāo)光標(biāo)指向數(shù)據(jù)的一個(gè)特定部分來(lái)探索數(shù)據(jù)。
- 刷模式:通過(guò)在數(shù)據(jù)范圍周圍畫(huà)一個(gè)選擇框來(lái)探索數(shù)據(jù),然后拖動(dòng)選擇框來(lái)查看生成的報(bào)告。
試試看你的數(shù)據(jù)
你可以在這些云演示中試用 PyGWalker:Google Colab、Binder 或 Graphic Walker Online Demo。
PyGWalker 是一個(gè)用于簡(jiǎn)化數(shù)據(jù)分析和可視化工作流程的優(yōu)秀工具,特別是對(duì)于那些想要使用 Pandas 進(jìn)行界面可視化的人。借助 PyGWalker 和 Graphic Walker,數(shù)據(jù)科學(xué)家可以在 Jupyter Notebook 中通過(guò)簡(jiǎn)單的拖放操作輕松創(chuàng)建令人驚嘆的可視化效果。請(qǐng)查看 PyGWalker Git 倉(cāng)庫(kù)獲取源代碼。
對(duì)于尋求自動(dòng)化數(shù)據(jù)探索和高級(jí)增強(qiáng)分析的開(kāi)源解決方案的數(shù)據(jù)科學(xué)家,該項(xiàng)目還適用于 RATH,這是一種開(kāi)源自動(dòng) EDA、人工智能支持的數(shù)據(jù)探索和可視化工具。你還可以查看 RATH Git 倉(cāng)庫(kù) 獲取源代碼和活躍的社區(qū)。
(題圖:MJ/21c21716-b900-4466-98a9-51268960c9b8)






























