VS Code 14 個神級擴(kuò)展,提高生產(chǎn)力!
作為面向數(shù)據(jù)的工作者,你的工具箱就是一切。合適的工具集可以節(jié)省你的時間、減少挫折感并使你的工作流程更加高效。我們擁有的最強(qiáng)大的工具之一是Visual Studio Code (VS Code)。憑借其可擴(kuò)展性和龐大的生態(tài)系統(tǒng),VS Code 可以通過合適的擴(kuò)展集轉(zhuǎn)變?yōu)榻K極數(shù)據(jù)工程工作站。
如果你尚未使用這些 VS Code 擴(kuò)展,那么你將錯過一些重大的生產(chǎn)力提升。從調(diào)試復(fù)雜的數(shù)據(jù)管道到簡化代碼生成,這些工具都是改變游戲規(guī)則的工具。讓我們深入了解每個數(shù)據(jù)工程師都應(yīng)該信賴的14 個頂級 VS Code 擴(kuò)展,以將他們的生產(chǎn)力提升到一個新的水平。
1. Jupyter(下載量超過 8500 萬次)
用于交互式筆記本和數(shù)據(jù)探索
如果你使用 Python 和數(shù)據(jù)科學(xué),你很可能使用過 Jupyter 筆記本。這個擴(kuò)展將Jupyter功能直接引入 VS Code。無論你是探索數(shù)據(jù)集、運(yùn)行 Python 腳本還是測試 ETL 管道,此擴(kuò)展都允許你在交互式筆記本式環(huán)境中工作,而無需離開代碼編輯器。它非常適合臨時分析、嘗試新想法以及在開發(fā)設(shè)置中可視化數(shù)據(jù)。
圖片
https://marketplace.visualstudio.com/items?itemName=ms-toolsai.jupyter
2. Docker(下載量超過 3900 萬次)
用于容器化和環(huán)境管理
作為數(shù)據(jù)工程師,跨不同平臺和機(jī)器管理環(huán)境是一項持續(xù)的挑戰(zhàn)。進(jìn)入Docker。此擴(kuò)展通過讓你直接在 VS Code 內(nèi)與 Docker 容器交互來簡化容器管理。無論你是為數(shù)據(jù)管道構(gòu)建本地環(huán)境還是將其部署到云基礎(chǔ)架構(gòu),Docker 都可以無縫管理和運(yùn)行容器化應(yīng)用程序。它對于環(huán)境的一致性至關(guān)重要,尤其是在使用微服務(wù)和分布式系統(tǒng)時。
圖片
https://marketplace.visualstudio.com/items?itemName=ms-azuretools.vscode-docker
3. Parquet Viewer(下載量超過 181K)
用于無縫查看 Parquet 文件
Parquet 是大數(shù)據(jù)工作流中最廣泛使用的列式數(shù)據(jù)格式之一,尤其是在Apache Spark或Hadoop等系統(tǒng)中。Parquet Viewer擴(kuò)展可讓你直接在 VS Code 中輕松查看和檢查 Parquet 文件。無論你是在調(diào)查數(shù)據(jù)集還是驗證架構(gòu)更改,此擴(kuò)展都無需使用外部工具來打開和瀏覽 Parquet 文件。
圖片
https://marketplace.visualstudio.com/items?itemName=dvirtz.parquet-viewer
4.Rainbow CSV(下載量超過 1000 萬次)
為了獲得更干凈、更易讀的 CSV/TSV 文件
數(shù)據(jù)清理是數(shù)據(jù)工程師生活中的一大部分,處理CSV或TSV文件往往是不可避免的。Rainbow CSV可以解決這個問題,它為 CSV/TSV 文件添加了顏色突出顯示,使文件更易于閱讀和解釋。它以視覺上可區(qū)分的方式格式化列,并幫助你一眼就發(fā)現(xiàn)諸如值放錯位置或分隔符不正確等問題。
圖片
https://marketplace.visualstudio.com/items?itemName=mechatroner.rainbow-csv
5. YAML(下載量超過 1900 萬次)
用于管理配置文件
數(shù)據(jù)工程的很大一部分涉及設(shè)置、管理和排除Kubernetes、Airflow或dbt等工具的配置故障。YAML文件通常用于配置,但如果格式不正確,它們很快就會失控。此擴(kuò)展提供語法突出顯示、驗證和錯誤檢測,確保你的配置保持干凈且無錯誤。
圖片
https://marketplace.visualstudio.com/items?itemName=redhat.vscode-yaml
6.Data Wrangler(下載量超過 58.7 萬次)
用于數(shù)據(jù)清理和轉(zhuǎn)換
無論你的自動化程度如何,數(shù)據(jù)清理都是每個數(shù)據(jù)工程項目的一部分。Data Wrangler提供了豐富的用戶界面,可直接在 VS Code 中分析、清理和轉(zhuǎn)換數(shù)據(jù)。它提供有見地的統(tǒng)計數(shù)據(jù)、可視化效果,甚至在你清理時自動生成 Pandas 代碼。非常適合快速探索數(shù)據(jù)集并在將其傳遞到管道之前對其進(jìn)行轉(zhuǎn)換。
圖片
https://marketplace.visualstudio.com/items?itemName=ms-toolsai.datawrangler
7. Copilot(下載量超過 2200 萬次)
人工智能代碼輔助
需要編寫 SQL 查詢或操作數(shù)據(jù)集,但又覺得重復(fù)的任務(wù)讓人不知所措?GitHub Copilot就是你的新朋友。Copilot 由OpenAI 的 GPT提供支持,可幫助生成代碼片段、解決復(fù)雜邏輯,甚至提出優(yōu)化建議。它是加速代碼編寫的強(qiáng)大工具,讓你可以更專注于解決問題,而不是編寫樣板代碼。
圖片
https://marketplace.visualstudio.com/items?itemName=GitHub.copilot
8. Pylance(下載量超過 1.18 億次)
對于 Python IntelliSense 和類型檢查
Python 是數(shù)據(jù)工程的通用語言,而Pylance 則通過高級 IntelliSense 功能增強(qiáng)了你的編碼體驗。它提供類型檢查、更好的自動完成功能和更準(zhǔn)確的建議,所有這些都可以幫助你編寫更簡潔、更高效的 Python 代碼。作為一名數(shù)據(jù)工程師,你可能會同時使用多個庫,因此擁有強(qiáng)大的類型信息可以防止出現(xiàn)錯誤并提高你的工作效率。
圖片
https://marketplace.visualstudio.com/items?itemName=ms-python.vscode-pylance
9. SQLTools(下載量超過 460 萬次)
用于數(shù)據(jù)庫探索和 SQL 查詢
作為數(shù)據(jù)工程師,使用數(shù)據(jù)庫是他們的第二天性。SQLTools簡化了 VS Code 中的數(shù)據(jù)庫管理,讓你可以輕松連接和查詢PostgreSQL、MySQL 和其他關(guān)系數(shù)據(jù)庫。借助內(nèi)置的查詢運(yùn)行器、架構(gòu)探索器和自動完成功能,SQLTools 非常適合快速探索數(shù)據(jù)庫和優(yōu)化查詢。
https://marketplace.visualstudio.com/items?itemName=mtxr.sqltools
10. Cloud Code(下載量超過 150 萬次)
對于 GCP 云開發(fā)和 Gemini AI
Cloud Code擴(kuò)展程序利用 Google Cloud 和 Gemini 的強(qiáng)大功能,幫助你比以往更快、更輕松地構(gòu)建應(yīng)用程序。它就像 VS Code 中云原生開發(fā)的個人助理。它可幫助你無縫地與 Kubernetes、Cloud Run 和 Google Cloud API 協(xié)作。
無論你部署應(yīng)用程序、編寫 YAML 配置還是在云中進(jìn)行調(diào)試,它都能為你提供智能工具和流暢的工作流程。它非常適合管理基于云的管道和服務(wù)的數(shù)據(jù)工程師 - 不再為云設(shè)置而煩惱!
圖片
https://marketplace.visualstudio.com/items?itemName=GoogleCloudTools.cloudcode
11. Indent-Rainbow(下載量超過 910 萬次)
為了更清潔、更易于導(dǎo)航的代碼
使用 Python 或 YAML 的挑戰(zhàn)之一是復(fù)雜文件可能難以導(dǎo)航。Indent -Rainbow為縮進(jìn)級別添加了顏色編碼,這使得理解深度嵌套文件的結(jié)構(gòu)變得更加容易。非常適合調(diào)試或重構(gòu)復(fù)雜的數(shù)據(jù)轉(zhuǎn)換腳本。
圖片
https://marketplace.visualstudio.com/items?itemName=oderwat.indent-rainbow
12. SQLite Viewer(下載量超過 150 萬次)
用于快速數(shù)據(jù)庫探索
有時,你只需要快速查看 SQLite 文件。無論你是在設(shè)計原型還是調(diào)試應(yīng)用程序,SQLite Viewer都允許你直接在 VS Code 中打開和查詢 SQLite 數(shù)據(jù)庫。當(dāng)你想在小型數(shù)據(jù)集進(jìn)入主管道之前檢查它們或測試數(shù)據(jù)提取工作流時,這尤其有用。
圖片
https://marketplace.visualstudio.com/items?itemName=qwtel.sqlite-viewer
13. Postman(下載量超過 120 萬次)
用于 API 測試和監(jiān)控
當(dāng)你的數(shù)據(jù)提取涉及 API 時(無論是從外部源提取數(shù)據(jù)還是將其發(fā)送到下游系統(tǒng)),Postman都是無價之寶。此擴(kuò)展將 API 測試直接集成到 VS Code 中,允許你發(fā)送請求、監(jiān)控響應(yīng)和實時調(diào)試 API 調(diào)用。對于構(gòu)建復(fù)雜 ETL 管道的數(shù)據(jù)工程師來說,這是一個必備工具,可確保你的 API 集成按預(yù)期運(yùn)行。
圖片
https://marketplace.visualstudio.com/items?itemName=Postman.postman-for-vscode
14.GitLens(下載量超過 3600 萬次)
用于 Git 集成和版本控制
在構(gòu)建復(fù)雜的數(shù)據(jù)管道時,版本控制至關(guān)重要,而GitLens將 Git 在 VS Code 中提升到了一個新的水平。它提供了詳細(xì)的責(zé)任注釋。
圖片
https://marketplace.visualstudio.com/items?itemName=eamodio.gitlens
































