偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<legend id="w11x8"><track id="w11x8"></track></legend>

<sub id="w11x8"><rt id="w11x8"></rt></sub>

<cite id="w11x8"><track id="w11x8"></track></cite>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

用于數(shù)據(jù)分析的8個SQL技術(shù)

作者：人工智能遇見磐創(chuàng) 2020-07-26 19:19:46

數(shù)據(jù)庫 SQL Server 大數(shù)據(jù)

SQL是數(shù)據(jù)科學專業(yè)人員軍械庫中的一個關鍵齒輪。這是經(jīng)驗之談，如果你還沒有學會SQL，你就不能指望在分析或數(shù)據(jù)科學領域取得成功。

介紹

SQL是數(shù)據(jù)科學專業(yè)人員軍械庫中的一個關鍵齒輪。這是經(jīng)驗之談，如果你還沒有學會SQL，你就不能指望在分析或數(shù)據(jù)科學領域取得成功。

為什么SQL如此重要?

隨著我們進入新的十年，我們生產(chǎn)和消費數(shù)據(jù)的速度正在一天一天的飆升。

為了根據(jù)數(shù)據(jù)做出明智的決策，世界各地的組織都在聘請數(shù)據(jù)專業(yè)人士，如業(yè)務分析師和數(shù)據(jù)科學家，從海量的數(shù)據(jù)寶庫中挖掘信息。

其中一個最重要的工具就是SQL!

結(jié)構(gòu)化查詢語言(SQL)已經(jīng)存在了幾十年。它是一種編程語言，用于管理關系數(shù)據(jù)庫中保存的數(shù)據(jù)。

世界各地的大多數(shù)大公司都在使用SQL。數(shù)據(jù)分析員可以使用SQL訪問、讀取、操作和分析數(shù)據(jù)庫中存儲的數(shù)據(jù)，并生成有用的信息，以推動明智的決策過程。

在本文中，我將討論8種SQL技術(shù)，這些技術(shù)將使你為任何高級數(shù)據(jù)分析問題做好準備。請記住，本文假設你對SQL有非?；镜牧私狻?/p>

目錄

了解數(shù)據(jù)集
SQL技術(shù)1：計算行和項
SQL技術(shù)2：聚合函數(shù)
SQL技術(shù)3：極值識別
SQL技術(shù)4：數(shù)據(jù)切片
SQL技術(shù)5：限制數(shù)據(jù)
SQL技術(shù)6：數(shù)據(jù)排序
SQL技術(shù)7：過濾模式
SQL技術(shù)8：分組、匯總數(shù)據(jù)和分組過濾

了解數(shù)據(jù)集

學習數(shù)據(jù)分析的最好方法是什么?通過在一個數(shù)據(jù)集上執(zhí)行它!

為此，我創(chuàng)建了一個零售商店的虛擬數(shù)據(jù)集?？蛻魯?shù)據(jù)表由ConsumerDetails表示。

我們的數(shù)據(jù)集由以下列組成：

Name –消費者的名稱
Locality –客戶所在地
Total_amt_spend –消費者在商店中花費的總金額
Industry –它表示消費者所屬的行業(yè)

注：我們將使用MySQL5.7進行實驗。你可以從這里下載

https://dev.mysql.com/downloads/mysql/5.7.html

SQL技術(shù)1–計算行和項

Count函數(shù)

我們將從最簡單的查詢開始分析，即計算表中的行數(shù)。我們將使用函數(shù)COUNT()來完成此操作。

太好了!現(xiàn)在我們知道表中的行數(shù)是10。在一個小的測試數(shù)據(jù)集上使用這個函數(shù)似乎沒用。但是當你的行數(shù)達到數(shù)百萬時，它會有很大的幫助!

Distinct函數(shù)

很多時候，我們的數(shù)據(jù)表中充滿了重復的值。為了獲得獨一的值，我們使用了不同的函數(shù)。

在我們的數(shù)據(jù)集中，我們?nèi)绾握业娇蛻羲鶎俚男袠I(yè)?

你猜對了。我們可以通過使用DISTINCT函數(shù)來實現(xiàn)這一點。

你甚至可以使用count和distinct一起計算唯一行的數(shù)量。你可以參考以下查詢：

SQL技術(shù)2–聚合函數(shù)

聚合函數(shù)是任何數(shù)據(jù)分析的基礎。它們?yōu)槲覀兲峁┝藬?shù)據(jù)集的概述。我們將討論的一些函數(shù)是–SUM()、AVG()和STDDEV()。

SUM函數(shù)

我們使用SUM()函數(shù)計算表中數(shù)值列的和。

我們來計算一下每位顧客的消費總額：

在上面的例子中，sum_all是存儲sum值的變量。消費者的消費總額是12560盧比。

AVG函數(shù)

AVG()函數(shù)計算平均值。讓我們找出消費者對我們零售店的平均支出：

顧客在零售店的平均消費額為1256盧比。

STDDEV函數(shù)

如果你查看了數(shù)據(jù)集，然后查看了消費者的平均支出值，你會發(fā)現(xiàn)有些東西遺漏了。平均值并不能提供完整的理解，所以讓我們找到另一個重要的指標——標準差。函數(shù)為STDDEV()。

標準差為829.7，這意味著消費者的支出之間存在很大差距!

SQL技術(shù)3–極值識別

下一種類型的分析是確定極值，這將有助于你更好地理解數(shù)據(jù)。

Max函數(shù)

可以使用MAX()函數(shù)標識最大數(shù)值。讓我們看看如何應用它：

消費者在零售店的最高消費額是3000盧比。

Min函數(shù)

與max函數(shù)類似，我們有MIN()函數(shù)來標識給定列中的最小數(shù)值：

零售店消費者的最低消費額是350盧比。

SQL技術(shù)4–數(shù)據(jù)切片

現(xiàn)在，讓我們關注數(shù)據(jù)分析中最重要的部分之一——數(shù)據(jù)切片。分析的這一部分將構(gòu)成高級查詢的基礎，并幫助你根據(jù)某種條件檢索數(shù)據(jù)。

假設零售店希望找到來自某個地方的客戶，特別是Shakti Nagar和Shanti Vihar地區(qū)。

太好了，我們有3個客戶!我們使用WHERE子句根據(jù)消費者應該居住在當?shù)氐臈l件篩選出數(shù)據(jù)—Shakti Nagar和Shanti Vihar。

我沒有在這里使用OR條件。相反，我使用了IN運算符，它允許我們在WHERE子句中指定多個值。

我們需要找到那些居住在特定地區(qū)(Shakti Nagar和Shanti Vihar)且消費金額超過2000盧比的客戶。

在我們的數(shù)據(jù)集中，只有Shantanu和Natasha滿足這些條件。由于這兩個條件都需要滿足，所以和條件更適合這里。讓我們看看另一個例子。

這一次，零售店希望找回所有消費在1000盧比到2000盧比之間的消費者，以便推出特別的營銷優(yōu)惠。

另一種寫同樣語句的方法是：

只有Rohan在滿足這個標準!

太好了!我們已經(jīng)走到一半了。讓我們在迄今所獲得的知識基礎上再接再厲。

SQL技術(shù)5–限制數(shù)據(jù)

Limit

假設我們要查看由數(shù)百萬條記錄組成的數(shù)據(jù)表。我們不能直接使用SELECT語句，因為這會將整個表轉(zhuǎn)儲到我們的屏幕上，這既麻煩又計算密集。我們可以使用Limit：

上面的SQL命令幫助我們顯示表的前5行。

OFFSET

如果你只想選擇第四行和第五行，你會怎么做?我們將使用OFFSET。OFFSET將跳過指定的行數(shù)。讓我們看看它是如何工作的：

SQL技術(shù)6–數(shù)據(jù)排序

對數(shù)據(jù)進行分類有助于我們對數(shù)據(jù)進行觀察。我們可以使用關鍵字ORDER by來執(zhí)行排序過程。

ORDER BY

關鍵字可用于按升序或降序?qū)?shù)據(jù)進行排序。默認情況下，ORDER BY關鍵字按升序?qū)?shù)據(jù)排序。

讓我們看一個示例，其中我們根據(jù)Total_amt_spend列按升序?qū)?shù)據(jù)進行排序：

要將數(shù)據(jù)集按降序排序，可以按照以下命令進行操作：

SQL技術(shù)7–過濾模式

在前面的部分中，我們學習了如何根據(jù)一個或多個條件過濾數(shù)據(jù)。在這里，我們將學習匹配指定的模式列。為此，我們將首先了解LIKE運算符和通配符。

LIKE

LIKE在WHERE子句中用于搜索列中的指定模式。

通配符

通配符用于替換字符串中的一個或多個字符。它們與LIKE運算符一起使用。最常見的兩個通配符是：

%，表示0個或更多個字符
_，它代表一個字符

在我們的虛擬零售數(shù)據(jù)集中，假設我們想要所有以“Nagar”結(jié)尾的地區(qū)。花點時間來理解問題陳述，并思考如何解決這個問題。

讓我們試著把這個問題分解一下。我們需要以“Nagar”結(jié)尾的所有位置，并且在這個特定字符串之前可以有任意數(shù)量的字符。因此，我們可以在“Nagar”之前使用“%”通配符：

太棒了，我們有6個地方以這個名字結(jié)尾。注意，我們使用LIKE操作符來執(zhí)行模式匹配。

接下來，我們將嘗試解決另一個基于模式的問題。我們需要第二個字符在他們各自的名字中有“a”的消費者的名字。

再一次，我建議你花點時間來理解這個問題，并想出一個解決它的邏輯。

讓我們把問題分解一下。這里，第二個字符需要是“a”。第一個字符可以是任何字符，所以我們用通配符_。

在第二個字符之后，可以有任意數(shù)量的字符，因此我們將這些字符替換為通配符“%”。最終的模式匹配如下所示：

我們有6個人滿足了這個條件。

SQL技術(shù)8–分組、匯總數(shù)據(jù)和分組篩選

我們終于到了SQL中最強大的分析工具之一，使用GROUP BY語句對數(shù)據(jù)進行分組。

這個語句最有用的應用是尋找分類變量的分布。這是通過使用GROUPBY語句和聚合函數(shù)(如–COUNT、SUM、AVG等)來完成的。

讓我們用一個問題陳述來更好地理解這一點。零售商店希望找到與其所屬行業(yè)對應的客戶數(shù)量：

我們注意到，屬于不同行業(yè)的客戶數(shù)量或多或少是相同的。因此，讓我們改成根據(jù)客戶所屬行業(yè)分組，計算出他們的支出總額：

我們可以觀察到，消費金額最大的是屬于制造業(yè)的客戶。這看起來有點容易，對吧?讓我們繼續(xù)更改要求，讓它變得更復雜。

現(xiàn)在，零售商希望找到總銷售額大于2500的行業(yè)。為了解決這個問題，我們將再次根據(jù)行業(yè)數(shù)據(jù)進行分組，然后使用HAVING子句。

HAVING

HAVING子句與WHERE子句類似，但僅用于過濾分組的數(shù)據(jù)。記住，它總是在group by語句之后。

我們只有3個類別滿足條件-航空，國防和制造業(yè)。但為了更清楚，我還將添加ORDER BY關鍵字，使其更直觀：

結(jié)尾

我很高興你做到了。這些是SQL中所有數(shù)據(jù)分析查詢的構(gòu)建知識。你還可以使用這些基礎知識來進行高級查詢。在本文中，我使用了MySQL 5.7來建立示例。

我希望這些SQL查詢能夠幫助你分析復雜數(shù)據(jù)的日常生活。

責任編輯：華軒來源：今日頭條

SQL 數(shù)據(jù)庫工具

51CTO技術(shù)棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營