偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

大數(shù)據(jù)時(shí)代的MicrosoftExcel,了解一下

大數(shù)據(jù)
這是一個(gè)眾所周知并且在日常生活中頻繁使用的工具。是Microsoft辦公軟件三巨頭之一,創(chuàng)建報(bào)告、生成表單甚至是項(xiàng)目規(guī)劃,我們可以使用它做任何事情。

 這是一個(gè)眾所周知并且在日常生活中頻繁使用的工具。是Microsoft辦公軟件三巨頭之一,創(chuàng)建報(bào)告、生成表單甚至是項(xiàng)目規(guī)劃,我們可以使用它做任何事情。

[[316737]]

沒錯(cuò),他就是MicrosoftExcel。

雖然它廣為人知,但其實(shí)人們從未真正學(xué)會(huì)使用它。

雖然對(duì)于大多數(shù)人來說,這不是一個(gè)主要的問題,但是對(duì)于那些需要處理復(fù)雜管道和系統(tǒng)的數(shù)據(jù)處理人員來說,這已經(jīng)開始成為問題了。

如果了解了如何構(gòu)建高效且一致的電子表格,事情會(huì)怎樣?

不僅是在工程任務(wù)上,日常任務(wù)中也有很多好處,它們可以通過提高效率、一致性和可重復(fù)性的設(shè)計(jì)來增強(qiáng)這些文件。

 

Microsoft Excel的常見誤用

當(dāng)Redmond公司于1985年發(fā)布Microsoft Excel時(shí),它已經(jīng)很成功了。新興的個(gè)人計(jì)算機(jī)市場(chǎng)相當(dāng)開放,隨著Windows3.0的推出,Excel的銷售超過了其主要競爭對(duì)手——IBM的Lotus 1-2-3。

從那以后,Windows在整個(gè)個(gè)人電腦市場(chǎng)的占有率超過85%。因此,Excel和所有的Office套件是最常用的軟件。

這一成功并不令人驚訝:MicrosoftExcel易于使用,集合了許多特性,并且具有簡單的用戶界面。每個(gè)人都可以使用它,它無處不在。人們還想要什么?

事實(shí)上,做一個(gè)幾乎每個(gè)人都能使用的產(chǎn)品會(huì)帶來一些對(duì)應(yīng)產(chǎn)物。

Excel不是在學(xué)校學(xué)的。每個(gè)人都可以使用它,所以每個(gè)人都可以用不同的方式使用Excel。沒有明確界定的共識(shí)或良好做法。事實(shí)上,我們從小學(xué)起就不了解這類工具,導(dǎo)致一旦到達(dá)專業(yè)領(lǐng)域才意識(shí)到知識(shí)的缺乏。

Excel不可自動(dòng)化。盡管Excel中嵌入了一種可編程語言(VisualBasic),但仍然難以自動(dòng)執(zhí)行繁重的任務(wù),無法與其他軟件進(jìn)行通信。而且,它仍然僅供內(nèi)部人員使用。

Excel不可擴(kuò)展。人類正處于大數(shù)據(jù)時(shí)代,因此處理無法在Excel中加載的大文件是很常見的。所有這些都取決于個(gè)人的計(jì)算能力。在專用服務(wù)器上運(yùn)行Microsoft軟件似乎也很困難。同樣,它不是為這種用途而設(shè)計(jì)的。

Excel是不可復(fù)制的。最后不得不提,當(dāng)收到一個(gè)包含大量匯總數(shù)據(jù)、顏色、縮寫或公式的Excel文件時(shí),很難理解所有這些東西是如何設(shè)置和收集的。Excel不會(huì)保存構(gòu)建此類文件所涉及的任何工作流狀態(tài)。

 

內(nèi)部數(shù)據(jù)團(tuán)隊(duì)

在過去的二十年中,這四點(diǎn)并不是什么大問題。

但與此同時(shí),一個(gè)“新”領(lǐng)域開始了。隨著計(jì)算機(jī)資源的發(fā)展,公司發(fā)現(xiàn)他們現(xiàn)在擁有大量數(shù)據(jù),但不知道如何處理。

一系列新的工作崗位出現(xiàn)了:數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師、數(shù)據(jù)工程師、機(jī)器學(xué)習(xí)工程師、數(shù)據(jù)開發(fā)工程師等等。最重要的詞是DATA,新崗位的主要目標(biāo)是從海量數(shù)據(jù)中發(fā)現(xiàn)價(jià)值。

有了這些新奇的功能,就可以創(chuàng)建大量的工具來構(gòu)建數(shù)據(jù)管道,更好地可視化數(shù)據(jù)或創(chuàng)建數(shù)學(xué)模型來預(yù)測(cè)未來的值。

但大多數(shù)數(shù)據(jù)仍然保存在Excel文件中。此外,開發(fā)出來的工具有時(shí)使用起來很復(fù)雜,只有訓(xùn)練有素的工程師才能操作它們。

因此,這里仍然存在差距。一方面有很多人仍然使用電子表格作為他們的主要工具之一,另一方面工程師必須處理復(fù)雜的管道,但也要處理這些混亂的文件。

因此,在清理這些文件并將它們集成到整個(gè)數(shù)據(jù)管道中會(huì)損失大量的時(shí)間和金錢。數(shù)據(jù)團(tuán)隊(duì)由學(xué)習(xí)數(shù)學(xué)、計(jì)算機(jī)科學(xué)等學(xué)科的杰出人才組成。

實(shí)際上,工程師們也不學(xué)Excel,他們只知道計(jì)算機(jī)和他們的數(shù)據(jù)管道,所以他們可以討價(jià)還價(jià)。然而,與他們?cè)谶@段時(shí)間所能做的相比,這并沒有附加價(jià)值。

如果從一開始就學(xué)習(xí)如何創(chuàng)建和維護(hù)干凈的文件,而不是讓工程師來處理這些混亂的文件,那會(huì)怎么樣呢?通過遵循簡單的規(guī)則,就可以構(gòu)建高效、可重復(fù)和自動(dòng)化的文件,并停止創(chuàng)建混亂的電子表格。

 

簡單整理電子表格

下面是一個(gè)常見電子表格的例子:

 

大數(shù)據(jù)時(shí)代的MicrosoftExcel,了解一下

 

一個(gè)常見的電子表格

盡管它看起來設(shè)計(jì)得不錯(cuò),但是從可重復(fù)的角度來看并非如此。

通過這個(gè)簡單的示例,筆者將描述什么是最好的做法,以建立一個(gè)容易讓計(jì)算機(jī)理解的文件。

第一行與特定字段不對(duì)應(yīng)。在此應(yīng)將其替換為“年份” (year) ,“類型” (type) ,“產(chǎn)品” (product),“數(shù)量” (quantity)。這就是所謂的“標(biāo)題”。

使用顏色和字體形狀格式化單元格。雖然添加顏色和粗體/斜體文本便于查看,但對(duì)計(jì)算機(jī)卻沒什么用。此外,這些設(shè)置不是目標(biāo),并且對(duì)文件的理解可能會(huì)因用戶而異。

將不同性質(zhì)的數(shù)據(jù)放在同一行。如上所述,它看起來很方便,但實(shí)際上,每一行應(yīng)該只包含一個(gè)觀察值的信息。同樣,聚集總體值(如total或average)與其他值在同一條線上通常不是一個(gè)好方式。這是不一致的,計(jì)算機(jī)也無法理解。

合并單元格。同樣的事情:每一行應(yīng)只包含有關(guān)一個(gè)數(shù)據(jù)觀察的信息。

在同一工作表或標(biāo)簽中中分隔表。用不同的標(biāo)簽區(qū)分年份是使表格更易于閱讀的一種常見做法,但如果計(jì)算機(jī)只讀取一張表,則該表將無法被讀取。

這些是簡單的規(guī)則,不是嗎?以下是應(yīng)用這些準(zhǔn)則后的結(jié)果。

 

大數(shù)據(jù)時(shí)代的MicrosoftExcel,了解一下

 

整齊的電子表格

 

兩全其美

讀者如果不是在技術(shù)領(lǐng)域工作,可能會(huì)說這不是一個(gè)很有用的電子表格。說對(duì)了一部分。這種設(shè)計(jì)無法處理總和或平均值之類的聚合值,而且查找特定值也不太方便。

盡管如此,仍然有一些方法可以處理這些文件,甚至改進(jìn)以前的設(shè)計(jì)。

保存一份數(shù)據(jù)完整的表格。首先,一定要像上面演示的那樣,保留一個(gè)帶有數(shù)據(jù)格式的表單。這樣,數(shù)據(jù)科學(xué)家或任何使用特定軟件的人將能夠加載文件,而不需要在以后處理它。

在另一個(gè)工作表或應(yīng)用程序中處理和聚合數(shù)據(jù)。進(jìn)行求和、添加過濾器、創(chuàng)建繪圖或任何其他數(shù)據(jù)處理,只需打開另一個(gè)工作表并執(zhí)行所需操作。將這個(gè)空間視為一個(gè)實(shí)驗(yàn)室,可以在這里對(duì)數(shù)據(jù)進(jìn)行試驗(yàn)并生成報(bào)告。這樣就可以保護(hù)原始數(shù)據(jù)。

此外,有人可能希望使用或?qū)W習(xí)其他工具?,F(xiàn)在,有很多用戶友好的工具來創(chuàng)建儀表板或報(bào)告。它們提供了很好的設(shè)計(jì)選項(xiàng),并包含了許多構(gòu)建和導(dǎo)出報(bào)告的功能。

如果想更進(jìn)一步,可以使用這些數(shù)據(jù)人員每天都在使用的工具。這些大多是像Python或R這樣的可編程語言,它們帶來了更多的自由和可復(fù)制性。因?yàn)樗鼘?shí)際上是代碼,所以創(chuàng)建圖表和報(bào)告的整個(gè)工作流程都被保存了。因此可以共享代碼,任何人都可以編輯它以適應(yīng)自己的需要。

盡管它比Excel更復(fù)雜,但高自由度允許用戶構(gòu)建任何想要的東西。最后不得不提:它是免費(fèi)的。

 

這只是一種小小的適應(yīng)

改進(jìn)這些文件設(shè)計(jì)有兩個(gè)主要優(yōu)勢(shì):

首先,對(duì)技術(shù)人員有幫助。不僅僅是利他主義,它還可以加速工程師建立數(shù)據(jù)管道的方式,從而增加洞察力,為公司帶來更多的價(jià)值。

其次,通過在團(tuán)隊(duì)甚至公司規(guī)模上應(yīng)用這些規(guī)則,可以最終得到一個(gè)更相似的“語言”來處理這些文件,從而更好地理解和操縱公司的數(shù)據(jù)。

現(xiàn)在是2020年,人們的耳邊充斥著關(guān)于人工智能、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等的流行語,卻不知道它是什么。

事實(shí)上,它始于數(shù)據(jù),存在于每個(gè)人的手上和電腦中。

責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2024-04-11 12:19:01

Rust數(shù)據(jù)類型

2021-09-30 16:28:34

大數(shù)據(jù)數(shù)據(jù)管理企業(yè)

2020-02-10 14:26:10

GitHub代碼倉庫

2015-08-17 13:29:36

大數(shù)據(jù)社交

2022-03-24 13:36:18

Java悲觀鎖樂觀鎖

2020-12-10 08:44:35

WebSocket輪詢Comet

2021-09-17 13:34:57

大數(shù)據(jù)Redis 應(yīng)用

2020-08-08 08:25:58

數(shù)據(jù)科學(xué)認(rèn)證數(shù)據(jù)科學(xué)在線認(rèn)證

2021-01-21 10:23:43

數(shù)據(jù)庫架構(gòu)技術(shù)

2015-05-14 15:56:27

2014-06-10 09:20:14

大數(shù)據(jù)車聯(lián)網(wǎng)

2018-06-05 17:40:36

人工智能語音識(shí)別

2020-04-20 10:55:57

大數(shù)據(jù)人工智能技術(shù)

2019-02-20 14:16:43

2015-04-17 19:46:04

2023-03-02 08:00:55

包管理工具pnpm 包

2019-03-11 14:33:21

Redis內(nèi)存模型數(shù)據(jù)庫

2018-04-25 06:46:52

2019-09-21 21:15:36

MapReduce大數(shù)據(jù)分布式

2017-02-23 10:27:59

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)