偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

年終盤點(diǎn):2017年數(shù)據(jù)科學(xué)發(fā)展的新趨勢

大數(shù)據(jù) 數(shù)據(jù)分析
因?yàn)閿?shù)據(jù)的存在,讓很多新的行業(yè)煥發(fā)出了無限的價(jià)值,社交媒體網(wǎng)站可能就是一個(gè)典型的例子。對(duì)于企業(yè)來說,目前的主要問題就是如何使用收集來的數(shù)據(jù)創(chuàng)造價(jià)值。

2001年,Gartner給出了大數(shù)據(jù)的概念,即大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。這其中點(diǎn)出了大數(shù)據(jù)關(guān)鍵的3V特征,即海量、速度和多樣性,也很明確的為我們指出了大數(shù)據(jù)在哪些方面存在挑戰(zhàn)。但是,16年過去了,現(xiàn)在大數(shù)據(jù)發(fā)展仍然沒有達(dá)到邊界,還是一個(gè)充滿想象力的領(lǐng)域。

因?yàn)閿?shù)據(jù)的存在,讓很多新的行業(yè)煥發(fā)出了***的價(jià)值,社交媒體網(wǎng)站可能就是一個(gè)典型的例子。對(duì)于企業(yè)來說,目前的主要問題就是如何使用收集來的數(shù)據(jù)創(chuàng)造價(jià)值。為此,Dzone社區(qū)調(diào)查了734個(gè)和大數(shù)據(jù)相關(guān)的技術(shù)人員,下面我們就來看看有哪些有趣的結(jié)論。

開源仍然是大趨勢

開源是整個(gè)IT技術(shù)的大趨勢,在大數(shù)據(jù)領(lǐng)域也不例外。據(jù)Dzone的相關(guān)調(diào)查,71% 的受訪者都在使用開源工具進(jìn)行數(shù)據(jù)科學(xué)的相關(guān)工作,只有16%的人在使用商業(yè)工具。開源工具在個(gè)人開發(fā)項(xiàng)目和企業(yè)應(yīng)用程序中得到了快速應(yīng)用。

2016年曝光度***的開源工具Spark,今年的采用率從去年的31%增長到了45%。而今年曝光率***的開源工具,TensorFlow絕對(duì)算得上一號(hào),自谷歌一年半之前發(fā)布以來TensorFlow的采用率已經(jīng)達(dá)到17%。

開源工具的出現(xiàn)讓大數(shù)據(jù)的應(yīng)用推進(jìn)的更快,如果不能快速適應(yīng)上手新的開源工具,那么關(guān)于數(shù)據(jù)科學(xué)的相關(guān)工具就無法開展。

Apache Hadoop仍然是領(lǐng)頭羊

前幾天,有的專家在預(yù)測數(shù)據(jù)庫未來發(fā)展趨勢時(shí),提出了一個(gè)觀點(diǎn)那就是“Hadoop將死”,但是通過具體的數(shù)據(jù),我們發(fā)現(xiàn)Apache Hadoop現(xiàn)在仍然有實(shí)力強(qiáng)勁。65%的數(shù)據(jù)工程師都正在使用或者曾經(jīng)使用過Apache Hadoop。47%的技術(shù)人員使用Yarn進(jìn)行集群管理。62%使用Apache ZooKeeper,55%使用Hive來做數(shù)據(jù)倉儲(chǔ)。

得益于MapReduce處理和存儲(chǔ)數(shù)據(jù)的能力,自2011年發(fā)布以來,Apache Hadoop就一直呈現(xiàn)著高速發(fā)展的趨勢,現(xiàn)在廣受歡迎的眾多先進(jìn)工具都是建立在Hadoop之上。對(duì)于開發(fā)者和數(shù)據(jù)科學(xué)家來說,Hadoop是一盞明燈,有助于他們在未來職業(yè)中的晉升。

當(dāng)然,為了克服MapReduce的局限性,Apache Spark應(yīng)運(yùn)而生,同時(shí)還衍生出一些其他的新技術(shù),例如 Spark SQL、GraphX、 MLib和 Spark Stream等等。

數(shù)據(jù)庫的發(fā)展

關(guān)于數(shù)據(jù)庫的發(fā)展,今年并沒有大格局的變化。據(jù)Dzone的調(diào)查,MySQL被60%的受訪者應(yīng)用于生產(chǎn)和非生產(chǎn)的環(huán)境中。MongoDB被47%的受訪者應(yīng)用于生產(chǎn)環(huán)境中,48%應(yīng)用于非生產(chǎn)環(huán)境中,PostgreSQL被41%的受訪者應(yīng)用于生產(chǎn)環(huán)境中和40%應(yīng)用于非生產(chǎn)環(huán)境中。

而商業(yè)數(shù)據(jù)庫可能是由于許可證的問題,似乎并不如開源數(shù)據(jù)庫那么受歡迎。而其他一些數(shù)據(jù)庫,例如SQLite這樣輕量級(jí)的數(shù)據(jù)庫也會(huì)占據(jù)一定的份額。但是NoSQL數(shù)據(jù)庫的發(fā)展則越來越穩(wěn)健,有56%的數(shù)據(jù)科學(xué)從業(yè)人員選擇使用NoSQL。

編程語言、工具、庫和框架

編程語言、工具、庫和框架

數(shù)據(jù)科學(xué)其實(shí)很大程度上都依賴開源的編程語言、工具、庫和框架。就編程語言來說,Python和R都是數(shù)據(jù)科學(xué)的熱門語言。相比較于R語言來說,Python可能更受歡迎一些,其在受訪者中獲得了63%的支持,而R語言則獲得了61%的支持。

而對(duì)于框架來說,Spark Stream在流數(shù)據(jù)計(jì)算框架中頗受歡迎,在數(shù)據(jù)采集過程中Kafka得到了54%的支持。剩余其它的一些框架則沒有得到超過25%的支持率,不過,這其中還有一匹黑馬,那就是GraphX,其在迭代圖處理類別中獲得了24%的支持率。

責(zé)任編輯:趙寧寧 來源: IT168
相關(guān)推薦

2022-10-24 11:22:53

數(shù)據(jù)科學(xué)機(jī)器學(xué)習(xí)

2020-07-22 11:39:30

物聯(lián)網(wǎng)人工智能技術(shù)

2017-01-05 19:05:28

2017-12-28 16:35:35

數(shù)據(jù)庫融資事件年終盤點(diǎn)

2016-11-28 15:01:08

大數(shù)據(jù)數(shù)據(jù)可視化

2017-01-07 11:27:57

大數(shù)據(jù)結(jié)構(gòu)化數(shù)據(jù)Hadoop

2012-12-25 15:03:05

Android趨勢預(yù)測

2017-02-05 14:43:23

2019-12-24 09:15:16

機(jī)器學(xué)習(xí)技術(shù)人工智能

2022-03-09 14:00:04

數(shù)據(jù)管理大數(shù)據(jù)數(shù)據(jù)管理軟件

2015-01-15 09:55:49

F5IT發(fā)展

2024-07-01 12:44:01

2017-12-22 23:44:50

2019-12-25 11:32:21

存儲(chǔ)數(shù)據(jù)存儲(chǔ)IT

2023-02-02 16:53:25

2022-03-01 15:11:49

數(shù)據(jù)中心能源管理

2023-03-06 09:25:19

數(shù)字化轉(zhuǎn)型趨勢

2025-01-08 14:28:35

2023-06-05 08:48:47

數(shù)字化轉(zhuǎn)型趨勢

2018-01-08 07:58:36

開源容器云計(jì)算
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)