零售業(yè)如何用Hadoop開啟大數(shù)據(jù)之門?
在過去幾年,全球零售商一直試圖利用大數(shù)據(jù)創(chuàng)造價值。由于其大數(shù)據(jù)分析基礎(chǔ)架構(gòu)的限制,許多工作被一再推遲。Hadoop為這些零售商打開了新的大門,它可以解決他們在過去幾年在大數(shù)據(jù)領(lǐng)域面臨的許多問題和挑戰(zhàn)。
Hadoop:跨多門編程語言的大數(shù)據(jù)解決方案
Hadoop背后的技術(shù)最初是由Google大約在10年前開發(fā)的。核心代碼主要是用Java編寫的,但有一些是用C編寫的。然而,它運行在一個稱為MapReduce的編程模型中,這允許開發(fā)人員用其他語言創(chuàng)建新的Hadoop代碼。
由于MapReduce環(huán)境可以接受不同的編程語言代碼,因此它非常通用。它可以提取,分析和操作許多不同來源的大數(shù)據(jù)。它使用各種算法來進行關(guān)聯(lián)規(guī)則學(xué)習(xí),聚類,分類和回歸。這些算法依賴于各種函數(shù),包括貝葉斯,期望***化和FP-Grown算法。
Cloudera的***執(zhí)行官Mike Olson表示,Hadoop目前仍處于起步階段,但它已經(jīng)在塑造零售和金融領(lǐng)域廠商使用大數(shù)據(jù)的方式了。
“Hadoop平臺旨在解決大量數(shù)據(jù)(可能是復(fù)雜的和結(jié)構(gòu)化的,并且不能很好地融入表中的數(shù)據(jù))的混合問題。它適用于深度和計算量大的分析,例如聚類和定位...在在線零售中,如果想為客戶提供更好的搜索答案,以提高用戶的購買欲望,Hadoop可以很好地解決這一問題。
Sears控股公司分部副總裁Aashish Chandra表示,Hadoop已經(jīng)幫助公司降低了運營成本,提高了銷售額。Chandra說,以前的大數(shù)據(jù)提取工具缺乏他們所需要的功能。
使用Hadoop挖掘銷售點大數(shù)據(jù)
銷售點數(shù)據(jù)在零售業(yè)中起著非常重要的作用。公司依靠銷售點大數(shù)據(jù)來預(yù)測未來銷售,管理庫存和項目人員需求。
有許多銷售點工具可以聚合銷售信息并將其存儲在大數(shù)據(jù)集中。然而,零售商難以用常規(guī)工具從PoS中挖掘大數(shù)據(jù),即使它就存儲在SQL數(shù)據(jù)庫中。Hadoop使零售商更容易從客戶數(shù)據(jù)庫訪問信息,此數(shù)據(jù)可以轉(zhuǎn)換為其他格式,并與其他文件中的數(shù)據(jù)集合并。
New Horizons CLC的John Soto聲稱Hadoop是零售業(yè)主要的改變者。
“大型零售商永遠不可能利用其傳統(tǒng)的大數(shù)據(jù)基礎(chǔ)設(shè)施進行這種分析。存儲如此多的歷史數(shù)據(jù)是十分昂貴的,并且數(shù)據(jù)類型復(fù)雜,并且需要相當多的準備以允許它與PoS事務(wù)組合。Hadoop解決了這兩個問題,并且可以運行比舊系統(tǒng)更復(fù)雜的分析。”
Hadoop可以讓零售商預(yù)測分析挑戰(zhàn)
Hadoop消除了零售商在利用大數(shù)據(jù)方面的一些障礙。這里有一些該技術(shù)帶來的好處:
1、數(shù)據(jù)挖掘能力強。許多零售商都存儲了TB級別的數(shù)據(jù)。這些數(shù)據(jù)集往往難以提取,因為它們有很深的嵌套。Hadoop有非常復(fù)雜的索引算法,因此它可以提取以前無法為大數(shù)據(jù)應(yīng)用程序使用的數(shù)據(jù)。
2、與不同的數(shù)據(jù)格式兼容。零售商以許多不同的格式存儲數(shù)據(jù)。內(nèi)部財務(wù)數(shù)據(jù)通常存儲在.csv文件中。零售商一直在努力進行審計,因為他們無法比較結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)集的數(shù)據(jù)。Hadoop可以提取多種格式的數(shù)據(jù),進行分析并以更具凝聚力的形式呈現(xiàn),它使大數(shù)據(jù)分析專家能夠從多個來源的數(shù)據(jù)集之間尋找相關(guān)性。
零售商已經(jīng)發(fā)現(xiàn)了使用Hadoop的好處:
1、Staples使用Hadoop分析大數(shù)據(jù)和預(yù)測未來的銷售,這有助于他們更有效地分配資源給人員和庫存。 據(jù)報道,自使用Hadoop以來,Staples的促銷成本降低了25%。
2、亞馬遜使用Hadoop來改進欺詐檢測模型。據(jù)報告,他們將信用卡欺詐減少了50%,因為他們可以更容易地識別出信用不佳的人。
3、相比之前,Brands可以得到更詳細的客戶信息,這有助于他們改進營銷策略。使用Hadoop和預(yù)測分析的零售商的銷售額增長了73%。
零售商只是開始認識到Hadoop和大數(shù)據(jù)的潛力。根據(jù)DeZyre所說,Hadoop***的優(yōu)勢之一是它可以幫助零售商實時識別和應(yīng)對挑戰(zhàn)。這對防止欺詐尤其重要,因為罪犯總是在考慮新的騙局。
“操縱者總是在發(fā)明新的欺詐工具和技術(shù),零售商必須使用零售分析來識別欺詐活動,防止它們再次發(fā)生。使用大數(shù)據(jù)技術(shù)(如Hadoop,MapReduce和Spark),可以對超過50 PB的數(shù)據(jù)執(zhí)行分析,以準確預(yù)測潛在風(fēng)險。”