偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

開源搜索應用進入企業(yè) 應對大數(shù)據(jù)搜索

開源
Twitter、Facebook和國會圖書館等所有這些機構都有令人心煩意亂的大量的結構化和非結構化數(shù)據(jù)。這些數(shù)據(jù)必須做出索引并且能夠快速搜索。

  Twitter、Facebook和國會圖書館等所有這些機構都有令人心煩意亂的大量的結構化和非結構化數(shù)據(jù)。這些數(shù)據(jù)必須做出索引并且能夠快速搜索。在Twitter的案例中,每天要索引大約3億條新信息。

  因此,這種機構將進入尚未充分開發(fā)的開源軟件搜索應用領域是不會讓人感到意外的。這不僅是為了節(jié)省成本,而且是為了迅速地客戶化和修改應用程序。此外,開源軟件有一個活躍的社區(qū),能夠幫助解決相關的問題。

[[77603]]

  但是,企業(yè)用戶如何呢?據(jù)市場研究公司Gartner稱,在普通的企業(yè),目前大約80%的信息是非結構化數(shù)據(jù),如文本、電子郵件、博客和視頻等。這個比例正在增長。所有這些數(shù)據(jù)都可能有價值。目前,每一個網(wǎng)站預計都會像互聯(lián)網(wǎng)搜索引擎那樣盡快地查詢和制作相關的結果。Gartner分析師惠特·安德魯斯(Whit Andrews)稱,實際上,人們目前做的一切事情都需要搜索技術。每一個人都認為搜索功能將嵌入到一切事情中。 

  安德魯斯補充說,現(xiàn)在,大多數(shù)機構的搜索能力都有限。這些搜索能力通常以SQL查詢?yōu)榛A或者以具體的格式或報告為基礎。這種范例將很快被打破,因為大量的數(shù)據(jù)都非常大,并且在每周7天每天24小時的環(huán)境中迅速地出現(xiàn)。 

***的搜索

  各種規(guī)模的企業(yè)都在開始探索開源軟件搜索應用以便初步了解其收集的結構化和非結構化數(shù)據(jù)。一個這種產(chǎn)品是位于加州圣馬特奧市的Lucid Imagination軟件公司開發(fā)的開源軟件搜索平臺Lucene Solr。 

  Black Duck Software旗下的開源軟件咨詢公司Olliance Group的高級經(jīng)理格雷格·奧爾森(Greg Olson)稱,對于開源軟件搜索應用的興趣是在三年前開始增強的。當時,我們看到創(chuàng)建了Lucid Imagination公司。這家公司是開源軟件的一個商業(yè)性技術支持的來源。那是很好的指示器,表明了對這種服務的主流需求或者圍繞類似Lucene的技術的解決方案的需求。

  安德魯斯稱,Lucene是為大量使用搜索的人提供的。這是沒有錯誤的。Lucene對于需要高級搜索產(chǎn)品或服務的人是非常重要的。它的典型用戶是需要在技術應用中進行大規(guī)模搜索的人。那是使用Lucene的好地方。你需要能夠搜索數(shù)量極大的東西。當一個內(nèi)部網(wǎng)需要在下周四之前進行一次搜索的時候,你看不到使用Lucene的地方。

  還有一些廠商提供基于同樣的Lucene開源軟件技術的輕型搜索工具。例如,搜索團隊負責人Aye Thu稱,在線零售商Zappos.com使用Lucene Solr驅(qū)動其每個月的6300萬用戶的查詢。但是,這家公司在內(nèi)部部署了Elasticsearch開源軟件搜索引擎,用于非網(wǎng)站重要的系統(tǒng)或者非重要性能的服務。

  許多其它搜索應用廠商最近已經(jīng)被軟件巨頭收購,產(chǎn)生了其未來方向的問題。微軟在2008年收購了搜索應用Fast Search & Transfer并且通過SharePoint使用這個技術。在2011年8月,惠普收購了英國的Autonomy。兩年之后,甲骨文宣布計劃收購Endeca。Endeca提供非結構化數(shù)據(jù)管理、網(wǎng)絡商務和商務智能解決方案。

  安德魯斯稱,雖然這些軟件巨頭都沒有宣布它們將停止支持新收購的搜索引擎,但是,每一次你的技術提供商被收購,都會讓你感到緊張,特別擔心你是不是另一個技術提供商。

  現(xiàn)在,剩下了Lucene Solr作為主要的獨立的企業(yè)搜素平臺。Lucene報告稱,Lucene Solr軟件每個月的下載量達到20至30萬份。

  EMC正在使用Lucene Solr為其關系數(shù)據(jù)庫服務建立一個文本分析插件。EMC負責研發(fā)的高級主管George Chitouras稱,如果你考察企業(yè)搜索行業(yè),大多數(shù)老牌廠商或者被收購,或者被擱在一邊。從我的觀點看,最有增長勢頭的技術和成熟最快的技術是Lucene Solr技術。

  Chitouras稱,雖然EMC還沒有把開源軟件搜索功能用于自己的企業(yè)內(nèi)部,但是,他看到幾乎任何行業(yè)都在使用這個技術。任何大公司都使用信息檢索,無論這個公司是做呼叫中心處理、客戶關系管理、還是技術創(chuàng)新管理。

開源軟件的選擇

  在2011年年中,在開源軟件搜索領域的專家的支持下,Lucid Imagination為該企業(yè)發(fā)布了基于訂閱的企業(yè)軟件包LucidWorks。 目前,有100家企業(yè)客戶使用這個產(chǎn)品。Lucid在2月份還發(fā)布了基于云的搜索即服務版的產(chǎn)品。

  Lucid***執(zhí)行官Paul Doscher認為,有三種需求推動機構使用企業(yè)開源軟件搜索。***,人們要使用有效的搜索驅(qū)動其網(wǎng)站,但是,他們不想要搜索技術所需要的麻煩的基礎設施、管理和維護。他說,LucidWorks連接到他們的網(wǎng)站,提取數(shù)據(jù)并且在搜索框中創(chuàng)建回應,其能力超過了他們現(xiàn)有的搜索技術。

  第二,當大型企業(yè)要有一個沙箱以開發(fā)原型應用程序而又沒有做這些事情的開發(fā)人員技術專長、基礎設施或者硬件的時候,大型企業(yè)會轉(zhuǎn)向開源軟件搜索。

  第三,企業(yè)會支持開源軟件的選擇,如果他們正在設法擴展他們目前擁有的數(shù)據(jù)價值的話。Doscher稱,這種搜索即服務應用對于這些用戶可能會有吸引力。同Salesforce.com提供的功能類似,Lucid的云應用允許用戶獲取在其SaaS應用中的信息,然后更有效地搜索這種信息或者把這個信息與企業(yè)中的其它信息或者網(wǎng)絡上的其它信息結合在一起。你可以使用它作為一個應用開發(fā)平臺去開發(fā)更豐富的和更有效的信息應用。

  Lucid***科學家Grant Ingersoll還看到一些混合應用開源軟件搜索的情況。他說,你在自己的數(shù)據(jù)中心內(nèi)部配置你自己的應用,然后你把過剩的容量用于云支持的版本。

  Doscher稱,為了保持領先于競爭對手的地位,Lucid Imagination計劃進入商務智能和數(shù)據(jù)倉庫領域并且與大數(shù)據(jù)技術結合在一起。向這些領域使用開源軟件搜索技術將緩解從太多的數(shù)據(jù)、不充分的索引和搜索能力中建立搜索的壓力。

  Doscher表示,企業(yè)未來存儲的信息量將是驚人的。開源軟件搜索技術將解決這個數(shù)據(jù)泛濫的問題。

  Doscher稱:“我認為谷歌已經(jīng)為互聯(lián)網(wǎng)做了這個事情。像我們這樣的技術將通過幫助客戶化企業(yè)內(nèi)部信息為企業(yè)做這個事情。最終,你將能夠在企業(yè)內(nèi)部有自然語言的查詢,接觸到企業(yè)運行的所有不同的數(shù)據(jù)庫、應用程序和ERP應用。這將允許人們得到與他們感興趣的話題有關的即時的、實時信息。

責任編輯:黃丹 來源: LUPA開源社區(qū)
相關推薦

2012-05-09 10:16:33

開源搜索平臺lucene

2016-08-08 17:37:23

大數(shù)據(jù)搜索

2018-07-05 22:38:23

大數(shù)據(jù)搜索引擎SEO

2012-02-27 09:39:11

數(shù)據(jù)中心大數(shù)據(jù)

2013-03-20 10:40:19

大數(shù)據(jù)大數(shù)據(jù)應用

2015-08-24 09:18:58

大數(shù)據(jù)

2013-12-31 10:38:22

大數(shù)據(jù)

2016-10-13 09:52:53

大數(shù)據(jù)搜索技術

2016-10-08 22:02:01

大數(shù)據(jù)時代大數(shù)據(jù)

2014-06-23 15:12:29

大數(shù)據(jù)

2013-04-16 11:20:42

商務智能CRMHadoop

2012-10-08 10:47:41

谷歌虛擬大腦

2012-08-06 09:52:03

Android搜索功能

2012-06-13 16:17:27

大數(shù)據(jù)運維

2012-04-25 13:59:22

大數(shù)據(jù)

2013-02-28 10:04:27

英特爾Hadoop大數(shù)據(jù)

2012-03-07 23:13:50

應用

2024-08-07 10:39:47

ChatGPT自然語言企業(yè)數(shù)據(jù)

2013-12-08 21:33:31

谷歌移動搜索應用內(nèi)搜索
點贊
收藏

51CTO技術棧公眾號