走近IBM企業(yè)內(nèi)容管理之揭秘全新“軟”實力
原創(chuàng)(接上文: 走近IBM企業(yè)內(nèi)容管理之中國市場成長策略)
上篇文章我們介紹了IBM ECM在中國的市場成長策略,接下來要向大家介紹的便是在IBM的發(fā)展策略下ECM提供了怎樣的產(chǎn)品和技術(shù)能力,在用戶企業(yè)實踐方面又有怎樣的經(jīng)驗可以分享。IBM軟件集團在此前的2012年策略發(fā)布會中曾提出智慧“軟”實力的觀點,并表示希望可以通過軟件技術(shù)幫助企業(yè)實現(xiàn)成長和創(chuàng)新。作為IBM提出的“軟”實力的重要組成部分,新版的企業(yè)內(nèi)容管理(ECM)產(chǎn)品于5月31日在全球同步上市,他們分別是ICA(內(nèi)容分析)、ICC(內(nèi)容捕獲采集)和ICN(文檔、影像、社交內(nèi)容管理)。
ICA (IBM Content Analytics)——內(nèi)容分析
非結(jié)構(gòu)化數(shù)據(jù)的爆炸式增長,使有價值的信息散落在各個“孤島”。這些非結(jié)構(gòu)化信息包括辦公文檔、視頻影像與音頻、HTML網(wǎng)頁、電子郵件、文本、報表等等,這些信息通常被放在企業(yè)的數(shù)據(jù)庫、文件系統(tǒng)、網(wǎng)站及門戶等等IT系統(tǒng)中。來自IBM南加州ECM實驗室的開發(fā)負責(zé)人Susan Chen女士認為,“企業(yè)運營中所使用的數(shù)據(jù),80%以上是非結(jié)構(gòu)的,它的增長率甚至是結(jié)構(gòu)化數(shù)據(jù)的兩倍。這些數(shù)據(jù)來自于每天擁有兩千億往來的電子郵件,再加上影像、辦公文檔、音視頻文件等等,可見是海量數(shù)據(jù)。如果能夠有效利用海量數(shù)據(jù),我們便可以提早發(fā)現(xiàn)問題,提升對客戶的服務(wù),降低作業(yè)成本,能夠發(fā)掘新的收益機會?!盨usan Chen在5月31日——世界無煙日,IBM ECM用戶大會上形象的例舉了一個非結(jié)構(gòu)化數(shù)據(jù)判斷吸煙患病風(fēng)險的例子,她談到,“我們做了一個醫(yī)療界客戶的POC(為觀點提供證據(jù)),我們用ICA分析五千個病人的記錄,其中一個項目是找病人抽煙的習(xí)慣判斷他得心臟病的風(fēng)險性。從有結(jié)構(gòu)式的數(shù)據(jù)中,有35%的記錄中找到了抽煙指標;在文本數(shù)據(jù)中從81%的數(shù)據(jù)找到抽煙指標,并且準確度高了很多。所以如果只對來源數(shù)據(jù)進行分析可能會錯過一些很重要的洞察?!?Susan Chen提到的ICA便是IBM ECM解決方案中的“主角”之一,IBM內(nèi)容分析管理產(chǎn)品,全稱IBM Content Analytics。
“企業(yè)內(nèi)容分析的數(shù)據(jù)對象正在發(fā)生變化,從事務(wù)性的結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)向交互性的非結(jié)構(gòu)化數(shù)據(jù)已成趨勢?!盨usan Chen表示,ICA能夠?qū)Ξ惤Y(jié)構(gòu)數(shù)據(jù)源進行企業(yè)級搜索以及文本分析。筆者了解到,ICA的工作原理是通過分析搜尋功能將捕獲的數(shù)據(jù)輸入UIMA管道(一個用于分析非結(jié)構(gòu)化內(nèi)容的組件架構(gòu)),結(jié)合按照UIMA開放標準編寫的注釋器進行內(nèi)容分析。生成后的數(shù)據(jù)會被添加至索引目錄,然后用戶可以根據(jù)ICA的分析結(jié)果界面進行有選擇的信息發(fā)掘和獲取結(jié)論,以作為準確的業(yè)務(wù)決策參考。ICA的搜索結(jié)果會是怎樣的界面呢?如下圖所示,這八個例子便是ICA分析結(jié)論的代表視圖。
ICA提供三種系統(tǒng)配置方法滿足不同數(shù)據(jù)的需要?!靶?shù)據(jù)比如說做POC的時候可以部署在單個工作站;如果是生產(chǎn)系統(tǒng)可以部署一到數(shù)個服務(wù)站;用大量數(shù)據(jù)的時候可以利用BigInsights做分析?!盨usan Chen表示,“平時的工作中可以支持五千萬到一億的數(shù)據(jù)文檔,ICA的第三版本提供了面向大數(shù)據(jù)的配置。ICA和BigInsights的集成架構(gòu),設(shè)計的重點是要把系統(tǒng)中最耗計算資源的部分,也就是文檔處理前的準備、內(nèi)容分析、建索引和全局分析,通過Hadoop、Map Reduce的模式分布在一群廉價的機器上,這群廉價的機器等于就是一個計算云?!?/P>
下圖是一個亮點,這是ICA能夠支持的30多種異構(gòu)的數(shù)據(jù)源。根據(jù)Susan Chen介紹,這些數(shù)據(jù)源代表著150多種不同的表格。值得一提的是,這些數(shù)據(jù)源中除了支持IBM自己的產(chǎn)品之外,Oracle 11g、微軟SQl Server、Sybase系列均在其中;包括EMC、CA Technologies等廠商的內(nèi)容管理產(chǎn)品也可以成為被ICA捕獲收集的數(shù)據(jù)源。這是怎樣實現(xiàn)的呢?筆者有機會采訪到了IBM軟件集團行業(yè)解決方案ECM開發(fā)部項目總監(jiān) William Lobig先生,并獲得了一些回答。
ICA支持的30多種異構(gòu)數(shù)據(jù)源(點擊放大)
ICC (IBM Content Collector)——內(nèi)容捕獲收集
以微軟的企業(yè)級協(xié)同門戶SharePoint作為數(shù)據(jù)源的例子來說,IBM的內(nèi)容管理解決方案是通過怎樣的技術(shù)實現(xiàn)了數(shù)據(jù)源捕獲?這便涉及到IBM ECM的另一款產(chǎn)品ICC(內(nèi)容捕獲采集),William Lobig表示,“ECM方案中的ICC產(chǎn)品提供了這樣的連接器,以模塊化存在于ECM方案中。這樣的Connect連接器,可以連接不同的數(shù)據(jù)源。具體的關(guān)于怎樣采集和捕獲SharePoint中的數(shù)據(jù),如果要把它轉(zhuǎn)化到IBM的ECM里面,可以利用一個指針一樣的功能,當需要內(nèi)容庫的時候便可以調(diào)用SharePoint,這是按需求來做的。這是IBM自己的解決方案,只不過我們使用了微軟公開的API?!毕聢D為ICC最新3.0版的一些概括。
IBM Content Collector 3.0(點擊放大)
#p#
ICN(IBM Content Navigator)——文檔、影像、社交內(nèi)容管理
ICN是IBM ECM解決方案中的另一款“主角”產(chǎn)品,IBM中國開發(fā)實驗室ECM產(chǎn)品開發(fā)經(jīng)理徐光新女士介紹說,“IBM Content Navigator是用JavaScript編寫的外部客戶端,它支持最新的HTML 5.0。它提供的是組建化的用戶界面的設(shè)計,支持多個Web容器,有很強的可擴展能力,客戶根據(jù)不同的應(yīng)用場景對用戶界面進行定制,也可以很方便地加入自己新的功能?!?/P>
ICN的主要應(yīng)用場景是文檔管理、影像管理和社交互動管理。徐光新談到,“IBM Content Navigator通過API的調(diào)用可以發(fā)揮后端IBM存儲庫的企業(yè)級的管理能力,支持企業(yè)級的生產(chǎn)系統(tǒng),比如影像管理系統(tǒng)或者客服系統(tǒng);我們也加入了新功能支持團隊協(xié)作和社交內(nèi)容的協(xié)作。團隊空間是一個非常典型的團隊協(xié)作的使用場景,利用IBM Content Navigator用戶可以方便的根據(jù)業(yè)務(wù)需求或者項目需求,用IBM Content Navigator建立自己的團隊空間,可以在團隊空間里定義不同的角色,支持基于角色的權(quán)限管理,也可以定義常用的文件夾、文檔模板、搜索模板或者工作流,所有這些都不需要IT人員的參與和幫助?!?/P>
IBM Content Navigator目標使用場景(點擊放大)
IBM Content Navigator的架構(gòu)具備怎樣的組成和特點?徐光新表示,“IBM Content Navigator作為通用的ECM客戶端,主要目標是組件化可重用,有很強的客戶化的能力,有靈活的擴展性。該架構(gòu)最下面是不同的存儲庫,如OnDemand、FileNet內(nèi)容平臺等;再往上是中間服務(wù)層,這一層通過API的調(diào)用和各個存儲庫進行連接,同時提供了跨存儲庫的能力和服務(wù),比如搜索的能力、文檔察看能力;再向上是客戶端的框架,遵循MVC架構(gòu),在模型層提供了JavaScript類庫,它對一些常用的業(yè)務(wù)邏輯進行了封裝,比如和存儲庫連接進行數(shù)據(jù)交換的邏輯,比如請求處理、或者桌面、團隊空間、搜索、工作列表對這些常用業(yè)務(wù)邏輯進行了分裝可以方便的復(fù)用;在模式層之上是viewer層,我們對一些常用的可用控件的提供了JavaScript的類庫,一些常用可視控件包括查詢的表單、目錄樹、工作列表等等,這些可視控件用來構(gòu)建IBM Content Navigator的用戶界面,用戶可以構(gòu)建自己的各種web應(yīng)用?!?nbsp;
徐光新女士談到,“在模型層中ICN提供了Objective-c類庫,用來支持IOS的客戶端應(yīng)用,并且在這個框架上也可以追加微軟的一些客戶端應(yīng)用。在整個框架中,每個層面都提供了很多的擴展點,這為IBM合作伙伴的平臺快速定制和開發(fā)客戶端應(yīng)用提供了便捷?!?/P>
IBM軟件集團行業(yè)解決方案ECM開發(fā)部項目總監(jiān) William Lobig,在IBM ECM中國用戶大會上展示了一版ECM新品發(fā)布路線圖,這讓我們能夠看到IBM ECM在2012年的一些研發(fā)計劃。詳情如下圖。
中國市場中企業(yè)內(nèi)控的契機
就像前篇文章中IBM軟件集團解決方案部企業(yè)內(nèi)容管理產(chǎn)品開發(fā)副總裁John Murphy提到的,最初ECM中的信息生命周期管理產(chǎn)品是針對美國市場的需求而研發(fā),后來看到中國市場的成長與客戶對信息管控的需求后ECM的方案才更多的面向中國的企業(yè)客戶。中國自2009年頒布《企業(yè)內(nèi)部控制基本規(guī)范》后,又于2010年又發(fā)布了相應(yīng)的配套指引,一系列的對企業(yè)的規(guī)范要求應(yīng)該是以法規(guī)遵從、規(guī)避運營及財務(wù)風(fēng)險為主要目的,這便為上市公司及大型企業(yè)提出了對企業(yè)內(nèi)容的管控約束,而中小型企業(yè)亦要參照執(zhí)行。據(jù)筆者了解,以金融行業(yè)為例,企業(yè)需要將內(nèi)容數(shù)據(jù)保留至少7年的時間,以備審查和管理所用。
這種對于企業(yè)內(nèi)控管理的要求不僅僅是來自政府的推動,作為企業(yè)用戶也會希望通過加強內(nèi)控管理,提高工作效率,根據(jù)對企業(yè)運營內(nèi)容的分析更好的做出業(yè)務(wù)決策。有需求便有了市場,面對這種契機,確實會吸引許多IT廠商的目光。John Murphy認為,“從數(shù)據(jù)和信息的生命周期管理來說,對于數(shù)據(jù)的保留來說,應(yīng)該保留真正應(yīng)該保留的數(shù)據(jù)。我們有能力和產(chǎn)品能夠做到這一點,比如在我們的內(nèi)容庫里有這樣一些內(nèi)容,對數(shù)據(jù)來進行保留和控制的能力。在我們的內(nèi)容庫里增加所謂記錄的保持,這種記錄的保持又進一步加強了我們這方面的能力。比如說需要保留的內(nèi)容里面,可能需要保留的時間更長一些,因為你需要這些數(shù)據(jù)和記錄。現(xiàn)在有一些什么變化呢?因為過去更多的關(guān)注哪些東西是必須要保留的。目前在過去能力的基礎(chǔ)上,我們又增加了一種能力,對于那些不需要的信息進行合理的處置。這里也滿足了法規(guī)遵從的要求,就可以按照規(guī)范的要求比如什么時間或者為什么要把那些不需要的數(shù)據(jù)刪除掉。我們認為這種能力是目前IBM公司獨有的能力,可能再過兩三年會有其他公司照搬我們的做法。”
從John Murphy的回答中顯然能夠看出IBM表現(xiàn)的自信,但是筆者認為對于擁有跨國業(yè)務(wù)能力的IT廠商來講,怎樣更好的將技術(shù)方案“本土化”或?qū)⑹亲约鹤畲蟮奶魬?zhàn)。以業(yè)務(wù)需求引導(dǎo)的IT創(chuàng)新能力會日益加深對企業(yè)成長的影響。企業(yè)內(nèi)容管理可以影響企業(yè)運營,幫助業(yè)務(wù)更好的決策,這樣的IT能力或?qū)⒅鸩窖葸M成為現(xiàn)代化企業(yè)的剛性需求。
相關(guān)文章:走近IBM企業(yè)內(nèi)容管理之中國市場成長策略