什么是非關(guān)鍵業(yè)務(wù)數(shù)據(jù)?
第一是以溝通為中心,主要是以溝通消息為主。溝通過(guò)程中會(huì)形成一些記錄或者是一些結(jié)果出來(lái),這些結(jié)果會(huì)保存在各個(gè)郵件系統(tǒng),但是以人為中心的時(shí)候,企業(yè)中的用戶(hù),他們會(huì)寫(xiě)一些文件或者是做一些文檔,往往以共享、協(xié)同或者是搜索來(lái)去做的事情。這個(gè)時(shí)候文件實(shí)際上在個(gè)人電腦或者在服務(wù)器上面,比如說(shuō)共享服務(wù)器或者是其他一些地方或者是郵件,從郵件把附件找出來(lái),對(duì)文件進(jìn)行編輯。第三,就是傳統(tǒng)以業(yè)務(wù)為中心,比如說(shuō)ERP、CRM客戶(hù)關(guān)系系統(tǒng)或者是供應(yīng)鏈系統(tǒng)包括很多合同,面向結(jié)構(gòu)化的數(shù)據(jù),這個(gè)時(shí)候需要登錄業(yè)務(wù)系統(tǒng)或者是新找到一個(gè)銷(xiāo)售客戶(hù),需要把信息登錄上去,電話(huà)或者是地址各種信息登錄上去,信息最終保存到業(yè)務(wù)系統(tǒng)當(dāng)中去了。這里的主要目標(biāo)就是非關(guān)鍵業(yè)務(wù),更多是文件或者是文檔,或者是半結(jié)構(gòu)化、結(jié)構(gòu)化、非結(jié)構(gòu)化的結(jié)構(gòu)存在的,我們可以看到溝通和以人為中心的時(shí)候,各個(gè)之間是要交互的,實(shí)際上數(shù)據(jù)最終是分散的,比如存在郵件、即時(shí)通訊、OA,存在各個(gè)地方去了。早期我們企業(yè)說(shuō)白了是以結(jié)構(gòu)化應(yīng)用數(shù)據(jù),以業(yè)務(wù)性為中心的時(shí)候,對(duì)數(shù)據(jù)關(guān)注度不夠,第一個(gè)分散很難管,第二個(gè)這個(gè)數(shù)據(jù)量相當(dāng)大,結(jié)構(gòu)化應(yīng)用顆粒度相對(duì)小,比如盤(pán)陣和塊存儲(chǔ)來(lái)存儲(chǔ),幾個(gè)T就可以搞定。但是如果集中去存這些非結(jié)構(gòu)化,非關(guān)鍵業(yè)務(wù)數(shù)據(jù)的時(shí)候,它的顆粒度相對(duì)要大,難于管理,而且沒(méi)有一定的邏輯,往往是跟人相關(guān)或者是跟溝通相關(guān)。企業(yè)非關(guān)鍵業(yè)務(wù)往往是在零散的存儲(chǔ)、分散性的存儲(chǔ),如果說(shuō)隨著新的第二存儲(chǔ),分布式存儲(chǔ)、對(duì)象存儲(chǔ)成熟以后,企業(yè)會(huì)考慮到把分散的數(shù)據(jù)存到分布式或者對(duì)象上面去。這時(shí)會(huì)產(chǎn)生新的業(yè)態(tài),怎么樣把溝通為中心的應(yīng)用或者以人為中心的應(yīng)用,甚至是以業(yè)務(wù)中心為應(yīng)用這些非結(jié)構(gòu)化,非關(guān)鍵性的數(shù)據(jù)怎么能夠存到對(duì)象和分布式,這是數(shù)據(jù)在其中的表現(xiàn)形式一個(gè)簡(jiǎn)單的分析。第二存儲(chǔ)的應(yīng)用場(chǎng)景在不斷擴(kuò)大傳統(tǒng)的塊和文件市場(chǎng)在下降,分布式增長(zhǎng)很快,比例不多說(shuō)了。第二存儲(chǔ)應(yīng)用場(chǎng)景也在不斷擴(kuò)大,剛才梁總談到了數(shù)據(jù)保護(hù)、數(shù)據(jù)備份、數(shù)據(jù)存儲(chǔ),包括逐漸延展到數(shù)據(jù)管理,數(shù)據(jù)管理和數(shù)據(jù)存儲(chǔ)是兩層關(guān)系,它倆之間從技術(shù)視角來(lái)看沒(méi)有絕對(duì)的關(guān)聯(lián)性,還有從共享、數(shù)據(jù)分析、數(shù)據(jù)安全領(lǐng)域。
從傳統(tǒng)分布式存儲(chǔ)、對(duì)象存儲(chǔ)、第二存儲(chǔ),以存儲(chǔ)保護(hù)和備份的場(chǎng)景主要延展到管理共享和分析,我們先看看管理。所謂談到管理一定有集中的概念,怎么能夠管得住。第二非結(jié)構(gòu)化數(shù)據(jù)或者非關(guān)鍵業(yè)務(wù)數(shù)據(jù)更強(qiáng)調(diào)共享。共享剛剛談到了,我在郵件里面發(fā)給別人,別人在郵件里面接收,如果在企業(yè)微信或者是即時(shí)通訊工具共享數(shù)據(jù)的時(shí)候,只能在這里做,或者在個(gè)人電腦做或者是其他的方式去做。這個(gè)時(shí)候共享的能力僅僅局限于文件本身,共享的通道和入口是很零散的過(guò)程,共享并不是很方便。既然這個(gè)非結(jié)構(gòu)化的數(shù)據(jù)價(jià)值出來(lái)以后一定是在存儲(chǔ)集中完成以后,能夠?qū)蚕砟芰υ偃ネ诰騼r(jià)值。比如說(shuō)是不是基于合同優(yōu)化過(guò)程包括供應(yīng)鏈過(guò)程,是不是能夠把文件快速發(fā)送出去或者共享出去,這就是在分析過(guò)程中,包括數(shù)據(jù)安全,數(shù)據(jù)安全除了數(shù)據(jù)備份和保護(hù),在結(jié)構(gòu)化應(yīng)用包括容器方面,從應(yīng)用視角來(lái)看,非結(jié)構(gòu)化數(shù)據(jù)備份是一個(gè)很復(fù)雜的事情。比如,企業(yè)有一萬(wàn)員工,備份5000員工個(gè)人PC數(shù)據(jù),這就是很復(fù)雜的事,不單單是存儲(chǔ),一個(gè)PB的存儲(chǔ)。第二個(gè)還有網(wǎng)絡(luò),第三個(gè)用什么樣的軟件來(lái)存,如果是傳統(tǒng)的NBU來(lái)做,那個(gè)成本一個(gè)點(diǎn)要三百塊錢(qián)的話(huà),5000個(gè)人就是150萬(wàn),企業(yè)很難推行,是不是有新的方法幫助客戶(hù)完成個(gè)人數(shù)據(jù),甚至是應(yīng)用中的一些非結(jié)構(gòu)化數(shù)據(jù)備份能力?
從場(chǎng)景來(lái)看怎么樣有新的場(chǎng)景和新的方法。協(xié)議互通、EC、重刪壓縮、高密、全閃、內(nèi)置搜索引擎等技術(shù)達(dá)成極致效率是分布式存儲(chǔ)的核心競(jìng)爭(zhēng)力。軟硬件深度配合,云上云下協(xié)同,實(shí)現(xiàn)極致性能和智能管理成為分布式存儲(chǔ)發(fā)展的重要趨勢(shì)。
應(yīng)用融合提供的是數(shù)據(jù)服務(wù)橋梁一定是數(shù)據(jù)服務(wù)的概念,數(shù)據(jù)服務(wù)應(yīng)該為應(yīng)用能夠提供服務(wù)這樣一個(gè)能力。從及時(shí)性能和智能管理應(yīng)該成為分布式發(fā)展重要趨勢(shì),結(jié)合所有分布式或者說(shuō)對(duì)象核心競(jìng)爭(zhēng)力發(fā)展趨勢(shì)會(huì)影響到整個(gè)非關(guān)鍵業(yè)務(wù)數(shù)據(jù)管理能力。換句話(huà)說(shuō),第二存儲(chǔ)是基礎(chǔ),這個(gè)基礎(chǔ)打的牢靠,后面才有可能做這件事情。
如何提升非關(guān)鍵業(yè)務(wù)數(shù)據(jù)的價(jià)值?
提升非關(guān)鍵業(yè)務(wù)數(shù)據(jù)價(jià)值,首先數(shù)據(jù)要有價(jià)值,第一,企業(yè)逐漸向互聯(lián)網(wǎng)轉(zhuǎn)型,數(shù)字化轉(zhuǎn)型或者是互聯(lián)網(wǎng)轉(zhuǎn)型,這種傳統(tǒng)的應(yīng)用模式,數(shù)據(jù)庫(kù)加存儲(chǔ)。制造業(yè)里,現(xiàn)在推電商賣(mài)空調(diào),開(kāi)店要借很多的服務(wù)器,不管是公有云資源還是私有云的服務(wù)器,借大量的服務(wù)器來(lái)做業(yè)務(wù)形態(tài),如果是傳統(tǒng)模式來(lái)看,比如原來(lái)應(yīng)用可能支持內(nèi)部用戶(hù)就一萬(wàn)人企業(yè),只能支持一萬(wàn)人企業(yè),應(yīng)用形態(tài)是能夠定義出來(lái)的,比如說(shuō)需要十臺(tái)服務(wù)器,需要多少存儲(chǔ),需要多少備份,是可以算出來(lái)的。但是在互聯(lián)網(wǎng)行業(yè)里面,尤其是做手機(jī)銀行,大部分建手機(jī)銀行,這種形態(tài)來(lái)看用戶(hù)數(shù)是不確定的,這個(gè)時(shí)候怎么搭建應(yīng)用平臺(tái),這是需要反反復(fù)復(fù)思考的問(wèn)題。
第二,分布式存儲(chǔ)解決了海量數(shù)據(jù)的存儲(chǔ)問(wèn)題,但企業(yè)如何解決數(shù)據(jù)管理的問(wèn)題,管理就包含很多剛剛談到的共享、分析甚至以后的備份,新的備份問(wèn)題怎么去做。第三個(gè)數(shù)據(jù)安全、合規(guī),以前結(jié)構(gòu)化應(yīng)用很多方法在保護(hù)它的安全甚至保護(hù)合規(guī),但是非結(jié)構(gòu)化應(yīng)用,如果用傳統(tǒng)方式來(lái)做那個(gè)代價(jià)太高昂,對(duì)于非關(guān)鍵業(yè)務(wù)數(shù)據(jù)本身的價(jià)值來(lái)說(shuō),可能企業(yè)也做不起,我們需要用新的方法來(lái)迎合數(shù)據(jù)安全和合規(guī)的問(wèn)題從這三個(gè)點(diǎn)來(lái)看,剛剛談到企業(yè)的價(jià)值要和傳統(tǒng)做結(jié)構(gòu)化運(yùn)營(yíng)有一定的轉(zhuǎn)化轉(zhuǎn)型。從金融行業(yè)、制造業(yè)、醫(yī)療行業(yè),這三個(gè)行業(yè)里面找了一些典型的應(yīng)用,我們先看一下,金融行業(yè)里面做的文件數(shù)據(jù)管控。金融行業(yè)相對(duì)來(lái)說(shuō)也算走得比較快,大規(guī)模完成了信息化平臺(tái)建設(shè),比如像OA、郵件反反復(fù)復(fù)更新好幾輪了,包括以企業(yè)微信、釘釘?shù)纫沧呦蛄似髽I(yè)的平臺(tái)化。第二可能從門(mén)戶(hù)角度,剛剛談到了OA,包括生產(chǎn)應(yīng)用、安全,包括第三方接口都做了很多場(chǎng)景建設(shè)。
如果企業(yè)以前大規(guī)模自己開(kāi)發(fā)了一些,即時(shí)通信軟件,但是效果不是特別好,企業(yè)微信走到金融客戶(hù)以后,它有一個(gè)訴求。第一,所有這些數(shù)據(jù)應(yīng)該是能夠通過(guò)企業(yè)微信快速轉(zhuǎn)發(fā)或共享;第二,所有這些數(shù)據(jù)保存,比如說(shuō)移動(dòng)端不能落到本地,剛剛談到數(shù)據(jù)安全,不能夠落在本地,也就是手機(jī)端不能存文件只能看。第三個(gè)這個(gè)數(shù)據(jù)必須落在企業(yè)內(nèi)部,一方面引入了公有云服務(wù),這也是一個(gè)趨勢(shì),以后應(yīng)用會(huì)逐漸地用到公有云的SaaS服務(wù),突破口就在移動(dòng)即時(shí)通訊工具,企業(yè)微信這個(gè)突破口,這個(gè)數(shù)據(jù)要保存內(nèi)部,同時(shí)應(yīng)用是互聯(lián)網(wǎng)化的SaaS服務(wù),這是第三個(gè)訴求。第四,所有在企業(yè)內(nèi)部安全部署都要走DIM,要符合安全管理一套策略,數(shù)據(jù)的流轉(zhuǎn)包括中間痕跡跟蹤都要做明確。
同時(shí)企業(yè)生產(chǎn)應(yīng)用接口,ERP的生產(chǎn)或者類(lèi)似合同管理、合規(guī)性管理,類(lèi)似所有的入口都應(yīng)該希望能夠共享互聯(lián)互通。以前企業(yè)要做內(nèi)審的時(shí)候,其他的應(yīng)用要導(dǎo)出多少文件以后做內(nèi)審檢查?,F(xiàn)在來(lái)看,是不是內(nèi)審系統(tǒng)直接看到所有權(quán)限或者允許做的檢查的事情,這是從用戶(hù)文件管理場(chǎng)景需求。第二個(gè)很大的一個(gè)訴求來(lái)自于員工,金融行業(yè)桌面云或者是系統(tǒng)化更多在研發(fā)領(lǐng)域比較多,真正在辦公行業(yè)還是以個(gè)人電腦,就是純物理機(jī)方式,筆記本的方式,甚至有的企業(yè)出現(xiàn)了平板電腦。也就是說(shuō),員工以前開(kāi)會(huì)找數(shù)據(jù),領(lǐng)導(dǎo)跟你要數(shù)據(jù)都得從自己的電腦找,甚至從部門(mén)去找,這個(gè)面臨一個(gè)問(wèn)題,既然有一定價(jià)值就要考慮備份的問(wèn)題,通過(guò)評(píng)估一套傳統(tǒng)方式備份代價(jià)太高了。換句話(huà)說(shuō),幾萬(wàn)人梳理出核心員工也有大幾千人,這些人的備份就是很困難的事情。第三,我們企業(yè)這些應(yīng)用要打通,以前我們結(jié)構(gòu)化應(yīng)用靠傳統(tǒng)方式去做是可以的,但是非結(jié)構(gòu)化數(shù)據(jù)怎么打通?我們把這種文件作為一個(gè)應(yīng)用附件,它本身并不參與到客戶(hù)應(yīng)用流程中去,它提供的是什么?共享的能力,因?yàn)槲冶旧硪彩亲鰬?yīng)用出身的,其實(shí)對(duì)于應(yīng)用來(lái)講,它最喜歡什么事情?首先第一個(gè)不用關(guān)注存儲(chǔ)存在哪里,第二個(gè)存儲(chǔ)權(quán)限管理信息或者是數(shù)據(jù)管理信息是能夠被我所用,我只要用它就可以,因?yàn)槲疑厦嬗幸惶走壿?,每個(gè)應(yīng)用都有業(yè)務(wù)邏輯的概念。視角和關(guān)注度放在邏輯角度來(lái)看,按照需求隨機(jī)取所需要的數(shù)據(jù),能夠提供共享,權(quán)限管理甚至是安全的管理,這就夠了。通過(guò)這樣一種方式,我們幫助客戶(hù)建立這樣的數(shù)據(jù)服務(wù)平臺(tái),比如說(shuō)提供共享的能力,包括一些版本能力,包括權(quán)限管理能力,包括一些用戶(hù)管理的統(tǒng)計(jì)報(bào)表,還有一些搜索的東西。
非結(jié)構(gòu)化數(shù)據(jù)管理價(jià)值第一點(diǎn)是搜索,能夠幫助用戶(hù)快速找到這個(gè)數(shù)據(jù),以前我們說(shuō)找數(shù)據(jù)只能從自己的電腦去找,甚至去郵件里面去找,現(xiàn)在是不是在微信里面,企業(yè)微信就可以找到這個(gè)文件,這個(gè)文件有可能在郵件系統(tǒng),我能不能找到郵件。我們通過(guò)這樣一層數(shù)據(jù)服務(wù)的能力,通過(guò)跟企業(yè)應(yīng)用來(lái)做橋梁,相當(dāng)于中間是一個(gè)橋梁,把各個(gè)應(yīng)用之間的數(shù)據(jù)匯總到數(shù)據(jù)服務(wù)平臺(tái),通過(guò)數(shù)據(jù)服務(wù)平臺(tái)給企業(yè)應(yīng)用提供數(shù)據(jù)共享、數(shù)據(jù)權(quán)限管理,數(shù)據(jù)安全管理。這樣的話(huà),企業(yè)的應(yīng)用關(guān)注點(diǎn)在于怎么樣做好自己的應(yīng)用,這是在金融行業(yè)企業(yè)應(yīng)用需求、場(chǎng)景需求包括解決方案。我們?cè)倏匆幌陆鹑诨ヂ?lián)網(wǎng)業(yè)務(wù)數(shù)據(jù)管理案例分享,這是更細(xì)分的事情。金融行業(yè)如果說(shuō)做手機(jī)銀行,手機(jī)銀行做會(huì)員交易,以前開(kāi)戶(hù)是在柜臺(tái)開(kāi),在營(yíng)業(yè)廳開(kāi)是可以的,因?yàn)槎际桥抨?duì),這個(gè)系統(tǒng)的壓力可以算出來(lái),根據(jù)一天開(kāi)多少個(gè)通道,一共有多少個(gè)營(yíng)業(yè)廳,多少分行或者是支行,有多少營(yíng)業(yè)所可以算出來(lái),這個(gè)應(yīng)用到底需要多大的能力,我可以讓他排隊(duì)。但是在手機(jī)銀行或者是銀行開(kāi)發(fā)了很多互聯(lián)網(wǎng)業(yè)務(wù),比如說(shuō)開(kāi)飯票或者是聚餐,互聯(lián)網(wǎng)業(yè)務(wù)的時(shí)候,它的客戶(hù)群體會(huì)變得很模糊,像一些股份制銀行,保守估計(jì)客戶(hù)群體應(yīng)該在幾千萬(wàn),我們的應(yīng)用數(shù)據(jù)跟著它做幾千萬(wàn),這肯定是不可行的。一定回到技術(shù)傳統(tǒng)方式,我們說(shuō)把應(yīng)用和數(shù)據(jù)分開(kāi),應(yīng)用要做業(yè)務(wù)邏輯,比如說(shuō)從用戶(hù)的認(rèn)證,比如說(shuō)從一個(gè)APP進(jìn)去之后,比如說(shuō)找一個(gè)賬單或者找一個(gè)飯票,進(jìn)入飯票業(yè)務(wù)或者是電影票業(yè)務(wù),打印什么什么東西,下載電影票的票根或者是票據(jù),真正生成單據(jù)的時(shí)候是可以拍照截圖,這些都是應(yīng)用邏輯做的事情。但是存在里面的交易中間形成的圖片或者是文件,我們是不是可以放在存儲(chǔ)上面去,對(duì)于銀行客戶(hù)來(lái)說(shuō),一定要把存儲(chǔ)放在內(nèi)部,這是核心和基本要求。在企業(yè)里面來(lái)看,我們能夠把一個(gè)應(yīng)用和數(shù)據(jù)的通道打通分開(kāi),分開(kāi)以后讓?xiě)?yīng)用走應(yīng)用的邏輯,比如后面都是做結(jié)構(gòu)化的處理,真正的用戶(hù)通過(guò)本身的客戶(hù)端包括移動(dòng)的應(yīng)用,包括PC的應(yīng)用,可以直接存儲(chǔ)。把存儲(chǔ)暴露到互聯(lián)網(wǎng)當(dāng)中,里面一定有很多控制的邏輯,包括傳統(tǒng)ATB協(xié)議可以提供簽名驗(yàn)證,還可以提供時(shí)效,各種各樣的問(wèn)題都會(huì)出來(lái)了,我們通過(guò)這種方法的解決降低用戶(hù)在手機(jī)業(yè)務(wù)、手機(jī)銀行或者是互聯(lián)網(wǎng)業(yè)務(wù)的硬投入,硬投入對(duì)于企業(yè)來(lái)講根據(jù)算產(chǎn)值和模式算出來(lái)的,一定是有新的方法或者是比較好的解決方法,幫助用戶(hù)解決同時(shí)滿(mǎn)足互聯(lián)網(wǎng)業(yè)務(wù)場(chǎng)景,同時(shí)又解決安全問(wèn)題,這是需要更多考慮的一個(gè)場(chǎng)景,這就是一個(gè)應(yīng)用與數(shù)據(jù)分離的場(chǎng)景。應(yīng)用和數(shù)據(jù)非結(jié)構(gòu)化和非關(guān)鍵業(yè)務(wù)來(lái)說(shuō),這種數(shù)據(jù)分離場(chǎng)景會(huì)越來(lái)越多,而且以后對(duì)于用戶(hù)來(lái)講,如果用戶(hù)的應(yīng)用和數(shù)據(jù)分開(kāi)以后,應(yīng)用選擇面會(huì)更廣。
我們說(shuō)重應(yīng)用在企業(yè)中逐漸會(huì)變成SaaS應(yīng)用,為什么?只要數(shù)據(jù)和應(yīng)用能夠分開(kāi),選擇會(huì)更容易,如果這個(gè)應(yīng)用不好用,可能要換一家,發(fā)展方向還是有很多問(wèn)題。從場(chǎng)景來(lái)看結(jié)果來(lái)看,應(yīng)用會(huì)越來(lái)越輕,數(shù)據(jù)會(huì)越來(lái)越重。我們?cè)倏匆幌轮圃鞓I(yè),制造業(yè)比金融業(yè)慢一個(gè)節(jié)奏,因?yàn)樗膽?yīng)用,信息化建設(shè)角度來(lái)說(shuō)還是一個(gè),雖然做了虛擬化,只是虛擬化的煙囪而已,以前是物理的煙囪,現(xiàn)在是虛擬化的煙囪而已。它的訴求很明顯,有幾百套共享服務(wù)器,部門(mén)甚至以項(xiàng)目組都申請(qǐng)了一個(gè)20個(gè)T或者是幾百個(gè)T的共享服務(wù),這種共享服務(wù)對(duì)于企業(yè)來(lái)講,企業(yè)以前的存儲(chǔ)主要是塊,文件后來(lái)出現(xiàn)一些包括對(duì)象。隨著對(duì)象存儲(chǔ)這種分布式存儲(chǔ)逐漸這種價(jià)格,包括技術(shù)成熟度逐漸上來(lái)以后,會(huì)考慮到是不是能夠用分布式存儲(chǔ)和對(duì)象存儲(chǔ),來(lái)解決大規(guī)模散布在幾百臺(tái)數(shù)量NAS或共享塊存儲(chǔ)。這樣的話(huà),第一個(gè)降低了管理復(fù)雜度,因?yàn)橐郧白钔纯嗟木褪菗Q盤(pán),第二個(gè)這個(gè)內(nèi)部用戶(hù)需要一臺(tái)共享服務(wù)器,因?yàn)閷?duì)制造業(yè)來(lái)說(shuō),內(nèi)部的IT有很強(qiáng)的管控能力,安全的要求,數(shù)據(jù)要加密,很?chē)?yán)格,所以為了共享數(shù)據(jù)方便,本身不能拿出U盤(pán)共享,發(fā)郵件數(shù)據(jù)量很大,不能那么做,通道不暢通,怎么辦?他們逐漸通過(guò)建設(shè)統(tǒng)一文件數(shù)據(jù)管理平臺(tái),從以前辦公的概念變成生產(chǎn)的概念,以前只負(fù)責(zé)解決辦公的問(wèn)題,現(xiàn)在涵蓋辦公、生產(chǎn)、開(kāi)發(fā)、營(yíng)銷(xiāo)、售后服務(wù)文件型數(shù)據(jù),隨著電商業(yè)務(wù)逐漸拓展,它會(huì)逐漸把電商業(yè)務(wù)形態(tài)搬回到公司內(nèi)部來(lái),上面存了大量的信息,如何搬到數(shù)據(jù)共享平臺(tái)來(lái)解決數(shù)據(jù)管理問(wèn)題。制造業(yè)對(duì)于身份安全管理,包括操作留痕要求很高,制造業(yè)對(duì)文件管理還是在集中的概念,如何安全存的問(wèn)題,因?yàn)樗鼈兊膽?yīng)用是煙囪式,這種虛擬化煙囪式的打通還是任重道遠(yuǎn),這是制造業(yè)文件管理案例。
再看一下產(chǎn)線(xiàn),現(xiàn)在制造業(yè)對(duì)產(chǎn)線(xiàn)質(zhì)量的跟蹤,自動(dòng)化產(chǎn)線(xiàn)的時(shí)候會(huì)拍照,我會(huì)存在本地的服務(wù)器上,比如說(shuō)存三個(gè)月,剩下通過(guò)移動(dòng)硬盤(pán)導(dǎo)走,導(dǎo)到一個(gè)大的硬盤(pán)上或者導(dǎo)到共享服務(wù)器,或者是文件服務(wù)器。但是制造業(yè)質(zhì)量跟蹤時(shí)間越來(lái)越長(zhǎng),以前可能在線(xiàn)查三個(gè)月,現(xiàn)在要查一年兩年,因?yàn)榱悴考坏┏霈F(xiàn)問(wèn)題,通過(guò)前端的應(yīng)用系統(tǒng)包括追蹤到拍照的痕跡,這就面臨一個(gè)問(wèn)題,怎么樣解決效率問(wèn)題?比如一分鐘拍一次或者每30秒拍一張,24小時(shí)不停這個(gè)產(chǎn)線(xiàn),中間照片數(shù)量會(huì)很高很大,以前的方式傳到小服務(wù)器或者是PC上,再導(dǎo)到存儲(chǔ)上面去,這種方式很慢,而新的方式,比如傳到對(duì)象存儲(chǔ),這樣快很多,容量大很多,可能支持在線(xiàn)一年兩年三年。我們剛才說(shuō)追溯的時(shí)候,以前產(chǎn)線(xiàn)圖片雖然有規(guī)則,但是找起來(lái)也不容易,是不是可以通過(guò)對(duì)象存儲(chǔ),內(nèi)設(shè)搜索引擎,通過(guò)這種來(lái)去對(duì)接文件進(jìn)行搜索,照片快速照片,包括批量的下載,一次要找一組圖出來(lái),追溯這個(gè)圖,通過(guò)搜索引擎的方式,這都是對(duì)象存儲(chǔ)或者是分布式存儲(chǔ)自帶的生態(tài),進(jìn)而簡(jiǎn)化了用戶(hù)做應(yīng)用,簡(jiǎn)化了方式。他們對(duì)數(shù)據(jù)進(jìn)行上傳的時(shí)候打標(biāo)簽,比如說(shuō)進(jìn)行的批次或者是對(duì)照片操作人都可以打進(jìn)去,通過(guò)這種方式存到對(duì)象存儲(chǔ)以后,我們支持對(duì)目標(biāo)搜索?,F(xiàn)在應(yīng)用對(duì)存儲(chǔ)來(lái)說(shuō),打標(biāo)簽的話(huà)能夠?qū)崿F(xiàn)快速的,這就是分布式存儲(chǔ)和對(duì)象存儲(chǔ)的優(yōu)勢(shì)。比如說(shuō)它有兩個(gè)GB之間的關(guān)聯(lián)關(guān)系,以前怎么做?
需要把這邊的數(shù)據(jù)拿移動(dòng)硬盤(pán)寄到那邊去或者發(fā)到那邊去或者是出差帶過(guò)去。現(xiàn)在應(yīng)用只要標(biāo)記,對(duì)重點(diǎn)跟蹤的圖片,只要應(yīng)用打標(biāo)記,這個(gè)時(shí)候底下的存儲(chǔ)會(huì)把數(shù)據(jù)轉(zhuǎn)移到另一個(gè)存儲(chǔ)上面,利用對(duì)象存儲(chǔ)分發(fā)能力或者是轉(zhuǎn)移能力,這樣降低整個(gè)企業(yè)使用應(yīng)用復(fù)雜度,因?yàn)樗年P(guān)注點(diǎn)就是在產(chǎn)線(xiàn)數(shù)據(jù)怎么能夠快速保存,經(jīng)濟(jì)化保存,快速找到數(shù)據(jù)快速處理,這是它的目標(biāo)。
制造業(yè)來(lái)看,目前還是比金融行業(yè)慢一點(diǎn),更多是解決存儲(chǔ)以后怎么高效利用數(shù)據(jù)或者是管理數(shù)據(jù)。醫(yī)療影像領(lǐng)域更加復(fù)雜,第一個(gè)醫(yī)療里面的應(yīng)用系統(tǒng)比較多,一般三甲醫(yī)院都是比較多一些。從醫(yī)療影像數(shù)據(jù)來(lái)看,基本上有三個(gè)場(chǎng)景,第一個(gè)是臨床整治,疾病整治領(lǐng)域,還有就是科研,第三個(gè)就是教學(xué),通過(guò)醫(yī)療影像進(jìn)行教學(xué)。傳統(tǒng)的方式通過(guò)PACS系統(tǒng),PACS系統(tǒng)實(shí)際上就是ECM典型應(yīng)用場(chǎng)景或者是應(yīng)用模式。現(xiàn)在醫(yī)療影像產(chǎn)品越來(lái)越多,以前一個(gè)醫(yī)院可能有幾十臺(tái)CT,像核磁共振、CT、B超,現(xiàn)在隨著產(chǎn)品價(jià)格下來(lái)。第二個(gè)以租代買(mǎi),甚至說(shuō)商業(yè)模式變化以后,導(dǎo)致一個(gè)三甲醫(yī)院基本一半的科室都是跟影像關(guān)系,連看牙都有影像的概念。這個(gè)時(shí)候數(shù)據(jù)量增加會(huì)很快,但是醫(yī)生閱片的時(shí)延時(shí)效,包括清晰度,照片的顆粒度上來(lái)了。每次醫(yī)生都要去幾百?gòu)堈掌瑸g覽,這種對(duì)時(shí)延要求很高,現(xiàn)在基本上跨科室是一個(gè)老大難的問(wèn)題,比如內(nèi)科的人怎么看其他科室的影像。這是很困難很復(fù)雜的事情,涉及到很多管理上包括實(shí)際上的應(yīng)用場(chǎng)景問(wèn)題,但是這個(gè)場(chǎng)景來(lái)看是存在的,這是醫(yī)生告訴我:從多模視角幫助病人發(fā)現(xiàn)問(wèn)題。我們現(xiàn)在的做法,到內(nèi)科看完了,外科再拍一個(gè),或者一個(gè)醫(yī)院到另外一個(gè)醫(yī)院都要重新拍,它需要大量的樣本。
其實(shí)對(duì)于科研研究也是一樣的,需要大量的樣本進(jìn)行訓(xùn)練,通過(guò)快速訓(xùn)練提升對(duì)疑難雜癥效果的分析,醫(yī)學(xué)教學(xué)關(guān)注一些典型或者是原始圖像獲取的問(wèn)題。從一線(xiàn)目前醫(yī)學(xué)影像來(lái)看,PACS來(lái)看,PACS系統(tǒng)從原來(lái)造價(jià)很高到現(xiàn)在造價(jià)很低,廠(chǎng)家逐漸從原來(lái)一千多家到現(xiàn)在幾百家、幾十家,但是現(xiàn)在面臨一個(gè)問(wèn)題,PACS系統(tǒng)越來(lái)越慢,這是很多醫(yī)院的共識(shí)。對(duì)于用戶(hù)來(lái)講就是換PACS,這家服務(wù)不好,選擇一家產(chǎn)品的時(shí)候支持能力是很重要的選擇。但是對(duì)于應(yīng)用來(lái)講要換它,就存在歷史數(shù)據(jù)的遷移問(wèn)題,因?yàn)镋CM產(chǎn)品遷移又帶數(shù)據(jù)庫(kù)又帶存儲(chǔ)的時(shí)候,這個(gè)數(shù)據(jù)量小是可以的沒(méi)問(wèn)題,現(xiàn)在一個(gè)三甲醫(yī)院歷史五年數(shù)據(jù)都在兩百T到三百T,這個(gè)數(shù)據(jù)怎么能夠遷得出來(lái)?這是很痛苦的事情。第二,現(xiàn)在PACS系統(tǒng)本身這種共享權(quán)限通過(guò)很多方式來(lái)做,第三個(gè)備份很復(fù)雜,醫(yī)院的信息科都是孫子輩的,現(xiàn)在影像是粗放式管理,投入產(chǎn)出比嚴(yán)重不匹配,本身來(lái)說(shuō)影像數(shù)據(jù)有30%到40%是垃圾數(shù)據(jù),我怎么對(duì)影像數(shù)據(jù)從源頭上治理,我們提出了跟醫(yī)院在探討的,能不能把應(yīng)用分開(kāi),把PACS和數(shù)據(jù)分開(kāi),PACS作為數(shù)據(jù)標(biāo)記,因?yàn)镻ACS前面更多是一些應(yīng)用,怎么通過(guò)數(shù)據(jù)去看圖像,分析圖像。
真正數(shù)據(jù)存儲(chǔ)要分開(kāi),通過(guò)應(yīng)用和存儲(chǔ)分開(kāi),包括存儲(chǔ)和數(shù)據(jù)存儲(chǔ),因?yàn)獒t(yī)院不像傳統(tǒng)的金融行業(yè),它有大量的空間有機(jī)房有電力,很多醫(yī)院缺乏電力,沒(méi)有電沒(méi)有空間,公有云是否是一個(gè)選擇方向?,F(xiàn)在很多三甲醫(yī)院逐漸在公有云上把整個(gè)IT托管到公有云上,這也是一個(gè)選擇方向,數(shù)據(jù)要存儲(chǔ),通過(guò)這種解耦的方式來(lái)解決數(shù)據(jù)共享的問(wèn)題,解耦以后才能可能共享。第二個(gè)包括醫(yī)政,醫(yī)院醫(yī)政跟企業(yè)管理部門(mén)是一樣的,必須解決數(shù)據(jù)信息安全問(wèn)題,我們都知道病人的片子有一些個(gè)人隱私信息在里面,這時(shí)候怎么樣道德合規(guī)的問(wèn)題,包括安全合規(guī)的問(wèn)題,通過(guò)解耦以后才可能做數(shù)據(jù)質(zhì)量治理,輔助解決大量無(wú)效數(shù)據(jù)、從源頭治理。怎么通過(guò)治理的方式盡量降低存儲(chǔ)的成本,在這個(gè)基礎(chǔ)上在線(xiàn)時(shí)間更長(zhǎng),這都是需要解決的問(wèn)題。我們通過(guò)解耦的方式來(lái)幫助客戶(hù)滿(mǎn)足科研、臨床、教學(xué)這樣一些數(shù)據(jù)需求。剛才整個(gè)介紹了三個(gè)行業(yè),從金融行業(yè)到制造業(yè)到醫(yī)療行業(yè)這些數(shù)據(jù)管理案例,我們看了一下非結(jié)構(gòu)數(shù)據(jù)發(fā)展方向。第一個(gè)存儲(chǔ)概念,分布式存儲(chǔ)、對(duì)象存儲(chǔ)是我們的基礎(chǔ),我們隨著利用隨著分布式存儲(chǔ)和對(duì)象存儲(chǔ)技術(shù)本身成長(zhǎng)成熟,我們?nèi)ダ贸墒旒夹g(shù)或者構(gòu)建,通過(guò)以它為基礎(chǔ)構(gòu)建一個(gè)新的生態(tài)方式,用這種低成本解決非關(guān)鍵業(yè)務(wù)數(shù)據(jù)量關(guān)鍵問(wèn)題。第三個(gè)談到非關(guān)鍵業(yè)務(wù)數(shù)據(jù)很大的場(chǎng)景是共享,怎樣能夠隨時(shí)獲取。隨著整個(gè)企業(yè)業(yè)態(tài),從PC電腦到桌面云,到平板到移動(dòng)化辦公,是不是能夠更好支持共享,尤其智能終端出來(lái)以后,是不是能夠支持共享。第三個(gè)很難做就是行業(yè)發(fā)展方向怎么樣做數(shù)據(jù)分類(lèi),非結(jié)構(gòu)化的數(shù)據(jù)分類(lèi)有點(diǎn)像百度搜索做的網(wǎng)頁(yè)爬蟲(chóng),怎么去做分類(lèi),包括預(yù)處理。非結(jié)構(gòu)化數(shù)據(jù)或者非關(guān)鍵性數(shù)據(jù)量很大,只有通過(guò)預(yù)處理方式才能加速找到數(shù)據(jù),如果一個(gè)企業(yè)從十個(gè)億數(shù)據(jù)找一個(gè)數(shù)據(jù),通過(guò)預(yù)處理能力,來(lái)解決數(shù)據(jù)快速獲取問(wèn)題,包括已經(jīng)開(kāi)始做的像監(jiān)控?cái)?shù)據(jù)挖掘甚至是圖像分析,已經(jīng)有很多案例,通過(guò)數(shù)據(jù)分析的方式,場(chǎng)景也是逐漸在豐富逐漸在完整化,通過(guò)這種方式來(lái)提升非關(guān)鍵業(yè)務(wù)的價(jià)值。
最后談到安全的概念,現(xiàn)在有加密技術(shù),比如醫(yī)療數(shù)據(jù)的脫敏問(wèn)題,但實(shí)際上從企業(yè)來(lái)看,我們碰到了電子制造業(yè)問(wèn)題,比如國(guó)際化部署的問(wèn)題,比如分公司在歐洲,在美洲美國(guó),有很多在東南亞、新加坡,怎么解決數(shù)據(jù)合規(guī)問(wèn)題?這都涉及到數(shù)據(jù)流轉(zhuǎn)問(wèn)題,剛剛談到非關(guān)鍵業(yè)務(wù)基礎(chǔ)一定是數(shù)據(jù)量很大,這個(gè)量大到一定程度的時(shí)候這個(gè)問(wèn)題就會(huì)顯現(xiàn)出來(lái)。所以我們說(shuō)安全也是一個(gè)非結(jié)構(gòu)性管理很重的方向。
—— END ——
2020中國(guó)數(shù)據(jù)與存儲(chǔ)峰會(huì)演講嘉賓PPT下載頁(yè)面來(lái)了!(點(diǎn)擊此處下載活動(dòng)資料)
2020中國(guó)數(shù)據(jù)與存儲(chǔ)峰會(huì)圓滿(mǎn)落幕,大會(huì)由百易傳媒(DOIT)主辦,以“新數(shù)智,新未來(lái)”為主題,特邀中國(guó)工程院鄭緯民院士以及中國(guó)電子學(xué)會(huì)、中國(guó)計(jì)算機(jī)學(xué)會(huì)存儲(chǔ)專(zhuān)委會(huì)、SNIA等單位的嘉賓,與西部數(shù)據(jù)、英特爾、浪潮、IBM、華為、戴爾科技集團(tuán)、新華三、深信服、紫晶存儲(chǔ)、青云QingStor、威固、Memblaze等領(lǐng)先供應(yīng)商以及北京建工、平安科技、紅星酒業(yè)等典型企業(yè)用戶(hù)代表,探討新數(shù)據(jù)時(shí)代存儲(chǔ)技術(shù)發(fā)展趨勢(shì),分享數(shù)字化轉(zhuǎn)型成果,共話(huà)智慧未來(lái)。