創(chuàng)略科技創(chuàng)始人胡世杰在接受商界專訪的時(shí)候告訴記者,關(guān)于數(shù)據(jù)和人工智能的應(yīng)用,目前形成三大趨勢(shì):

第一,大數(shù)據(jù)隱私越來越受到各方重視,相關(guān)政策法規(guī)也陸續(xù)出臺(tái),數(shù)據(jù)的使用必然受到諸多限制;

第二,消費(fèi)者對(duì)個(gè)人數(shù)據(jù)的重要性與隱私性的認(rèn)知程度不斷提升,企業(yè)也更加重視數(shù)據(jù)資產(chǎn)保護(hù),對(duì)于跨組織的數(shù)據(jù)合作越來越謹(jǐn)慎,潛在數(shù)據(jù)孤島問題更加嚴(yán)重;3

第三,數(shù)據(jù)資產(chǎn)的形成集中在BAT這種頭部互聯(lián)網(wǎng)企業(yè),如何打破BAT的數(shù)據(jù)“圍墻花園”,保護(hù)自己私域數(shù)據(jù)資產(chǎn),形成良性的競爭環(huán)境和市場環(huán)境,成為各方企業(yè)關(guān)注的又一焦點(diǎn)。

胡世杰表示,在大數(shù)據(jù)發(fā)展之初,客戶數(shù)據(jù)高度集中在頭部互聯(lián)網(wǎng)企業(yè),互聯(lián)網(wǎng)領(lǐng)域形成了中心化發(fā)展模式。企業(yè)要實(shí)現(xiàn)更多的客戶洞察數(shù)據(jù),唯一的途徑就是與BAT類型第三方數(shù)據(jù)合作。但這種中心化模式,除去數(shù)據(jù)的積累愈發(fā)集中,易形成壟斷趨勢(shì)的弊端,另一方面,部分企業(yè)對(duì)于自有數(shù)據(jù)資產(chǎn)的保護(hù)意識(shí)大幅提升,特別是規(guī)?;ㄖ写笮停┑钠髽I(yè)或機(jī)構(gòu),則獲得高質(zhì)量、真實(shí)有效的第三方數(shù)據(jù),越來越困難。

如何破除AI落地應(yīng)用的兩大阻礙:數(shù)據(jù)孤島和數(shù)據(jù)隱私安全

企業(yè)數(shù)據(jù)資產(chǎn)安全以及隱私是必然的,也算是整體數(shù)字化變革不可或缺的要素之一。數(shù)據(jù)使用的限制使得互聯(lián)網(wǎng)數(shù)據(jù)分散在不同企業(yè)、部門,組織中,形成“數(shù)據(jù)孤島”,各方數(shù)據(jù)難以實(shí)現(xiàn)價(jià)值共享或協(xié)作。而企業(yè)數(shù)據(jù)隱私化形成孤島,使人工智能技術(shù)發(fā)揮最大化價(jià)值受限,同時(shí)各機(jī)構(gòu)、企業(yè)所擁有的數(shù)據(jù)又具有極大的潛在應(yīng)用價(jià)值。那么,如何在滿足數(shù)據(jù)安全、合規(guī)的前提下,利用多方異構(gòu)數(shù)據(jù)進(jìn)一步進(jìn)行學(xué)習(xí)、建模以推動(dòng)人工智能的發(fā)展呢?

“聯(lián)邦學(xué)習(xí)作為分布式機(jī)器學(xué)習(xí)范式,可以實(shí)現(xiàn)各方在不公開各自數(shù)據(jù)的情形下,協(xié)同完成模型訓(xùn)練,解決一系列AI應(yīng)用落地面臨的數(shù)據(jù)安全和隱私障礙,以及創(chuàng)造一個(gè)健康的數(shù)據(jù)價(jià)值協(xié)作新模式,是人工智能領(lǐng)域發(fā)展的必然趨勢(shì)?!?/strong>胡世杰如是說。

在傳統(tǒng)的AI應(yīng)用模式中,企業(yè)以自己為中心化匯集盡可能多的數(shù)據(jù),并基于此訓(xùn)練AI模型。企業(yè)采集的數(shù)據(jù)量越大、數(shù)據(jù)維度越豐富,則驅(qū)動(dòng)的洞察也就越準(zhǔn)確。而在聯(lián)邦學(xué)習(xí)模式下,加入學(xué)習(xí)的各方不需要把數(shù)據(jù)匯集到中心化的體系,而是在參與方自己的設(shè)備或者數(shù)據(jù)中心通過AI算法產(chǎn)出數(shù)據(jù)洞察和預(yù)測(cè),以及模型參數(shù),并將結(jié)果同步回傳到聯(lián)邦學(xué)習(xí)的中心節(jié)點(diǎn)。在聯(lián)邦學(xué)習(xí)的體系內(nèi),將各方回傳的模型平均后繼續(xù)學(xué)習(xí)、訓(xùn)練,得出更精準(zhǔn)的結(jié)果,分發(fā)到各參與者,用以各自的業(yè)務(wù)場景。在這個(gè)過程中,參與者并沒有交換數(shù)據(jù),卻可以實(shí)現(xiàn)較大規(guī)模的AI以及機(jī)器學(xué)習(xí)的應(yīng)用場景。

區(qū)塊鏈技術(shù)保障聯(lián)邦學(xué)習(xí)共享模型安全有效

在聯(lián)邦學(xué)習(xí)模式下,為避免由于行業(yè)競爭造成的故意混淆錯(cuò)誤結(jié)果到聯(lián)邦學(xué)習(xí)的體系中,以及一系列其他機(jī)制層面系統(tǒng)性風(fēng)險(xiǎn),造成訓(xùn)練模型的錯(cuò)誤結(jié)果等,就需要透明、有效的安全機(jī)制進(jìn)行干預(yù),建立體系各方的相互信任。

談及如何完善聯(lián)邦學(xué)習(xí)的共享機(jī)制,胡世杰認(rèn)為,區(qū)塊鏈技術(shù)可以幫助企業(yè)各方在去中心化AI體系中,創(chuàng)造一系列的自動(dòng)化透明管理,信任以及治理機(jī)制。在聯(lián)邦學(xué)習(xí)過程中的參與者(企業(yè)或組織)都是主角,在一個(gè)嚴(yán)格的“機(jī)制創(chuàng)建信任”環(huán)境中,這一過程也未必需要一個(gè)中心化主導(dǎo)方。這個(gè)所謂的機(jī)制在聯(lián)邦學(xué)習(xí)場景下,可以理解是由應(yīng)用區(qū)塊鏈技術(shù)提供的“智能合約”體系完成的。智能合約技術(shù)能使一個(gè)業(yè)務(wù)流程或交易在無中心主導(dǎo)方或“擔(dān)保方”的情況下,有一個(gè)透明、去中心化以及自動(dòng)化的管理機(jī)制,來消除參與者之間“信任程度”的風(fēng)險(xiǎn)要素。

“在聯(lián)邦學(xué)習(xí)場景的應(yīng)用中,可以采取投票機(jī)制,由聯(lián)盟各方共同確認(rèn)每個(gè)共享結(jié)果的質(zhì)量,這樣就可以有效地減少學(xué)習(xí)體系中不被信任的第三方以偽造的、有疑問的數(shù)據(jù)破壞整體洞察結(jié)果的情況發(fā)生?!?/strong>

聯(lián)邦學(xué)習(xí)在多維場景實(shí)現(xiàn)應(yīng)用落地

目前國內(nèi)外較早實(shí)現(xiàn)聯(lián)邦學(xué)習(xí)應(yīng)用落地的,是醫(yī)療和金融行業(yè)。比如對(duì)于新冠疫情的研究,各醫(yī)療機(jī)構(gòu)根據(jù)病人圖像或者數(shù)據(jù)挖掘出病人的肺部特征,通過聯(lián)邦學(xué)習(xí)共享這些特征,既可以共同研究病情相關(guān)洞察,又保障了病人隱私;而在金融行業(yè),加入聯(lián)邦學(xué)習(xí)的銀行之間可以分享客戶信用預(yù)估模型,在不需要知道客戶在其他哪些銀行機(jī)構(gòu)貸過款的情況下,獲知某一客戶的綜合風(fēng)險(xiǎn)等級(jí),做出相關(guān)預(yù)警。

創(chuàng)略科技作為國內(nèi)領(lǐng)先的智能數(shù)據(jù)解決方案提供商,一直專注于營銷領(lǐng)域,為國內(nèi)外大中型企業(yè)提供應(yīng)用于全局營銷場景的數(shù)據(jù)及AI技術(shù)解決方案。胡世杰告訴記者,其實(shí)國內(nèi)大部分B2C企業(yè),其積累的客戶數(shù)據(jù)體量都足夠大,但是在應(yīng)用AI技術(shù)進(jìn)行模型訓(xùn)練時(shí),卻常出現(xiàn)數(shù)據(jù)維度不足的狀況。而創(chuàng)略科技在服務(wù)了上百家企業(yè)的過程中,洞察到很多同行業(yè)甚至跨領(lǐng)域的企業(yè)之間,存在著客戶及潛客的重疊交叉,從理論上可以互相補(bǔ)充、完善客戶洞察。

基于此,創(chuàng)略科技已經(jīng)開始探索把聯(lián)邦學(xué)習(xí)融合區(qū)塊鏈技術(shù)應(yīng)用到智能營銷領(lǐng)域,旨在幫助企業(yè)客戶在安全合規(guī)的前提下,獲得更加深刻、全面的客戶洞察。

“創(chuàng)略目前已經(jīng)在嘗試幫助一些客戶通過聯(lián)邦學(xué)習(xí)的模式,共享AI訓(xùn)練模型產(chǎn)出的結(jié)果。其實(shí)相較于數(shù)據(jù)本身,通過AI挖掘潛在的客戶行為預(yù)測(cè)及洞察,才是對(duì)于企業(yè)具有真正的應(yīng)用價(jià)值。當(dāng)然,聯(lián)邦學(xué)習(xí)在營銷領(lǐng)域的拓展還處于初級(jí)階段,需要客戶之間以及對(duì)提供通道的供應(yīng)商具有高度的信任,因此創(chuàng)略科技目前并沒有在整個(gè)客戶體系內(nèi)去推動(dòng)聯(lián)邦學(xué)習(xí),而是在具有相同客戶交集的企業(yè)之間實(shí)現(xiàn)1對(duì)1的共享機(jī)制——當(dāng)企業(yè)雙方都對(duì)彼此的數(shù)據(jù)洞察有需求時(shí),創(chuàng)略科技就在AI應(yīng)用場景下建立聯(lián)邦學(xué)習(xí)通道,幫助企業(yè)實(shí)現(xiàn)安全、高效的多維度數(shù)據(jù)洞察。”胡世杰介紹。

數(shù)據(jù)孤島和數(shù)據(jù)隱私正成為大數(shù)據(jù)時(shí)代新的挑戰(zhàn),聯(lián)邦學(xué)習(xí)作為“數(shù)據(jù)孤島”間的橋梁,必將成為未來AI技術(shù)發(fā)展的一個(gè)重要方向,最終解決數(shù)據(jù)安全共享的世界性難題,全面激活數(shù)字經(jīng)濟(jì)。