石教授說(shuō),我們所說(shuō)的大數(shù)據(jù)主要來(lái)源自三個(gè)方面,第一是政府,政府每天會(huì)產(chǎn)生非常多的數(shù)據(jù),信息量也非常大,而且很多原始數(shù)據(jù)都應(yīng)該對(duì)普通民眾公開(kāi)。第二是企業(yè),現(xiàn)在企業(yè)間的數(shù)據(jù)不能共享,如果不共享,這個(gè)數(shù)據(jù)就沒(méi)有生命力,很多工作都是重復(fù)勞動(dòng)。最后是我們看到的公開(kāi)的互聯(lián)網(wǎng)上面的數(shù)據(jù),其中主要是社會(huì)數(shù)據(jù)和個(gè)人交互產(chǎn)生的數(shù)據(jù)。有了這些大數(shù)據(jù),一定要做數(shù)據(jù)挖掘,根據(jù)數(shù)據(jù)挖掘來(lái)做出的決策,會(huì)改變我們的管理結(jié)構(gòu),因?yàn)閿?shù)據(jù)挖掘本身就是決策的過(guò)程。這個(gè)過(guò)程具體可以分為樣本選取、數(shù)據(jù)變換、數(shù)據(jù)挖掘和數(shù)據(jù)展示等過(guò)程。

石教授同時(shí)也提到,我們傳統(tǒng)理解的大數(shù)據(jù)的觀點(diǎn)并不是完全準(zhǔn)確的。比如說(shuō)大數(shù)據(jù)研究應(yīng)該既要全體,又要抽樣,這種說(shuō)法就有問(wèn)題,大數(shù)據(jù)中說(shuō)的全體,也不是真正的全體,而且也不可能用全體數(shù)據(jù)去做預(yù)測(cè)。另外說(shuō)大數(shù)據(jù)應(yīng)從相關(guān)關(guān)系中把握因果關(guān)系與必然關(guān)系,這種說(shuō)法不科學(xué),數(shù)據(jù)因素多了,關(guān)聯(lián)多了,并不一定能找到因果關(guān)系,這是不必然的。

石教授認(rèn)為大數(shù)據(jù)是數(shù)字化生存時(shí)代的新型戰(zhàn)略資源,是驅(qū)動(dòng)創(chuàng)新的重要因素,正在改變?nèi)祟?lèi)的生產(chǎn)和生活方式。通過(guò)最近幾年團(tuán)隊(duì)的工作,他們?cè)跀?shù)據(jù)挖掘領(lǐng)域做出了不少基于大數(shù)據(jù)的相關(guān)應(yīng)用。

比如針對(duì)銀行信用卡、保險(xiǎn)和房地產(chǎn)貸款市場(chǎng),要想做精準(zhǔn)營(yíng)銷(xiāo),就需要通過(guò)非常多的客戶(hù)的交易記錄來(lái)把客戶(hù)分類(lèi),分成第一徹底破產(chǎn),第二部分破產(chǎn),第三是呆賬,第四是正常人,第五叫高端客戶(hù),所以你發(fā)現(xiàn),這個(gè)數(shù)據(jù)表是開(kāi)展業(yè)務(wù)的基礎(chǔ)。通過(guò)類(lèi)似的系統(tǒng),可以讓銀行信用卡辦理業(yè)務(wù)的時(shí)間由原來(lái)的一周減到2天,因?yàn)楝F(xiàn)在在美國(guó)辦理信用卡就是2天?,F(xiàn)在通過(guò)石教授的這個(gè)系統(tǒng),五秒鐘,只要把信息填進(jìn)去,兩秒半在整個(gè)大數(shù)據(jù)計(jì)算里面跟庫(kù)里面的數(shù)據(jù)進(jìn)行比較,跟你相近的找出來(lái),很精準(zhǔn)。

另外 ,在金融交易領(lǐng)域和一號(hào)店的客戶(hù)評(píng)分系統(tǒng),也都運(yùn)用了石教授的系統(tǒng),為他們的業(yè)務(wù)提供了更加可靠的決策和支持。

大數(shù)據(jù)作為一個(gè)新生事物,才剛剛發(fā)展起來(lái),未來(lái)還有很遠(yuǎn)的路要走,石教授在演講的最后希望產(chǎn)業(yè)界的朋友能夠多多與學(xué)術(shù)界做交流互動(dòng),培養(yǎng)出更多更加專(zhuān)業(yè)的大數(shù)據(jù)人才。

(本文為作者根據(jù)現(xiàn)場(chǎng)的演講人意思整理,如有曲解,請(qǐng)石教授見(jiàn)諒)

分享到

shaohaihong

相關(guān)推薦