8月29日,七牛D-Future大會上,CEO許式偉帶來主題為《數(shù)據(jù)啟動商業(yè)新常態(tài)》的開幕演講。他從互聯(lián)網(wǎng)對企業(yè)商業(yè)形態(tài)帶來的影響講起,強(qiáng)調(diào)了數(shù)據(jù)在其中所起到的重要作用,并直指非結(jié)構(gòu)化數(shù)據(jù)和日志數(shù)據(jù)兩大數(shù)據(jù)“金礦”的價值,遠(yuǎn)未被人們挖掘,主要由于技術(shù)本身確實(shí)存在的挑戰(zhàn),還有人們對數(shù)據(jù)的重視程度和認(rèn)知程度不足。

  他指出,七牛是全世界第一個提出用存儲、加速和數(shù)據(jù)處理這三個詞來描述云存儲服務(wù)的公司,這與其他云服務(wù)商僅將云存儲作為云主機(jī)附屬品的思路有很大不同。并且,為了更好地服務(wù)于平臺上的28萬企業(yè)用戶,七牛用KODO對象存儲服務(wù)、FUSION融合CDN管理平臺、DORA就近計(jì)算平臺、PILI直播云服務(wù)四大產(chǎn)品重新定義了云存儲,志在成為最開放、最完備的數(shù)據(jù)服務(wù)提供商。

  以下為演講實(shí)錄,略有刪減。

  感謝大家對于七牛的支持,今天能舉辦D-Future大會,從我個人而言,心里感慨萬千。七牛到今天已經(jīng)有四年左右的歷史。應(yīng)該說我們是非常年輕的一個公司。今天舉辦這樣一場大會,我覺得首先是這個時代給了我們一個這樣的機(jī)遇。在座的各位都是這個時代的弄潮兒,今天能跟大家談一談我們對數(shù)據(jù)、對互聯(lián)網(wǎng)的看法,是七牛的榮幸。我畢業(yè)的時候,剛好是互聯(lián)網(wǎng)這個新興的產(chǎn)業(yè)剛剛開始的階段,我覺得前面的十幾年很精彩,但今天無疑是一個更加精彩的時刻。互聯(lián)網(wǎng)剛剛開始的時候,它只是一個新興的產(chǎn)業(yè),今天大家都在說互聯(lián)網(wǎng)產(chǎn)業(yè)。但是不久的將來,互聯(lián)網(wǎng)不再是一個新興的產(chǎn)業(yè),它其實(shí)是一個新興的生產(chǎn)力,和所有的實(shí)體經(jīng)濟(jì)和各行各業(yè)都息息相關(guān)。

  我們認(rèn)為,今天的互聯(lián)網(wǎng)蘊(yùn)藏著更巨大的商業(yè)機(jī)會?;ヂ?lián)網(wǎng)之前是一個行業(yè),它的影響仍然只是非常小的一個人群。但是今天,每一個人都已經(jīng)聯(lián)網(wǎng)了,中國超過半數(shù)的人群,已經(jīng)隨時隨地都在網(wǎng)絡(luò)上。這給我們的影響是非常巨大的,我們的商業(yè)因?yàn)橛辛嘶ヂ?lián)網(wǎng)而重新洗牌。所以,今天所有的公司都有非常大的危機(jī)感,因?yàn)槿绻麤]有變化,他們很可能會被淘汰。但同時我覺得這也是一個新的機(jī)會。誰能跟隨上這個時代的機(jī)遇,誰就可以成為所在行業(yè)的領(lǐng)頭羊。這也是為什么那么多人談互聯(lián)網(wǎng)轉(zhuǎn)型,為什么大家都會談創(chuàng)新,談顛覆。我們正面臨著一個前所未有的機(jī)遇,如果不變,一定會死。

  今天我們的D-Future是一個以數(shù)據(jù)為主題的會議。因?yàn)?,如果要用一個詞來概括這個互聯(lián)網(wǎng)時代,我認(rèn)為就是兩個字,數(shù)據(jù)。實(shí)際上信息一直都存在,只是它以前存在于原子世界,有了計(jì)算機(jī)和互聯(lián)網(wǎng)之后,數(shù)據(jù)存在于虛擬的比特世界。并且這個新的世界正在以每三年翻一倍的速度在膨脹。為什么會有這樣的一個變化?大家去分析一下人的能力就會發(fā)現(xiàn),人本身的邏輯能力和計(jì)算能力是非常有限的,我們很難去很快地執(zhí)行一個對計(jì)算機(jī)來說非常簡單的任務(wù),例如71×131等于多少。我相信多數(shù)人都不能很快地答出來,但計(jì)算機(jī)執(zhí)行這樣的計(jì)算,是納秒級的。計(jì)算機(jī)和互聯(lián)網(wǎng)擴(kuò)展了人的邏輯能力,讓我們有了很強(qiáng)的分析和預(yù)測未來的能力。在這樣的數(shù)字化洪流下,我們的商業(yè)將受到非常巨大的影響。所以今天我們也想談?wù)劵ヂ?lián)網(wǎng)轉(zhuǎn)型后的商業(yè)新常態(tài)到底是什么樣的。

  首先,我們來看一看業(yè)務(wù)本身?;ヂ?lián)網(wǎng)化最基礎(chǔ)的一個訴求就是業(yè)務(wù)上網(wǎng)。想象一下,或者我們對比一下傳統(tǒng)的商業(yè)和新興的商業(yè)形態(tài),最大的一個不同是什么?如果我們用一個詞去概括舊的商業(yè)形態(tài),我個人想到的一個詞是“一手交錢一手交貨”,這就是舊的商業(yè)形態(tài)最基本的特色。但是互聯(lián)網(wǎng)改變了這一切,互聯(lián)網(wǎng)讓遠(yuǎn)程交易成為了可能。遠(yuǎn)程交易產(chǎn)生一個服務(wù)對商業(yè)的影響是非常非常巨大的。我們的業(yè)務(wù)場景比以前開闊了很多,我們以前只能影響我們周圍非常小的一群人。最多我們的公司做大了之后,在不同的地方開不同的分部,但是影響的人群仍然只是公司能到達(dá)的范疇。

  但是互聯(lián)網(wǎng)改變了這一切。我們來分析一下互聯(lián)網(wǎng)時代業(yè)務(wù)的特征。我也概括了一個詞,“非結(jié)構(gòu)化數(shù)據(jù)是人類最自然的溝通方式”。什么叫非結(jié)構(gòu)化數(shù)據(jù)呢?我們自然表達(dá)的語言文本以及圖片、音頻、視頻等媒介,都是非結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)是人類非常容易理解的,但是計(jì)算機(jī)很難理解。計(jì)算機(jī)有非常強(qiáng)大的邏輯能力,但計(jì)算機(jī)在語義的理解上是非常原始的——可能連三歲嬰兒的水平都達(dá)不到。非結(jié)構(gòu)化數(shù)據(jù)就是傳遞人的意愿。比如,我拿起電話說幾段語音,告訴對方我想要的東西?;蛘呤峭ㄟ^圖片,表達(dá)一個商品長什么樣,商品該怎么使用的。我們可以看到,非結(jié)構(gòu)化數(shù)據(jù)自然而然會成為交互的一個中介。而這也是原子世界映射到比特世界一個根本原因,因?yàn)闃I(yè)務(wù)要上網(wǎng)。

  第二,當(dāng)業(yè)務(wù)上網(wǎng)之后,我們的運(yùn)營會發(fā)生質(zhì)變。舊的商業(yè)過程當(dāng)中我們也會談運(yùn)營。在舊的商業(yè)過程當(dāng)中,大部分的企業(yè)會做調(diào)查問卷,會找一些樣本的客戶去問他們,對我們的服務(wù)有什么看法,希望我們做什么樣的新服務(wù)。但是今天我們會發(fā)現(xiàn),有了計(jì)算機(jī)、有了互聯(lián)網(wǎng)之后,這一切也發(fā)生了變化。首先業(yè)務(wù)上網(wǎng)之后,可以天然地記錄每一次的交易過程,能把所有用戶的行為都記錄下來。今天我們不是取樣數(shù)據(jù),而是全量的記錄用戶的行為。對于任何一個互聯(lián)網(wǎng)公司來說,每天都在產(chǎn)生上千萬上億的調(diào)查問卷,而這些調(diào)查問卷,如何去改進(jìn)我們的商業(yè)模式,是一個非常重要的課題。也是我們今天為什么會談大數(shù)據(jù),會談精益運(yùn)營的原因。

  我們先看一看非結(jié)構(gòu)化數(shù)據(jù)的挑戰(zhàn)。剛才講了,現(xiàn)在數(shù)據(jù)世界正以每三年翻一番的速度在膨脹,而這其中95%以上都是非結(jié)構(gòu)化數(shù)據(jù),而且這個比例還在不斷的提升,而不是下降。也就是說我們會有越來越多的非結(jié)構(gòu)化數(shù)據(jù)產(chǎn)生。如此驚人的數(shù)據(jù),應(yīng)該如何收集,如何保存,如何進(jìn)行分析和挖掘,這又是一個很重要的課題。非結(jié)構(gòu)化數(shù)據(jù),主要的用途是用來做交互,但是今天計(jì)算機(jī)對于語義的理解是非常原始的。所以在交互上,我們發(fā)現(xiàn)它仍然有非常巨大的提升空間。我們知道有自然語言分析、NLP這樣的一些技術(shù),但是它們今天仍然很原始。我們還有語音識別,有視頻或者圖片里面對于場景、對于動作的捕捉與識別等,但是這些新的分析方法都還非常的早期。這些新的分析方法如果能夠往前走的話,那么這個數(shù)據(jù)時代會有多大的想象空間。正因?yàn)槲覀兊姆治瞿芰€很原始,所以今天幾乎所有的非結(jié)構(gòu)化數(shù)據(jù)都沒有二次分析。用戶每一次溝通,每一次交互過程當(dāng)中,都沉淀了大量的信息,這些信息如何挖掘,是很重要的課題。

  接下來談一談用戶行為的記錄,我認(rèn)為這個是遠(yuǎn)未充分挖掘的金礦。因?yàn)榻裉旌芏嗥髽I(yè)沒有用戶行為記錄,他們大部分業(yè)務(wù)還沒有聯(lián)網(wǎng)。所以他們今天想得更多的是讓業(yè)務(wù)上網(wǎng)。但是其實(shí)哪怕是互聯(lián)網(wǎng)公司,今天日志的處理能力、分析方法,以及產(chǎn)生對經(jīng)營有效指導(dǎo)的能力依然存在很多不足。大部分的公司停留在比如日活用戶的分析等基礎(chǔ)的階段。

  第三點(diǎn)是,絕大部分企業(yè)日志會定期刪除,因?yàn)樗麄儾荒芾斫鈹?shù)據(jù)分析之后還能干什么。日志是計(jì)算機(jī)生成的,所以它天然可以很容易被計(jì)算機(jī)去理解,這個理解是全面的,不會損失什么信息。所以日志本身是一個更高含金量的金礦,但是大部分的企業(yè)其實(shí)并沒有意識到這一點(diǎn)。所以我認(rèn)為,今天日志的使用量,還處于一個非常原生的狀態(tài)。

  那么今天談這些對于我們來說有什么意義呢?這個就涉及到七牛對于自己的定位。如果用一句話來描述七牛對于自己的定位就是,七牛是最開放、最完備的數(shù)據(jù)服務(wù)提供商。最開放的含義是什么呢?我們希望不是七牛把所有的數(shù)據(jù)服務(wù)給提供了,而是希望搭建一個平臺。因?yàn)槲覀儎倓偡治隽朔墙Y(jié)構(gòu)化數(shù)據(jù),分析了日志相關(guān)的一些挑戰(zhàn),這些挑戰(zhàn)絕不是七牛一家公司所能解決的,我們希望有志于去提升數(shù)據(jù)應(yīng)用價值的企業(yè),都能夠和七牛一起共同開拓這個世界,而不是單獨(dú)一家去做這樣的事情。最完備的含義是,我們希望能夠分析數(shù)據(jù)的使用場景,去觸及它的方方面面,去構(gòu)建一個完整的技術(shù)棧,構(gòu)建一個全息的商業(yè)模型。這是七牛對一個數(shù)據(jù)服務(wù)商的定位。

  今天七牛做了一些什么呢?大家都知道七?,F(xiàn)在叫七牛云存儲,其實(shí)在七牛出現(xiàn)之前已經(jīng)有很多的云存儲供應(yīng)商了,最典型的是亞馬遜。但是我們認(rèn)為,我們重新定義了云存儲這個概念。為什么呢?因?yàn)樵贏WS上的S3,我們認(rèn)為它是一個零件,什么零件呢?就是云主機(jī)的附屬品。S3主要的能力是一個數(shù)據(jù)倉庫,它可以放東西,可以取東西。但七牛認(rèn)為云存儲不應(yīng)該僅僅是一個數(shù)據(jù)存儲的空間。首先,它是一個數(shù)據(jù)存儲的空間,所以我們有數(shù)據(jù)存儲這樣一個基礎(chǔ)服務(wù)。作為基礎(chǔ)服務(wù),它的核心價值很簡單,就是可靠,然后便宜,然后高可用,這個是它最基礎(chǔ)的幾個能力。第二個能力是加速。七??赡苁侨虻谝粋€提出用存儲、加速和處理這樣三個詞來描述云存儲這樣一個服務(wù)的公司。當(dāng)然后面我們看到業(yè)界也逐漸地認(rèn)同了這樣一個模式,幾乎所有的云存儲都在往這個方向走。

  那么加速是什么呢?七牛的加速是用一個相對比較獨(dú)特的方式,因?yàn)榇蠹衣牭郊铀龠@個詞,都會想到CDN,而CDN是存在了十幾年的一個服務(wù)形態(tài)。七牛的加速到底和CDN有什么不同呢?這跟七牛的做事方式很有關(guān)系。我們認(rèn)為市場上不差一個新的CDN公司。所以七牛對加速的定位是做一個CDN融合的公司。我們希望協(xié)助客戶管理CDN,讓這些CDN融合在一起,能夠提供更高品質(zhì)的,或者是更高可用性的CDN。因?yàn)槿魏我患褻DN,都可能會出現(xiàn)區(qū)域性的故障,這樣的情況下,我們可以協(xié)助自動地去解決問題。例如,有一些CDN可能在上??煲稽c(diǎn),有的CDN在廣州快一點(diǎn),我們可以融合,可以形成更高速的訪問。

  然后是數(shù)據(jù)處理。數(shù)據(jù)處理這個詞比較抽象,如果展開來講,它會呼應(yīng)我剛才講的那個非結(jié)構(gòu)化數(shù)據(jù)的挑戰(zhàn)里面最重要的一點(diǎn)——計(jì)算機(jī)對于非結(jié)構(gòu)化數(shù)據(jù)的理解其實(shí)是非常原始的。所以七牛成為一個真正開放的云存儲廠商,最重要的點(diǎn)在于我們的數(shù)據(jù)處理是一個開放平臺。七牛最近接入了非常多的數(shù)據(jù)處理服務(wù),例如圖片鑒黃、廣告過濾服務(wù)和文檔轉(zhuǎn)換服務(wù)等,還有正在接入的人臉識別等。

  還有什么呢?還有一點(diǎn)就是直播!因?yàn)橐曨l或者音頻,它是一個非常特殊的介質(zhì),因?yàn)樗幸粋€在線溝通的需求,這是傳統(tǒng)的存儲所沒有的。當(dāng)然因?yàn)橐曨l和音頻本身有流媒體的屬性,所以它天然有點(diǎn)播的需求。七牛的霹靂云是將直播和點(diǎn)播融合的平臺。我們可以在霹靂云上完成用戶的溝通,事后的點(diǎn)播,以及不同的網(wǎng)絡(luò)下不同碼率的轉(zhuǎn)換

  介紹了七牛當(dāng)前云存儲的概念之后,我們來看看七牛的一些數(shù)據(jù)。今天七牛的注冊企業(yè)有28萬,直接覆蓋網(wǎng)民每月月活3.7億,平臺上產(chǎn)生了1600億的文件,每天有750億的請求。我們的數(shù)據(jù)處理本身可以被加速,也就是同一個文件,哪怕它多次訪問,它只會處理一次,所以它的量會相對少一點(diǎn)。今天七牛的平臺上每天有12億數(shù)據(jù)的處理量。

  總結(jié)一下,七牛干了什么?我們認(rèn)為我們重新定義了云存儲,重新定義數(shù)據(jù)如何服務(wù)商業(yè)。很多人會問七牛未來會做一些什么,七牛到底會往什么方向發(fā)展?我認(rèn)為要符合這個時代的主題思想,就是創(chuàng)新和創(chuàng)造。今天和數(shù)據(jù)相關(guān)的幾個詞有云計(jì)算、有大數(shù)據(jù)。這些詞七牛是如何看待的,如何重新定義這些詞?我認(rèn)為2016年可以期待。

分享到

fanz

相關(guān)推薦