HPDA(高性能數(shù)據(jù)分析)即利用高性能計(jì)算的并行處理運(yùn)行強(qiáng)大分析軟件實(shí)現(xiàn)快速數(shù)據(jù)洞察的過程,目前主要是幫助用戶更好地應(yīng)對(duì)數(shù)據(jù)密集型應(yīng)用(包括大數(shù)據(jù)和AI負(fù)載)爆發(fā)帶來的挑戰(zhàn),打開數(shù)據(jù)價(jià)值新空間,不久的將來HPDA應(yīng)用創(chuàng)新將拓展至各行各業(yè)。
以自動(dòng)駕駛為例,談HPDA的存儲(chǔ)要求
多樣化數(shù)據(jù)密集型負(fù)載為行業(yè)應(yīng)用帶來新活力,但也為HPDA的海量數(shù)據(jù)存儲(chǔ)和管理帶來了不小的麻煩。我們以自動(dòng)駕駛為例,首先,自動(dòng)駕駛汽車能夠?qū)崿F(xiàn)自主上路行駛是基于汽車不同部位的傳感器感知與其所在周邊環(huán)境的地圖繪制。
國(guó)際自動(dòng)機(jī)工程師學(xué)會(huì)(簡(jiǎn)稱SAE)將自動(dòng)駕駛分為六個(gè)等級(jí),L0是人工駕駛,然后L1-5依次是輔助駕駛、部分自動(dòng)駕駛,條件自動(dòng)駕駛,高度自動(dòng)駕駛,完全自動(dòng)駕駛。大家現(xiàn)在能等到普及的應(yīng)該至少是L3級(jí)的條件自動(dòng)駕駛。但隨著自動(dòng)駕駛等級(jí)的增加,汽車上安裝的傳感器數(shù)量也會(huì)成倍增加,繪制地圖越來越豐富代表,所需的3D建模越來越復(fù)雜,實(shí)景圖片越來越多,因此,自動(dòng)駕駛需要分析處理的數(shù)據(jù)增長(zhǎng)可見一斑。
在汽車傳感器中,雷達(dá)傳感器負(fù)責(zé)監(jiān)視附近車輛的位置。攝像頭負(fù)責(zé)檢測(cè)和辨別紅綠燈,標(biāo)注路標(biāo),識(shí)別其它車輛和行人。激光雷達(dá)(光檢測(cè)和測(cè)距)傳感器則是通過汽車周圍反射光脈沖來測(cè)量距離,檢測(cè)道路邊緣并識(shí)別車道標(biāo)記。
以激光雷達(dá)反射光生成的3D點(diǎn)云數(shù)據(jù)為例,3D點(diǎn)云數(shù)據(jù)可以立體呈現(xiàn)汽車周邊空間的物體位置點(diǎn)、RGB顏色、灰度值、深度、分割結(jié)果等信息,之后需要將這些數(shù)據(jù)進(jìn)行清洗標(biāo)注后喂進(jìn)算法模型做反復(fù)訓(xùn)練。
當(dāng)然,在自動(dòng)駕駛領(lǐng)域的3D點(diǎn)云數(shù)據(jù)也有問題亟需解決——龐大數(shù)據(jù)量存儲(chǔ)和算力需求。目前常用的激光雷達(dá)掃描儀每秒均能產(chǎn)生成千上萬個(gè)點(diǎn),每次掃描獲取的數(shù)據(jù)點(diǎn)數(shù)可達(dá)數(shù)十萬、數(shù)百萬,數(shù)據(jù)量動(dòng)輒幾十至幾百G,全部存下來都是問題,何況還要通過處理分析獲取價(jià)值。
戴爾PowerScale和HPDA的適配度
為了處理指數(shù)級(jí)增長(zhǎng)的傳感器數(shù)據(jù),作為自動(dòng)駕駛汽車“決策大腦”的ADAS先進(jìn)駕駛輔助系統(tǒng)(Advanced Driving Assistance System)基礎(chǔ)架構(gòu)要求采用的存儲(chǔ)設(shè)備要在并發(fā)接收和流式傳輸海量數(shù)據(jù)時(shí)提供一致的性能,對(duì)不同類型數(shù)據(jù)的存儲(chǔ)、管理(收發(fā)訪問)都設(shè)置了高門檻。
戴爾PowerScale存儲(chǔ)系統(tǒng)為非結(jié)構(gòu)化數(shù)據(jù)而生,包含全閃存存儲(chǔ)節(jié)點(diǎn)、混合型存儲(chǔ)節(jié)點(diǎn)、歸檔存儲(chǔ)節(jié)點(diǎn),滿足HPDA從高性能到大容量的需求,面對(duì)自動(dòng)駕駛行業(yè)挑戰(zhàn)同樣早有準(zhǔn)備。
比如,自動(dòng)駕駛應(yīng)用要收集來自傳感器的大量3D建模數(shù)據(jù)和圖片數(shù)據(jù)等,并確保對(duì)不同類型數(shù)據(jù)的快速訪問。PowerScale支持廣泛的文件傳輸協(xié)議如NFS、SMB、HDFS、S3、HTTP、FTP、NDMP、REST、SWIFT等,適用于各種類型工作負(fù)載,同一數(shù)據(jù)的訪問無需協(xié)議轉(zhuǎn)換和額外的時(shí)間開銷。
讓海量數(shù)據(jù)存儲(chǔ)與性能兼得,PowerScale采用橫向擴(kuò)展架構(gòu)和模塊化設(shè)計(jì),能實(shí)現(xiàn)百PB級(jí)容量的無縫擴(kuò)展,性能隨容量線性增長(zhǎng)。支持在線擴(kuò)容與軟件升級(jí),海量數(shù)據(jù)無需遷移。
同時(shí)PowerScale核心軟件系統(tǒng)OneFS構(gòu)建了不同性能資源池,讓數(shù)據(jù)按既定策略進(jìn)行流動(dòng),實(shí)現(xiàn)數(shù)據(jù)智能管理。同時(shí),PowerScale各類型節(jié)點(diǎn)皆支持?jǐn)?shù)據(jù)線內(nèi)縮減、重刪等功能,讓數(shù)據(jù)訪問和傳輸變得更加高效。
最后
包括自動(dòng)駕駛在內(nèi)的各種HPDA應(yīng)用開啟了數(shù)據(jù)掘金之旅。如何利用海量數(shù)據(jù)做有效分析,獲取數(shù)據(jù)價(jià)值是最重要的目標(biāo)。數(shù)據(jù)“挖掘”效率即競(jìng)爭(zhēng)力,只有在這場(chǎng)旅途中選擇適配度高的工具(存儲(chǔ)解決方案)才能快速打破數(shù)據(jù)壁壘,而戴爾PowerScale正是兼顧數(shù)據(jù)存管用的不二之選!