云測數(shù)據(jù)是Testin云測旗下AI數(shù)據(jù)標注服務(wù)品牌,通過自建數(shù)據(jù)場景實驗室和數(shù)據(jù)標注基地,為智能駕駛、智慧城市、智能家居、智慧金融、新零售等眾多領(lǐng)域提供高質(zhì)量的數(shù)據(jù)采集、數(shù)據(jù)標注服務(wù),全方位支持文本、語音、圖像、視頻等各類型數(shù)據(jù)的處理。
截至目前,云測數(shù)據(jù)在華東、華北、華南設(shè)有數(shù)據(jù)交付中心和數(shù)據(jù)場景實驗室,已成功為眾多企業(yè)提供AI數(shù)據(jù)服務(wù)。
99.99%這個標準如何得來?意味著什么?帶著這些問題,《中國經(jīng)濟周刊》在現(xiàn)場采訪了云測數(shù)據(jù)總經(jīng)理賈宇航。
數(shù)據(jù)質(zhì)量決定AI算法精度
“目前數(shù)據(jù)標注領(lǐng)域平均水平在95%左右,這是目前數(shù)據(jù)標注領(lǐng)域可達到的最高服務(wù)標準,成為AI數(shù)據(jù)服務(wù)邁入更高質(zhì)時代的一大里程碑,”賈宇航表示。
人工智能的三大要素即數(shù)據(jù)、算力、算法,算力和算法對應(yīng)的是分析運行能力,而更為基礎(chǔ)的數(shù)據(jù)則發(fā)揮著“教材”的作用。在人工智能技術(shù)場景落地的過程中,產(chǎn)生了更多對數(shù)據(jù)的需求。
賈宇航說,“作為人工智能的三要素之一,‘數(shù)據(jù)’從本質(zhì)上決定了人工智能的落地水平。通常來說,數(shù)據(jù)標注得越準確,數(shù)量越多,模型效果越好,最后的AI產(chǎn)品效果就越好”。
據(jù)了解,訓(xùn)練數(shù)據(jù)的生產(chǎn)過程被分為三個步驟:數(shù)據(jù)采集、數(shù)據(jù)清洗和數(shù)據(jù)標注。
數(shù)據(jù)采集指通過各種不同維度的硬件傳感器,將現(xiàn)實場景轉(zhuǎn)換為數(shù)據(jù),既數(shù)字化轉(zhuǎn)換過程;數(shù)據(jù)清洗指通過人工或機器輔助篩選的方式,基于特定規(guī)則,將有價值數(shù)據(jù)篩選的過程;數(shù)據(jù)標注指人工將像素、語音、文本等轉(zhuǎn)換為機器能理解,能看懂的AI數(shù)據(jù)內(nèi)容,從而成為被機器習(xí)得識別處理的方法。
算法的精度與數(shù)據(jù)質(zhì)量密不可分。賈宇航指出數(shù)據(jù)的數(shù)量不足、多樣性欠缺、標注的精確度低,都直接影響著AI產(chǎn)品質(zhì)量。
數(shù)據(jù)質(zhì)量決定著AI算法的精度,算法精度決定產(chǎn)品質(zhì)量。
云測數(shù)據(jù)助力產(chǎn)業(yè)智能化
目前,人工智能行業(yè)已經(jīng)從感知智能上升到認知智能,人工智能技術(shù)的場景化落地需要更加精準且高質(zhì)的AI數(shù)據(jù)做支撐。在此次服貿(mào)會上,云測數(shù)據(jù)也正式對外發(fā)布了智慧城市、智能家居、智能駕駛、智慧金融全鏈條的AI訓(xùn)練數(shù)據(jù)服務(wù)方案。
“云測數(shù)據(jù)進行99.99%的成果展示,也是向外傳遞數(shù)據(jù)標注高質(zhì)量發(fā)展信心”。賈宇航認為,成果的取得來自三方面的積累:實力、能力和方案。
第一點,云測數(shù)據(jù)對產(chǎn)業(yè)賦能,提供了從平臺自研、數(shù)據(jù)場景實驗室建立、數(shù)據(jù)交付中心的建立、自身專業(yè)工作人員積累、高效的組織協(xié)同方式等的一體化的服務(wù),為需要高質(zhì)量的AI數(shù)據(jù)處理內(nèi)容,做到了有力的保證。
第二點是能力,也就是多維度數(shù)據(jù)處理的能力。作為頭部AI數(shù)據(jù)服務(wù)商,云測數(shù)據(jù)做到了視覺,語音,文本的全品類支撐,面對這三個維度的AI算法,數(shù)據(jù)的需求層次和維度也在發(fā)生變化,需要做到更高精度的支持。云測數(shù)據(jù)采用的基于規(guī)則的機器篩查方式,在人工校驗流程前根據(jù)所標注項目要求,引入相關(guān)查錯規(guī)則,為數(shù)據(jù)精度提升設(shè)置保障。
第三點是方案。云測數(shù)據(jù)所積累的硬實力和軟實力,以及在圖像、語音、文本中所積累的服務(wù)能力,都是為了產(chǎn)業(yè)賦能。結(jié)合上述的積累及行業(yè)深耕,云測數(shù)據(jù)輸出了智慧城市、智能家居、智能駕駛、智慧金融四大行業(yè)領(lǐng)域的訓(xùn)練數(shù)據(jù)服務(wù)解決方案。從而幫助更多AI企業(yè)能更快更好的完成產(chǎn)業(yè)落地。
艾瑞咨詢調(diào)查顯示,2019年中國AI基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)市場規(guī)??蛇_30.9億元,其中圖像類數(shù)據(jù)需求規(guī)模最大,占比接近一半;預(yù)計2025年市場規(guī)模將突破100億元。
云測數(shù)據(jù)作為助力產(chǎn)業(yè)智能化的重要一環(huán),將立足數(shù)據(jù)安全,瞄準更高質(zhì)量,聚焦落地場景,持續(xù)加大在AI數(shù)據(jù)領(lǐng)域的技術(shù)研發(fā)與落地實踐,充分發(fā)揮AI數(shù)據(jù)的基建力量。