騰訊云大數(shù)據(jù)首席架構(gòu)師 宋企皋

精彩觀點(diǎn)

AI與數(shù)據(jù)治理的深度融合將成為未來(lái)數(shù)據(jù)多模態(tài)管理、深度洞察與統(tǒng)計(jì)分析的重要發(fā)展方向。騰訊提出”AI for Data”技術(shù)方案,通過(guò)部署數(shù)據(jù)分析智能體與數(shù)據(jù)工程Agent,實(shí)現(xiàn)多模態(tài)數(shù)據(jù)的高效處理,降低業(yè)務(wù)人員數(shù)據(jù)開(kāi)發(fā)門(mén)檻并提升質(zhì)量效率。

在 AI 技術(shù)飛速發(fā)展的今天,大模型應(yīng)用的效果越來(lái)越多地被歸因于數(shù)據(jù)質(zhì)量 —— 當(dāng)算力瓶頸逐步緩解、通用大模型日益普及,數(shù)據(jù)資產(chǎn)的質(zhì)量與管理能力正成為決定 AI 落地成效的核心變量。從 “Data + AI” 到 “DataXAI”,數(shù)據(jù)與人工智能的融合已進(jìn)入深度協(xié)同階段,這不僅帶來(lái)了業(yè)務(wù)價(jià)值的重構(gòu),更對(duì)傳統(tǒng)數(shù)據(jù)治理模式提出了顛覆性挑戰(zhàn)。

技術(shù)架構(gòu)升級(jí):

支撐人機(jī)協(xié)同的數(shù)據(jù)底座

AI 與數(shù)據(jù)的深度融合,對(duì)基礎(chǔ)設(shè)施提出了更高要求。傳統(tǒng)私有化大數(shù)據(jù)平臺(tái)以結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)為主,難以應(yīng)對(duì)多模態(tài)數(shù)據(jù)的爆發(fā)式增長(zhǎng)與算力需求的彈性波動(dòng)。因此,數(shù)據(jù)平臺(tái)向云原生架構(gòu)演進(jìn)成為必然:通過(guò)存算分離實(shí)現(xiàn)資源彈性調(diào)度,依托統(tǒng)一元數(shù)據(jù)管理打通數(shù)據(jù)孤島,最終構(gòu)建能支撐多樣化 AI 場(chǎng)景的技術(shù)底座。

組織架構(gòu)的協(xié)同同樣關(guān)鍵。過(guò)去,企業(yè)的數(shù)據(jù)團(tuán)隊(duì)與 AI 團(tuán)隊(duì)往往獨(dú)立運(yùn)作,形成 “兩套工具、兩份數(shù)據(jù)” 的割裂狀態(tài)。而從去年下半年開(kāi)始,越來(lái)越多的企業(yè)將兩支團(tuán)隊(duì)整合,實(shí)現(xiàn) “一個(gè)團(tuán)隊(duì)、一個(gè)工具、一份數(shù)據(jù)” 的協(xié)同模式,這一調(diào)整不僅大幅提升了 AI 應(yīng)用開(kāi)發(fā)效率,更保障了數(shù)據(jù)資產(chǎn)的一致性與安全性。

2022 年起,騰訊啟動(dòng)數(shù)據(jù)智能升級(jí)項(xiàng)目,核心解決三大問(wèn)題:讓 AI 精準(zhǔn)理解業(yè)務(wù)需求、讓 AI 高效識(shí)別與調(diào)用數(shù)據(jù)、讓 AI 生成高質(zhì)量代碼以快速響應(yīng)需求。具體措施包括:

一、構(gòu)建 “人機(jī)共懂” 的數(shù)據(jù)資產(chǎn)體系。通過(guò)大模型識(shí)別通用業(yè)務(wù)特征,沉淀核心數(shù)據(jù)的標(biāo)準(zhǔn)化代碼片段,讓 AI 可直接調(diào)用成熟模塊;同時(shí)搭建數(shù)據(jù)資產(chǎn)語(yǔ)義層,將業(yè)務(wù)含義、指標(biāo)與代碼有機(jī)關(guān)聯(lián),提升自然語(yǔ)言到機(jī)器語(yǔ)言的轉(zhuǎn)化精度。

二、建立 “人機(jī)協(xié)同” 的工程體系。在傳統(tǒng) “人 – 流程” 協(xié)作模式中引入多 Agent 協(xié)同機(jī)制,讓業(yè)務(wù)人員可實(shí)時(shí)參與 AI 生成過(guò)程并基于經(jīng)驗(yàn)修正,形成 “越用越好” 的正向迭代循環(huán)。

智能數(shù)據(jù)湖:

面向未來(lái)的數(shù)據(jù)治理方案

基于上述實(shí)踐,騰訊云將大數(shù)據(jù)平臺(tái)升級(jí)為 “智能數(shù)據(jù)湖” 方案,核心包含四大能力:

數(shù)據(jù)分析智能體:以類(lèi) ChatBI 能力為核心,支持自然語(yǔ)言轉(zhuǎn) SQL 或代碼,目前在國(guó)際數(shù)據(jù)集測(cè)試中排名全球第三、國(guó)內(nèi)第一。通過(guò)多軌并行解析(基礎(chǔ)需求、Excel 需求、路徑分析等),進(jìn)一步提升代碼生成的準(zhǔn)確性與效率。

數(shù)據(jù)工程 Agent:聚焦數(shù)據(jù)開(kāi)發(fā)質(zhì)量提升,可快速定位代碼問(wèn)題,同時(shí)將 AI 能力融入數(shù)據(jù)分類(lèi)分級(jí)環(huán)節(jié),強(qiáng)化數(shù)據(jù)安全識(shí)別與風(fēng)險(xiǎn)監(jiān)測(cè)。

Data 與 AI 一體化平臺(tái):彌補(bǔ)傳統(tǒng) AI 平臺(tái)在數(shù)據(jù)安全管控、資產(chǎn)管理上的短板,通過(guò)原有數(shù)據(jù)開(kāi)發(fā)平臺(tái)的能力復(fù)用,實(shí)現(xiàn)大模型訓(xùn)練與應(yīng)用開(kāi)發(fā)的全流程高效支撐。

多模態(tài)數(shù)據(jù)管理與智能運(yùn)維:提前布局多模態(tài)數(shù)據(jù)存儲(chǔ)與治理能力,通過(guò)統(tǒng)一元數(shù)據(jù)管理(涵蓋技術(shù)元數(shù)據(jù)、業(yè)務(wù)元數(shù)據(jù)、模型及自定義函數(shù))實(shí)現(xiàn)跨應(yīng)用數(shù)據(jù)服務(wù);引入大模型輔助平臺(tái)運(yùn)維,提升大規(guī)模任務(wù)的穩(wěn)定性保障效率。

寫(xiě)在最后

盡管AI 與數(shù)據(jù)治理的融合仍處于探索階段,但在未來(lái),隨著多模態(tài)數(shù)據(jù)的持續(xù)涌入,數(shù)據(jù)治理將迎來(lái)新一輪升級(jí),AI 在深度洞察與統(tǒng)計(jì)分析中的作用將更加凸顯。騰訊云期待與更多企業(yè)攜手,共同完善數(shù)據(jù)智能體系,讓數(shù)據(jù)更好地支撐 AI 時(shí)代的業(yè)務(wù)創(chuàng)新與發(fā)展。

分享到

nina

相關(guān)推薦