數(shù)據(jù)被視為AI學習的核心教材。然而,AI在工業(yè)等復雜場景落地時,常面臨行業(yè)知識匱乏、高質量數(shù)據(jù)稀缺等瓶頸,急需專業(yè)人才參與建設。專業(yè)的AI數(shù)據(jù)標注師,被譽為“AI教官”,他們通過精確標注和修正,確保訓練數(shù)據(jù)準確、無偏見,以此提升模型輸出的安全性與可靠性,并持續(xù)“教導”AI理解語義、更通人情。
趙秋燕是某財經大學金融學本科畢業(yè),曾從事會計工作,擅長糾正AI回答的金融問題。學法律的嚴馮娜,主要工作是標注大模型輸出文字中涉及的“紅線”問題,教AI“什么能說,什么不能說”。標注師李寧曾經是個美術老師,他需要面對大量圖片數(shù)據(jù),標注其中的“內容風險”。醫(yī)學、外語、旅游等領域的專業(yè)人才也正加入各垂類模型的數(shù)據(jù)標注工作。
“螞蟻數(shù)科AI標注師隊伍的平均學歷在本科以上,太倉政府在園區(qū)建設、人才招募、生態(tài)企業(yè)入駐等方面提供了強力支持?!蔽浵仈?shù)科AI科技事業(yè)部總經理張凱介紹,螞蟻數(shù)科已與江蘇多所高校開展產教融合、孵化AI實戰(zhàn)人才。按計劃,基地未來將擴展至300人規(guī)模。
技術層面,螞蟻數(shù)科自研的AI數(shù)據(jù)標注平臺可智能推薦標注內容、自動補全標簽,結合自動化質檢與人工抽檢雙重保障數(shù)據(jù)質量。當前其標注服務已覆蓋金融風控、內容審核、自動駕駛、智能客服等數(shù)十個場景,為多領域大模型產業(yè)化提供可靠的數(shù)據(jù)基石。