遠場多通道語音增強挑戰(zhàn)賽設置了兩個任務賽道,覆蓋單個麥克風陣列的多通道語音增強任務和多個分布式麥克風陣列的多通道語音增強任務。賽道一主要針對單個麥克風陣列的多通道語音增強任務,專注于現(xiàn)實視頻會議中算法實時處理的需求。賽道二針對多個分布式麥克風陣列的多通道語音增強任務,此挑戰(zhàn)任務專注于前沿算法研究,不設置任何算法限制。

目前,大賽報名通道已開啟,本次大賽的報名截至時間為3月7日,INTERSPEECH2021 Paper錄取結果通知將于6月2日公布,6月5日將公布大賽排名。在參賽規(guī)則方面,每個注冊成功的參賽團隊可選任何一個任務參加,或同時注冊兩個任務。

1611551703444291.png

此次比賽成績將通過騰訊在線多媒體主觀評估平臺,使用Absolute Category Ratings (ACR)來評估Mean Opinion Score (MOS)決定。獎金方面,每個任務排名為前兩名的隊伍將獲得由騰訊天籟實驗室提供的獎金,分別為1500 USD和800 USD。

值得一提的是,為了給參賽者提供真實視頻會議室的場景,遠場多通道語音增強挑戰(zhàn)賽數(shù)據(jù)庫采集的數(shù)據(jù)大部分來自于真人實錄,會議中人數(shù)以及人與麥克風陣列的距離都會隨著會議室的大小而變化,并且多個不同幾何拓撲結構的麥克風陣列被分布于每個采集錄音的會議室中。

同時,為了使參賽者更關注于算法研究,大賽將提供訓練數(shù)據(jù)的清單,只有清單中的數(shù)據(jù)可用于大賽兩個挑戰(zhàn)任務的模型訓練。此外,大賽還將提供開發(fā)集,生成訓練數(shù)據(jù)的代碼和多通道語音增強的基準系統(tǒng)代碼,以便于參賽者開發(fā)多通道語音增強技術。

一直以來,為了解決實時音視頻應用場景下的各種挑戰(zhàn),騰訊天籟實驗室圍繞著“聽得見,聽得清,聽得真”目標,對核心體驗技術和框架進行了深入的探索,并于去年發(fā)布了“面向實時音視頻應用的新一代實時音頻技術品牌”騰訊天籟。該技術方案已在騰訊會議等產(chǎn)品中獲得了有效驗證,成為騰訊會議高速成長背后的技術密碼,助力騰訊會議上線兩個月內日活躍用戶超過1000萬。未來,騰訊天籟實驗室將繼續(xù)鉆研音視技術,滿足更多行業(yè)場景下的實時音視頻需求,推進更多更豐富的場景落地而努力。

關注微信公眾號“騰訊天籟實驗室”報名參賽。

分享到

zhangnn

相關推薦