阿里巴巴iDST智能語音交互團隊研究員 馮津偉
馮津偉曾就讀國內頂級聲學研究機構南京大聲學研究所,師從音頻聲學泰斗沙家正先生,并與導師一起研制出了全球第一臺揚聲器紙盆共振頻率的自動測試系統(tǒng),極大地幫助了國內的電聲行業(yè)提高生產(chǎn)效率。馮津偉博士畢業(yè)于在主動降噪領域著名的弗吉尼亞理工大學VAL實驗室。
Polycom是語音和視頻協(xié)作解決方案領域的全球領導者,占全球視頻會議市場份額第一。馮津偉曾在Polycom工作17年,擁有十余項美國專利,大部分已產(chǎn)品化,是名聲在外的世界級音頻專家。他曾主持開發(fā)基于麥克風陣列的視頻跟蹤系統(tǒng),即在多人視頻會議時,攝像頭能基于方位和距離,精準定位發(fā)言人,產(chǎn)品創(chuàng)新性引業(yè)內效仿。
阿里巴巴iDST語音團隊負責人鄢志杰表示:“馮博士的入職,是物理學和互聯(lián)網(wǎng)間的‘跨界’。阿里嚴肅看待智能語音交互技術全鏈路,逐步組建世界級專家團隊。從源頭和信號采集開始,在端上做突破性的智能語音交互體驗。”
此前,iDST語音團隊的技術成果已通過阿里云人工智能ET等對外輸出,在法庭庭審識別、智能客服、視頻審核和實時字幕轉寫、聲紋驗證、物聯(lián)網(wǎng)等多個場景成功應用。全國有近300家法院和超過6000家法庭在使用ET,每年有超過1.2億次客服電話由ET協(xié)助人類接聽。
在語音交互產(chǎn)品方面,阿里iDST研究的技術平臺能夠精準轉換用戶的語音為對互聯(lián)網(wǎng)內容和服務的意圖,觸達手機、IoT設備、互聯(lián)網(wǎng)汽車、電視、智能音箱等各類終端,如與斑馬網(wǎng)絡、上汽合作的的榮威互聯(lián)網(wǎng)汽車、與海爾合作的人工智能電視等。
馮津偉入職后將依托其在聲學與信號處理領域的背景,主持領導語音交互設備端的研究工作。聲學是物理學分支學科之一,研究媒質中機械波的產(chǎn)生、傳播、接收和效應。以時下最熱門的智能音箱為例,如何選擇麥克風的材質、擺放位置、結構,就是聲學設計要解決的問題。
關于加入阿里巴巴,馮津偉認為是一次全新的機會。他表示,過去自己的專業(yè)知識基本用于會議模式,而未來阿里豐富的智能交互場景將為聲學設計與信號處理的發(fā)展提供寶貴的實戰(zhàn)經(jīng)驗。
馮津偉的研究方向為“下一代人機自然交互技術”,該領域已經(jīng)得到阿里巴巴重點投入,此前成立的“達摩院”就包含這一研究領域。
阿里巴巴iDST透露,馮津偉已參與一秘密項目開發(fā),項目在全球沒有先例。