3月24日消息,中科院聯(lián)合阿里安全團(tuán)隊(duì)通過訓(xùn)練AI模型,研究表情和聲音的關(guān)系,完成了給定一段聲音和僅有一張正確人臉的若干張圖片,AI為該聲音找到“主人”的實(shí)驗(yàn)研究。
經(jīng)驗(yàn)證,相較于人類67%的正確率,AI的準(zhǔn)確率接近90%。在“1對(duì)N”的匹配實(shí)驗(yàn)中,AI還能對(duì)聲音歸屬人臉的“可能性”進(jìn)行排序。這種技術(shù)是一種自適應(yīng)的學(xué)習(xí)框架,用來(lái)挖掘和學(xué)習(xí)人臉與聲音的潛在聯(lián)系,該論文研究成果隨即被CVPR 2021接收。
據(jù)阿里安全圖靈實(shí)驗(yàn)室資深算法專家華棠介紹,該技術(shù)后續(xù)將在內(nèi)容安全和賬戶安全領(lǐng)域探索應(yīng)用,對(duì)抗偽造類視頻攻擊,保護(hù)用戶財(cái)產(chǎn)和信息安全。“有些人利用偽造視頻試圖騙過認(rèn)證系統(tǒng),AI的這項(xiàng)技能將進(jìn)一步驗(yàn)證聲音與相應(yīng)真人是否匹配,防范欺詐,守護(hù)安全?!比A棠說(shuō),這也是讓AI在提升安全水位上有更多用武之地。