AI語音合成是指使用人工智能技術(shù)將文字轉(zhuǎn)化為語音的過程。簡單來說,語音合成就是讓機(jī)器模仿人類說話,即輸入一段文字,最終輸出一段語音。在AI語音合成中,最新興起的技術(shù)是AI語音克隆,它指的是使用人工智能和機(jī)器學(xué)習(xí)算法來模仿特定人的語音,生成與目標(biāo)人聲音非常相似的合成語音,包括其音調(diào)、節(jié)奏、語調(diào)和情感特征。
AI語音合成技術(shù)的應(yīng)用前景廣泛,它可以創(chuàng)建個性化的虛擬助手,可以為影視劇、短視頻、游戲等領(lǐng)域的配音帶來全新的可能,還可以為音樂制作提供新的創(chuàng)作維度。但同時(shí),AI語音合成技術(shù)可能構(gòu)成潛在的侵權(quán)風(fēng)險(xiǎn)。例如:2023年爆火的頂流歌手“AI孫燕姿”,是利用AI軟件在音頻素材中提取歌手本人的聲音,大量產(chǎn)出翻唱視頻,并模仿歌手的音色、唱腔,達(dá)到以假亂真的程度,引發(fā)了侵權(quán)爭議;2024年4月23日,北京互聯(lián)網(wǎng)法院對全國首例AI生成聲音人格權(quán)侵權(quán)案進(jìn)行一審判決,明確認(rèn)定在具備可識別性的前提下,自然人聲音權(quán)益的保護(hù)范圍可及于AI生成聲音,AI生成聲音可識別性的認(rèn)定應(yīng)綜合考慮行為人使用情況,并以相關(guān)領(lǐng)域普通聽眾能否識別作為判斷標(biāo)準(zhǔn)。
主辦單位:湖北省文學(xué)藝術(shù)界聯(lián)合會 技術(shù)支持:荊楚網(wǎng)
地址:湖北省武漢市武昌區(qū)東湖路翠柳街一號
聯(lián)系電話:027-68880703 留言信箱:[email protected] 郵政郵編:430071
鄂公網(wǎng)安備 42010602002566號
發(fā)表時(shí)間:2024-04-25 來源: 作者:
AI語音合成是指使用人工智能技術(shù)將文字轉(zhuǎn)化為語音的過程。簡單來說,語音合成就是讓機(jī)器模仿人類說話,即輸入一段文字,最終輸出一段語音。在AI語音合成中,最新興起的技術(shù)是AI語音克隆,它指的是使用人工智能和機(jī)器學(xué)習(xí)算法來模仿特定人的語音,生成與目標(biāo)人聲音非常相似的合成語音,包括其音調(diào)、節(jié)奏、語調(diào)和情感特征。
AI語音合成技術(shù)的應(yīng)用前景廣泛,它可以創(chuàng)建個性化的虛擬助手,可以為影視劇、短視頻、游戲等領(lǐng)域的配音帶來全新的可能,還可以為音樂制作提供新的創(chuàng)作維度。但同時(shí),AI語音合成技術(shù)可能構(gòu)成潛在的侵權(quán)風(fēng)險(xiǎn)。例如:2023年爆火的頂流歌手“AI孫燕姿”,是利用AI軟件在音頻素材中提取歌手本人的聲音,大量產(chǎn)出翻唱視頻,并模仿歌手的音色、唱腔,達(dá)到以假亂真的程度,引發(fā)了侵權(quán)爭議;2024年4月23日,北京互聯(lián)網(wǎng)法院對全國首例AI生成聲音人格權(quán)侵權(quán)案進(jìn)行一審判決,明確認(rèn)定在具備可識別性的前提下,自然人聲音權(quán)益的保護(hù)范圍可及于AI生成聲音,AI生成聲音可識別性的認(rèn)定應(yīng)綜合考慮行為人使用情況,并以相關(guān)領(lǐng)域普通聽眾能否識別作為判斷標(biāo)準(zhǔn)。
湖北省文學(xué)藝術(shù)界聯(lián)合會
技術(shù)支持:荊楚網(wǎng)
地址:湖北省武漢市武昌區(qū)東湖路翠柳街一號 郵政郵編:430071
聯(lián)系電話:027-68880703 留言信箱:[email protected]
鄂ICP備12015471號-2