新浪科技訊 11月27日下午消息,巨人巨人網(wǎng)絡(luò)AI Lab與清華大學(xué)SATLab、網(wǎng)絡(luò)西北工業(yè)大學(xué)聯(lián)合推出三項(xiàng)音視頻領(lǐng)域的布多多模態(tài)生成技術(shù)成果,相關(guān)研究成果將陸續(xù)在GitHub、模態(tài)HuggingFace等平臺(tái)開源。生成術(shù)
本次發(fā)布的新成三項(xiàng)研究成果——音樂(lè)驅(qū)動(dòng)的視頻生成模型YingVideo-MV、零樣本歌聲轉(zhuǎn)換模型YingMusic-SVC與歌聲合成模型YingMusic-Singer,果相關(guān)技展現(xiàn)了團(tuán)隊(duì)在音視頻多模態(tài)生成技術(shù)上的開源最新成果。
據(jù)悉,巨人YingVideo-MV模型實(shí)現(xiàn)“一段音樂(lè)加一張人物圖像”即可生成一個(gè)音樂(lè)視頻片段。網(wǎng)絡(luò)該模型能夠?qū)σ魳?lè)進(jìn)行節(jié)奏、布多情緒與內(nèi)容結(jié)構(gòu)的模態(tài)多模態(tài)分析,從而使鏡頭運(yùn)動(dòng)與音樂(lè)的生成術(shù)高度同步,具備推、新成拉、果相關(guān)技搖、移等鏡頭語(yǔ)言,并通過(guò)長(zhǎng)時(shí)序一致性機(jī)制,有效緩解了長(zhǎng)視頻中常見(jiàn)的人物“畸變”與“跳幀”現(xiàn)象。
在音頻領(lǐng)域,YingMusic-SVC主打“真實(shí)歌曲可用”的零樣本歌聲轉(zhuǎn)換能力。它通過(guò)針對(duì)真實(shí)音樂(lè)場(chǎng)景的全面優(yōu)化,有效抑制了伴奏、和聲與混響對(duì)歌聲轉(zhuǎn)換的干擾,顯著降低了破音與高音失真的風(fēng)險(xiǎn),為高質(zhì)量的音樂(lè)再創(chuàng)作提供了穩(wěn)定的技術(shù)支撐。
而YingMusic-Singer歌聲合成模型則支持在給定旋律下輸入任意歌詞,即可生成發(fā)音清晰、旋律穩(wěn)定的自然歌聲。該模型的主要特點(diǎn)在于能夠靈活適應(yīng)不同長(zhǎng)度的歌詞,并支持零樣本音色克隆,提升了AI演唱在創(chuàng)作過(guò)程中的靈活度與實(shí)用性,降低音樂(lè)創(chuàng)作的門檻。
相關(guān)文章:
相關(guān)推薦:
兩只產(chǎn)品跑輸基準(zhǔn) 申萬(wàn)菱信知名基金經(jīng)理賈成東策略引爭(zhēng)議早安北京0820:今明兩天仍有雨;地鐵工人體育場(chǎng)站運(yùn)營(yíng)將有調(diào)整 — 新京報(bào)美團(tuán)官宣:Keeta正式上線卡塔爾,數(shù)月后正式進(jìn)入巴西國(guó)信證券李斌:投顧業(yè)務(wù)應(yīng)把握當(dāng)下多元化資產(chǎn)配置與AI賦能趨勢(shì)消費(fèi)貸貼息落地倒計(jì)時(shí):多家銀行堅(jiān)守3%利率紅線,有大行App即將上線“貼息專區(qū)”嚴(yán)弟勇任中國(guó)黃金協(xié)會(huì)黨委委員、書記白宮稱俄烏兩國(guó)總統(tǒng)已表達(dá)坐下來(lái)談判的意愿新車毛利貢獻(xiàn)為負(fù) 汽車經(jīng)銷商求變懷表定格時(shí)刻 一位將軍殉國(guó)云南寧洱突發(fā)泥石流已致3人遇難1人失聯(lián) — 新京報(bào)
3.0559s , 13501.6953125 kb
Copyright © 2025 Powered by 巨人網(wǎng)絡(luò)AI Lab發(fā)布多模態(tài)生成新成果,相關(guān)技術(shù)將開源,素昧平生網(wǎng)