可靈AI推出“多圖參考”功能 進一步攻克AI視頻一致性難題
近日,快手可靈AI正式面向全球推出“多圖參考”模式,該功能能夠理解和整合多個圖片中的不同主體,根據(jù)用戶的文字描述,創(chuàng)造性地生成融合視頻,進一步攻克了AI視頻生成中的一致性難題。
2025-01-23 15:06:26
來源:丁科技網(wǎng)??

近日,快手可靈AI正式面向全球推出“多圖參考”模式,該功能能夠理解和整合多個圖片中的不同主體,根據(jù)用戶的文字描述,創(chuàng)造性地生成融合視頻,進一步攻克了AI視頻生成中的一致性難題。

目前,全球用戶均可在可靈1.6模型下,使用“多圖參考”功能。用戶只需選擇圖生視頻,上傳1-4張參考圖,框選圖片中需要使用的人物、動物、物品或場景,并通過“提示詞”描述它們之間的變化或互動,可靈AI即可結合所有參考內(nèi)容并遵從指令生成視頻。

用戶可以上傳一張或多張同一主體(人物、動物、影視角色或物品等)的圖片,模型會以這些圖片為參考,生成統(tǒng)一風格的視頻,幫助用戶在制作AI視頻時保證多鏡頭中的主體一致。例如,用戶上傳貓、夾克、太陽鏡三張圖片,并輸入提示詞“一只身穿夾克、戴著太陽鏡的擬人化貓在舞臺上轉身并對著鏡頭擺姿勢,”隨后進行生成,就可以得到符合指令的視頻。

此外,用戶還可以通過參考圖來指定場景、服裝和動作等,讓人物在特定環(huán)境中完成特定“演出”,大幅提升創(chuàng)作的可控性。例如,我們分別上傳一個老爺爺、一杯咖啡、咖啡館場景三張參考圖片,并輸入相應提示詞“一個卡通風格的老爺爺在咖啡館里,端起咖啡杯”來進行生成,便可得到老爺爺坐在咖啡館里喝咖啡的視頻 。

同時,“多圖參考”還可以支持不同角色之間的互動。用戶可以上傳多個人物、動物或者影視角色等圖片,并用文字描述他們之間的互動。例如,我們分別上傳小男孩、柯基犬兩張參考圖,并輸入提示詞“一個可愛的小男孩在撫摸一只柯基犬”,即可生成下圖所示的視頻。

此前,可靈AI已在全球上線“人臉模型”功能,支持用戶通過上傳多段視頻來訓練、定制人臉模型,并參照該人臉模型繼續(xù)生成視頻內(nèi)容。作為業(yè)內(nèi)首個視頻模型定制功能,“人臉模型”創(chuàng)新性地滿足了用戶創(chuàng)作多個包含同一人物鏡頭的需求。

隨著“多圖參考”功能的推出,可靈AI進一步解決了視頻生成中的一致性難題,幫助用戶充分發(fā)揮創(chuàng)造力,自由組合各種圖片元素,打造獨特的創(chuàng)意場景,探索更多可能。

最新文章
1
科技行業(yè)超“級”玩家誕生 Vidda兩大新品助力年輕人享受科技樂趣
2
創(chuàng)維G7F Pro,為什么能“超越”O(jiān)LED?
3
康佳G9W新品全球首發(fā),全網(wǎng)最具性價比的Mini AI-LED壁紙電視
4
創(chuàng)維Mini LED電視G7F Pro震撼上市|極致體驗超越OLED
5
培生集團與亞馬遜云科技宣布 為全球數(shù)百萬人開啟AI賦能的個性化學習
6
空調(diào)子品牌2025很活躍:格力用晶弘打天下,美的系華凌求變化
7
第35屆中國家電交易會電商新渠道選品會:創(chuàng)新引領趨勢,賦能行業(yè)發(fā)展
8
100英寸Mini LED類紙屏!京東定制創(chuàng)維JD100 Mini開售:國補后8999元
9
2月中國電視市場海信出貨量第一!索尼、夏普等外資品牌繼續(xù)承壓
10
中國彩電出口創(chuàng)歷史新高,美加征關稅下能否持續(xù)增長?
11
315關注:國檢曝光網(wǎng)購家電質(zhì)量問題,平臺莫縱容偽劣家電泛濫
12
新款小鵬G6/G9最高降價近8萬,何小鵬很想再贏一次
13
蘋果帶頭干掉實體卡槽,eSIM終于要普及了?
14
憑借輕薄外觀與軟件優(yōu)化,OPPO Find N5備受女性用戶青睞
15
可搭桌面5090、內(nèi)置全套水冷,重量達10斤 你管這玩意叫筆記本?
16
TCL發(fā)布“第四代液晶電視”,前三代液晶電視分別什么樣?
17
中低端空調(diào)變天?格力子品牌晶弘將入場 華凌、Leader迎強力挑戰(zhàn)
18
平板電腦市場,華為=小米+榮耀+聯(lián)想
19
康佳新品G9W體驗:新品優(yōu)惠疊加國補,目前全網(wǎng)性價比最高的Mini LED壁紙電視
20
零跑B10想做13萬級智駕平權“屠夫”,憑什么?
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512