新榜訊 據(jù)天眼查知識產(chǎn)權(quán)信息,2 月 7 日,阿里巴巴(中國)有限公司所申請的“一種圖生視頻方法和裝置”專利予以公布。該專利摘要表明,此發(fā)明實施例先將包含目標對象的源圖像輸入第一視頻生成模型獲取素材視頻,依此確定幀間變換矩陣序列。接著從源圖像中獲取目標對象對應(yīng)的對象掩碼圖像,將幀間變換矩陣序列作用于對象掩碼圖像可得多張掩碼圖像從而構(gòu)成掩碼圖像序列,應(yīng)用于源圖像則可得多張目標對象圖像從而組成目標對象圖像序列。依據(jù)源圖像、掩碼圖像序列和目標對象圖像序列確定目標輸入數(shù)據(jù),再將其輸入支持局部重繪的第二視頻生成模型,從而得到相應(yīng)的目標視頻。通過這兩次模型來生成視頻,達成了智能化端到端的圖生視頻,在無需引入預(yù)設(shè)運動參數(shù)的情況下,既能保持目標對象不擴散,又能實現(xiàn)運動軌跡的多樣性。