新榜訊 阿里云旗下視覺生成基座模型萬相 2.1(Wan)震撼開源,此次開源遵循最為寬松的 Apache2.0 協(xié)議,14B 和 1.3B 兩個參數(shù)規(guī)格的全部推理代碼與權(quán)重盡數(shù)開源,并且支持文生視頻及圖生視頻任務(wù)。據(jù)了解,14B 萬相模型于指令遵循、復(fù)雜運動生成、物理建模、文字視頻生成等領(lǐng)域表現(xiàn)卓越。1.3B 版本的測試結(jié)果不但超越了尺寸更大的開源模型,甚至接近部分閉源模型,同時能夠在消費級顯卡上運行,僅需 8.2GB 顯存便可生成高品質(zhì)視頻,適用于二次模型開發(fā)及學(xué)術(shù)研究。(記者 黃心怡)