新榜訊 由豆包大模型團(tuán)隊(duì)攜手北京交通大學(xué)、中國科學(xué)技術(shù)大學(xué)聯(lián)合提出的視頻生成實(shí)驗(yàn)?zāi)P汀癡ideoWorld”,有別于 Sora 、DALL-E 、Midjourney 等主流多模態(tài)模型,在業(yè)界率先達(dá)成無需依賴語言模型便能認(rèn)知世界的突破。當(dāng)下,該項(xiàng)目的代碼與模型已實(shí)現(xiàn)開源。
掃描二維碼
手機(jī)瀏覽
豆包:視頻生成模型“VideoWorld”可僅靠視覺認(rèn)知世界 現(xiàn)已開源
分享文章鏈接
相似推薦

騰訊混元視頻生成工具HunyuanCustom宣布開源
新榜訊 騰訊混元正式開源全新多模態(tài)定制化視頻生成工具 Hunyuan Custom。

豆包大模型團(tuán)隊(duì)開源基準(zhǔn)測試集SuperGPQA
新榜訊 3 月 4 日,豆包大模型團(tuán)隊(duì)于近日開源SuperGPQA。

阿里萬相視頻生成模型開源
新榜訊 阿里云旗下視覺生成基座模型萬相 2.1(Wan)震撼開源,此次開源遵循最為寬松的 Apache2.0 協(xié)議,14B 和 1.3B 兩個參數(shù)規(guī)格的全部推理代碼與權(quán)重盡數(shù)開源,并且支持文生視頻及圖生視頻任務(wù)。