9 月 11 日消息,美圖公司旗下美圖秀秀、RoboNeo、Wink 和 開拍等多款產品已基于通義萬相系列模型進行深度開發(fā)與訓練,推出全新動漫特效、AI 變身等視頻生成功能。
早在去年 6 月,美圖就已和阿里展開大模型合作,目前基于開源的通義萬相首尾幀生視頻、圖生視頻和文生視頻等模型,美圖結合自身在影像領域積累的經驗已訓練多個垂直領域模型,并在美圖秀秀、RoboNeo 和 Wink 等多款產品上線。
據介紹,基于通義萬相首尾幀生視頻模型以及美圖“AI 換裝”能力,美圖秀秀與Wink 推出了“打歌舞臺”“相撲小子”“復古美漫”等功能風格,在穩(wěn)定性和一致性上均表現優(yōu)秀。例如使用打歌舞臺功能,用戶僅需上傳一張人物照片,就能生成一段身穿舞臺服裝的人物形象在演唱會場景下舞動的視頻。
基于通義萬相圖生視頻模型,美圖訓練了垂直領域模型,目前已在美圖旗下 AI 口播工具開拍“創(chuàng)意片頭”功能上線,用戶無需復雜提示詞,就能一鍵生成創(chuàng)意片頭,幫助視頻創(chuàng)作者快速實現短視頻開頭的“黃金 3 秒”創(chuàng)意,讓非專業(yè)用戶也能一鍵做出有網感的開場效果。
此外,基于通義萬相全能編輯模型 VACE,美圖旗下視頻編輯工具 Wink 和影像智能體 RoboNeo 上線了視頻轉繪風格功能,可將視頻一鍵轉換成多種動漫風格;RoboNeo還深度集成了通義萬相的文生視頻能力,用戶只需輸入一句話,就可以快速生成一段連貫且動態(tài)化的短視頻,大幅降低視頻創(chuàng)作的門檻。
自今年 2 月以來,通義萬相已連續(xù)開源文生視頻、圖生視頻、首尾幀生視頻、全能編輯、音頻生視頻等多款模型,在開源社區(qū)和三方平臺的下載量已超3000萬,是開源社區(qū)最受歡迎的視頻生成模型之一。目前,通義萬相系列模型已廣泛應用于影像、設計、影視等行業(yè)。
校對 陶善工