產品介紹
可靈大模型是由快手技術團隊精心研發的視頻生成解決方案,它利用先進的AI技術,幫助用戶無需復雜編輯技能即可產出引人入勝的藝術視頻內容。

產品功能
可靈大模型支持從腳本到視頻的自動轉化,具備視頻內容理解、情節生成、畫面渲染等全面功能,能夠根據用戶輸入的文本或概念快速生成高質量的藝術風格視頻。
文生視頻
- 大幅度的合理運動,可靈采用3D時空聯合注意力機制,能夠更好地建模復雜時空運動,生成較大幅度運動的視頻內容,同時能夠符合運動規律。
- 長達2分鐘的視頻生成,得益于高效的訓練基礎設施、極致的推理優化和可擴展的基礎架構,可靈大模型能夠生成長達2分鐘的視頻,且幀率達到30fps。
- 模擬物理世界特性,基于自研模型架構及Scaling Law激發出的強大建模能力,可靈能夠模擬真實世界的物理特性,生成符合物理規律的視頻。
- 強大的概念組合能力,基于對文本-視頻語義的深刻理解和 Diffusion Transformer 架構的強大能力,可靈能夠將用戶豐富的想象力轉化為具體的畫面,虛構真實世界中不會出現的的場景。
- 電影級的畫面生成,基于自研3D VAE,可靈能夠生成1080p分辨率的電影級視頻,無論是浩瀚壯闊的宏大場景,還是細膩入微的特寫鏡頭,都能夠生動呈現。
- 支持自由的輸出視頻寬高比,可靈采用了可變分辨率的訓練策略,在推理過程中可以做到同樣的內容輸出多種多樣的視頻寬高比,滿足更豐富場景中的視頻素材使用需求。
圖生視頻
可靈圖生視頻模型以卓越的圖像理解能力為基礎,將靜態圖像轉化為生動的5秒精彩視頻。配上創作者不同的文本輸入,即生成多種多樣的運動效果,讓您的視覺創意無限延展。
視頻續寫
可靈大模型支持對已經生成的視頻進行一鍵續寫,單次讓視頻運動延續4.5秒,運動內容合理、幅度顯著。得益于續寫中的文本控制,每一段續寫都能夠體現用戶的創意和想法。支持連續多次的續寫,最長可生成3分鐘的視頻,為創作者實現故事夢想提供了強有力的支持。
使用場景
適合短視頻創作者、廣告設計師、新媒體藝術家等,在內容創作、品牌宣傳、社交媒體分享等多個場景下,快速產出創意視頻,提高工作效率。

























評論 ( 0 )