每日一詞|文生視頻大模型 text-to-video large AI model
中國日報網(wǎng) 2024-05-07 14:33
4月27日,2024中關(guān)村論壇年會上首次發(fā)布我國自研的具“長時長、高一致性、高動態(tài)性”特點的文生視頻大模型Vidu。這一視頻大模型由清華大學聯(lián)合北京生數(shù)科技有限公司共同研發(fā),可根據(jù)文本描述直接生成長達16秒、分辨率高達1080P的高清視頻內(nèi)容。
Vidu, a text-to-video large AI model capable of creating a 16-second, high-definition video in 1080p resolution with a single click, was unveiled on April 27 at the 2024 Zhongguancun Forum. Developed by Tsinghua University and Chinese AI firm ShengShu Technology, Vidu is China's first video large AI model with "extended duration, exceptional consistency and dynamic capabilities".
【知識點】
Vidu是自Sora發(fā)布之后全球率先取得重大突破的視頻大模型。與Sora一致,Vidu能夠根據(jù)提供的文本描述直接生成長達16秒的高質(zhì)量視頻。除了在時長方面的突破外,Vidu在視頻效果方面實現(xiàn)顯著提升,主要體現(xiàn)在模擬真實物理世界、多鏡頭語言、時空一致性高、理解中國元素等方面。
在動態(tài)性方面,Vidu能生成復(fù)雜的動態(tài)鏡頭,不再局限于簡單的推、拉、移等固定鏡頭,而是能在一段畫面里實現(xiàn)遠景、近景、中景、特寫等不同鏡頭的切換,包括能直接生成長鏡頭、追焦、轉(zhuǎn)場等效果。
【函電賀詞】
當前,互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算、人工智能、區(qū)塊鏈等新技術(shù)深刻演變,產(chǎn)業(yè)數(shù)字化、智能化、綠色化轉(zhuǎn)型不斷加速,智能產(chǎn)業(yè)、數(shù)字經(jīng)濟蓬勃發(fā)展,極大改變?nèi)蛞刭Y源配置方式、產(chǎn)業(yè)發(fā)展模式和人民生活方式。
New technologies such as the internet, big data, cloud computing, artificial intelligence and blockchain are undergoing profound changes; the digitalized, intelligent and green transformation of industries are accelerating; and the intelligent industry and digital economy are thriving. These have greatly changed the global allocation of factors and resources, industrial development models, and people's lifestyles.
——2023年9月4日,習近平致2023中國國際智能產(chǎn)業(yè)博覽會的賀信
【相關(guān)詞匯】
智能產(chǎn)業(yè)
intelligent industry
算力
computing power
中國日報網(wǎng)英語點津工作室(本文于“學習強國”學習平臺首發(fā))