新大模型可根据文本生成高清视频
创始人
2024-04-28 17:24:40
0

原标题:新大模型可根据文本生成高清视频

27日,在中关村论坛未来人工智能先锋论坛上,清华大学联合北京生数科技有限公司(以下简称“生数科技”)正式发布中国首个原创全自研视频大模型——Vidu。论坛现场,清华大学教授、生数科技首席科学家朱军向与会者展示了Vidu生成的视频,包括行驶在崎岖道路上的汽车、戴珍珠耳环的猫、弹吉他的熊猫等。与此前震撼业界的Sora一样,Vidu能够根据文本描述直接生成高质量视频。

“长时长、高一致性、高动态性”是Vidu的显著特征。朱军表示,研发团队的核心技术在于采用U-ViT架构。它由Diffusion与Transformer两个模型融合而来,可支持一键生成长达16秒的高清视频内容。

除了在时长方面优势突出,Vidu在视频效果方面也实现显著提升。朱军介绍,Vidu能模拟真实物理世界,生成的视频不但场景细节复杂,而且符合物理规律,例如合理的光影效果、细腻的人物表情等。Vidu还具有丰富的想象力,能生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容。此外,Vidu可理解多镜头语言,生成的视频不再局限于简单的推、拉、移等固定镜头,而是围绕同一主体实现远景、中景、近景、特写等不同镜头的切换,甚至能直接生成长镜头、追焦、转场等效果,给视频注入丰富的镜头表达。Vidu还独具文化特色,能很好理解中国元素,生成熊猫、龙等中国元素的视频。

值得一提的是,论坛上展示的视频都是从头到尾连续生成,没有明显的插帧现象。朱军说,与Sora一样,Vidu在文本到视频的转换过程中直接且连续,而且在底层算法上,是由单一模型完全端到端生成,不涉及插帧和其他多步骤处理。(记者何亮)

相关内容

热门资讯

江西19人获高校毕业生基层就业... 近日,教育部公布2024—2025年度“高校毕业生基层就业卓越奖学(教)金”获奖名单,全国共有418...
多地中小学取消期末统考 释放什... 近期,成都、广州、青岛、厦门等地宣布,取消非毕业年级区域性或跨校际期末统考,改由学校自主组织评价。这...
立足产业发展需求开展职业教育 (来源:劳动午报) 转自:劳动午报 人才兴则产业兴。职业院校要把学科专业设置调整优化这篇大文章做足做...
关于寒假期间参加校外培训致家长... 广大家长朋友们: 您好!2026年寒假已如约而至,为切实减轻中小学生校外培训负担,促进学生全面健康成...
学术探讨|AI赋能高职体育“课... (来源:黑龙江日报) 转自:黑龙江日报 □陈怡德 张思伟(通讯作者) 向国焕 为解决体育教学“课堂教...
60.那时候大家都很单纯、简洁... 百年大计,教育为本。有位学者说过:“教育有问题,但不仅是教育问题。”作为一个体制内的基层教育工作者,...
中小学课程实施与教材使用监测工... 近日,中小学课程实施与教材使用监测工作会在云南省昆明市召开。教育部党组成员、副部长、总督学王嘉毅出席...
“教师必须站着上课”:凭啥把“... 咱先掰扯个事儿啊,现在不少学校都默认“教师必须站着上课”,有的甚至明里暗里规定,坐着上课就是不负责、...
最新发布!致全市家长朋友们 关于2026年寒假校外培训致家长朋友们的一封信 尊敬的家长朋友们: 您好!2026年寒假即将来临之际...
新疆今年同步扩大10%的普通高... 来源:市场资讯 (来源:昌吉日报) 2026新疆两会第四场新闻发布会1月29日16时举行。 自治区党...
爱与规矩,是家庭教育的两只翅膀 想给孩子满满的爱,又怕没规矩惯坏他?好的家教从来不是二选一,爱与规矩缺一不可。不是单方面强制,而是平...
“小饭桌”怎么选?安全是第一! 为孩子挑选一处安全、营养且放心的校外就餐及休息场所,是每位家长的心头大事。近年来,被称为“小饭桌”的...
甘肃省酒泉市2025-2026... 一、阅读(72分) (一)阅读Ⅰ(本题共5小题,19分) 阅读下面的文字,完成1~5题。 材料一: ...
金湖农商银行 开展防范非法金融... 本报讯 为深入推进金融知识普及教育,切实增强青少年金融风险防范意识,日前,金湖农商银行“小圆服务队”...
“靓”一点·TA们的心声①丨这... (版权所有,未经许可请勿转载) 孩子们心中的教育,答案不是分数,而是奔跑时扬起风的操场,是安静独处的...
搭建沟通桥梁 共促民心相通 ■教育外交官话合作 开栏的话 今年是“十五五”开局之年,教育强国建设高起点布局、高质量推进。我国驻外...
张星:美术课上的心灵守护者 在吕梁市离石区江阴中学那间洒满阳光的画室里,一位穿着素雅的女教师,总静静地站在画架旁,专注地看着学生...