Loading...

热门

WorldDreamer：一种通用世界模型，用于视频生成，能够在图像到视频合成、文本到视频生成、视频修补、视频风格化甚至动作到视频生成等方面展现出卓越的性能

AI视频创作8个月前发布阿强

WorldDreamer：一种通用世界模型，用于视频生成，能够在图像到视频合成、文本到视频生成、视频修补、视频风格化甚至动作到视频生成等方面展现出卓越的性能插图

WorldDreamer：WorldDreamer: Towards General World Models for Video Generation via Predicting Masked Tokens (world-dreamer.github.io)

WorldDreamer是一种通用世界模型，用于视频生成，通过预测掩码标记的令牌，能够在图像到视频合成、文本到视频生成、视频修补、视频风格化甚至动作到视频生成等方面展现出卓越的性能。

视界一粟YiSu有哪些功能？

1. 图像到视频合成

2. 文本到视频生成

3. 视频修补

4. 视频风格化

5. 动作到视频生成

产品特点：

WorldDreamer通过将图像和视频转换为视觉令牌，并进行令牌掩码操作，将文本和动作输入分别编码为嵌入，作为多模态提示，然后通过STPT预测掩码的视觉令牌，最终通过视觉解码器实现视频生成和编辑。

应用场景：

1. 自然场景视频生成

2. 驾驶环境视频生成

3. 视频编辑

视界一粟YiSu如何使用？

用户可以将图像、文本或动作输入转换为视觉令牌，并通过STPT预测掩码的视觉令牌，最终通过视觉解码器实现视频生成和编辑。

# AI视频创作

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

爱给网视频编辑器：一款在线的MP4视频编辑工具，提供了丰富的功能和简单易用的操作，让您能够轻松制作出精美的视频作品

47 0

Glato AI：一款利用人工智能技术快速生成高质量产品视频的工具，可以帮助用户轻松制作出有吸引力的视频广告，提高转化率和点击率

81 0

PlazmaPunk：从音乐生成视频，体验人工智能生成的视频

28 0

Reallusion IClone：一款实时3D动画软件，帮助您轻松创建令人惊叹的角色动画。无论您是动画制作专家还是初学者，iClone都能满足您的需求

73 0

字说：一款手机应用，可以快速制作文字动画视频，支持语音/文字自动识别和系统自动配音，拥有丰富的视频模板库，适用于社交平台发布、广告宣传和创意表达等场景

21 0

迅捷视频：一个专业的多媒体应用软件及技术服务平台，提供音视频转换、录制以及多媒体文件与移动设备间的传输和转换解决方案

67 0

暂无评论

暂无评论...