Wang
Zongwu
home
archives
categories
tags
Slides
Your browser does not support HTML5 video.
NEWS LETTER
视频生成模型研究综述notebooklm
Home
2026
Scroll down
Welcome to Zongwu's Science Hub ✨
Residence:
Shanghai
Age:
18
Contact Me
05/21
12:03
zongwu wang
请输入密码继续
Other Articles
Review
视频生成模型研究综述
26/05/20
12:08
Article table of contents
TOP
1.
视频生成范式的演进与理论底座
1.1.
生成对抗网络(GANs)的隐式博弈机制
1.2.
自回归模型(AR)的离散概率转移
1.3.
扩散模型(DMs)的显式分数匹配
2.
视频表征的压缩与潜在空间编码技术
2.1.
离散与连续变分潜在空间的理论分野
2.2.
2D 潜在空间充气与多维兼容性正则化
2.3.
3D 空间-时间因果自编码器的工程优化
2.4.
离散量化的飞跃:MAGVIT 家族与 Lookup-Free 机制
2.5.
变长时空补丁化(Spacetime Latent Patches)
3.
可控视频生成的引导机制与自适应对齐
3.1.
引导信号注入的三大机制
3.2.
主流可控生成任务的技术路线
4.
行业级视频生成系统架构与工作流解构
4.1.
OpenAI Sora:物理世界的宏大视界与分块逻辑
4.2.
Kuaishou Kling 3.0 / Kling-Omni:全维度统一的 Omni 架构
4.3.
Tencent HunyuanVideo & HunyuanVideo 1.5:轻量化降维与极致计算效率
4.4.
Alibaba Wan 2.1:极致能效比、多样任务矩阵与商业级双语排版
5.
视频数据集、后训练对齐与评估指标体系
5.1.
视频语言数据集的代际更迭
5.2.
视频生成的后训练对齐与 Video Consistency Distance (VCD) 机制
5.3.
视频评估体系:从 FVD 到 VBench 2.0 的内在忠实度革命
6.
深度伪造防御、隐私合规与多层溯源生态
6.1.
深度伪造的威胁加剧与多层级防御
6.2.
C2PA:密码学锚定的内容原产地标准
6.3.
全球合规与政策刚性约束
7.
结论与未来研究方向
8.
参考文献
Please enter keywords to search