NEWS LETTER

视频生成模型研究综述notebooklm

Scroll down
Other Articles
Article table of contents TOP
  1. 1. 视频生成范式的演进与理论底座
    1. 1.1. 生成对抗网络(GANs)的隐式博弈机制
    2. 1.2. 自回归模型(AR)的离散概率转移
    3. 1.3. 扩散模型(DMs)的显式分数匹配
  2. 2. 视频表征的压缩与潜在空间编码技术
    1. 2.1. 离散与连续变分潜在空间的理论分野
    2. 2.2. 2D 潜在空间充气与多维兼容性正则化
    3. 2.3. 3D 空间-时间因果自编码器的工程优化
    4. 2.4. 离散量化的飞跃:MAGVIT 家族与 Lookup-Free 机制
    5. 2.5. 变长时空补丁化(Spacetime Latent Patches)
  3. 3. 可控视频生成的引导机制与自适应对齐
    1. 3.1. 引导信号注入的三大机制
    2. 3.2. 主流可控生成任务的技术路线
  4. 4. 行业级视频生成系统架构与工作流解构
    1. 4.1. OpenAI Sora:物理世界的宏大视界与分块逻辑
    2. 4.2. Kuaishou Kling 3.0 / Kling-Omni:全维度统一的 Omni 架构
    3. 4.3. Tencent HunyuanVideo & HunyuanVideo 1.5:轻量化降维与极致计算效率
    4. 4.4. Alibaba Wan 2.1:极致能效比、多样任务矩阵与商业级双语排版
  5. 5. 视频数据集、后训练对齐与评估指标体系
    1. 5.1. 视频语言数据集的代际更迭
    2. 5.2. 视频生成的后训练对齐与 Video Consistency Distance (VCD) 机制
    3. 5.3. 视频评估体系:从 FVD 到 VBench 2.0 的内在忠实度革命
  6. 6. 深度伪造防御、隐私合规与多层溯源生态
    1. 6.1. 深度伪造的威胁加剧与多层级防御
    2. 6.2. C2PA:密码学锚定的内容原产地标准
    3. 6.3. 全球合规与政策刚性约束
  7. 7. 结论与未来研究方向
  8. 8. 参考文献
Please enter keywords to search