推广 热搜： 京东联通 iphone11 摄像头 iPhone 企业存储 XSKY 京东智能采购网络安全自动驾驶

首页 > 资讯 > 云计算

仅需2张图，AI便可生成完整运动过程

日期：2021-05-08 来源：量子位作者：itcg 浏览：390 我要评论

导读：本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。先给一张侧脸（关键帧1）：

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

先给一张侧脸（关键帧1）：

仅需2张图，AI便可生成完整运动过程

再给一张正脸（关键帧2）：

仅需2张图，AI便可生成完整运动过程

然后仅仅根据这两张图片，AI处理了一下，便能生成整个运动过程：

仅需2张图，AI便可生成完整运动过程

而且不只是简单的那种，连在运动过程中的眨眼动作也“照顾”得很到位。

效果一出，便在Reddit上引发了不少热议：

仅需2张图，AI便可生成完整运动过程仅需2个关键帧，如何实现完整运动？

不需要冗长的训练过程。

不需要大量的训练数据集。

这是论文作者对本次工作提出的两大亮点。

具体而言，这项工作就是基于关键帧将视频风格化。

先输入一个视频序列 I ，它由N个帧组织，每一帧都有一个掩膜Mi来划分感兴趣的区域。

与此前方法不同的是，这种风格迁移是以随机顺序进行的，不需要等待顺序靠前的帧先完成风格化，也不需要对来自不同关键帧的风格化内容进行显式合并。

仅需2张图，AI便可生成完整运动过程

也就是说，该方法实际上是一种翻译过滤器，可以快速从几个异构的手绘示例 Sk 中学习风格，并将其“翻译”给视频序列 I 中的任何一帧。

这个图像转换框架基于 U-net 实现。并且，研究人员采用基于图像块（patch-based）的训练方式和抑制视频闪烁的解决方案，解决了少样本训练和时间一致性的问题。

而为了避免过拟合，研究人员采用了基于图像块的训练策略。

从原始关键帧（Ik）中随机抽取一组图像块（a），在网络中生成它们的风格化对应块（b）。

然后，计算这些风格化对应块（b）相对于从风格化关键帧（Sk）中取样对应图像块的损失，并对误差进行反向传播。

这样的训练方案不限于任何特定的损失函数。本项研究中，采用的是L1损失、对抗性损失和VGG损失的组合。

仅需2张图，AI便可生成完整运动过程

另一个问题便是超参数的优化。

这是因为不当的超参数可能会导致推理质量低下。

仅需2张图，AI便可生成完整运动过程

研究人员使用网格搜索法，对超参数的4维空间进行采样：Wp——训练图像块的大小；Nb——一个batch中块的数量；α——学习率；Nr——ResNet块的数量。

对于每一个超参数设置：

（1）执行给定时间训练；

（2）对不可见帧进行推理；

（3）计算推理出的帧（O4）和真实值（GT4）之间的损失。

而目标就是将这个损失最小化。

仅需2张图，AI便可生成完整运动过程团队介绍

这项研究一作为Ondřej Texler，布拉格捷克理工大学计算机图形与交互系的博士生。

而除了此次的工作之外，先前他和团队也曾做过许多有意思的工作。

例如一边画着手绘画，一边让它动起来。

仅需2张图，AI便可生成完整运动过程

再例如给一张卡通图片，便可让视频中的你顶着这张图“声情并茂”。

仅需2张图，AI便可生成完整运动过程

想了解更多有趣的研究，可戳下方链接。

参考链接：

[1]https://www.reddit.com/r/MachineLearning/comments/n3b1m6/r_fewshot_patchbased_training_siggraph_2020_dr/
[2]https://ondrejtexler.github.io/patch-based_training/index.html

AI 数据人工智能

点赞 0反对 0举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

0 条相关评论

头条阅读

推荐图文

西部数据推出 26TB 3.5 英寸硬盘，为创意专业人士和内容创作者增加容量	麒麟9006C：华为5纳米家族的新成员
中国大陆显示器线上市场：2023年11月销售火爆，创下新高	高通骁龙X Elite芯片挑战苹果M系列：硬件性能对决

相关资讯

• 3C品牌竞争新战场：AI技术下沉与海外布局谁主沉	• 时空壶AI同传：重塑跨语言交流新未来
• 华硕灵耀米兰展：材料革新、AI交互与工艺美学共	• 康佳发展秘籍：显示硬件+消费电子+AI，协同创新
• DeepMind Genie 2引领机器人训练新篇章，虚拟世	• 智能软体仿生鱼“金鳞”面世，能否在水族界掀起
• 亚马逊跟随微软脚步，数据中心扩张步伐放缓？	• 联想天禧AI生态春季发布会：端云混合AI新纪元，
• vivo X200 Ultra震撼发布：蔡司定焦+双芯影像，	• 腾讯“物种之眼”AI升级，智能守护生物多样性，