从视频片段中推断楼层平面图新AI研究令人大开眼界

日期：2021-01-12 来源：51cto 作者：itcg 浏览：530 我要评论

导读：平面布置图对于可视化空间、规划路线和沟通建筑设计非常有用。例如，一个进入新建筑的机器人�

平面布置图对于可视化空间、规划路线和沟通建筑设计非常有用。例如，一个进入新建筑的机器人可以使用平面图快速感知总体布局。创建平面图通常需要一个完整的布局，这样3D传感器和摄像机就可以捕捉到整个空间。

1月11日消息，据外媒报道，近日，来自Facebook、德克萨斯大学奥斯汀分校和卡内基梅隆大学的研究人员正在探索一种人工智能技术，利用视觉和音频，从一个短视频剪辑中重建一个平面图。

研究人员断言，音频提供了空间和语义信号，补充了图像的映射能力。他们说，这是因为声音天生是由物体的几何形状所驱动的。声音从表面反射回来，揭示了房间的形状，远远超出了相机的视野。从远处听到的声音，甚至是多个房间之外的声音，可以揭示自由空间的存在，声音物体可能存在。此外，从不同方向听到的声音暴露了基于这些声音所代表的活动或事物的布局。例如，淋浴的声音可能暗示着浴室的方向，而微波炉的声音则暗示着厨房的方向。

研究人员的方法被称为AV-Map，旨在将带有多通道音频的短视频转换成2D楼层平面图。机器学习模型利用音频和视觉数据序列来推理楼层平面图的结构和语义，最终使用解码组件融合音频和视频信息。AV-Map生成的平面图大大超出了视频中直接可见的区域，显示了划分为离散语义房间标签(如家庭房间和厨房)的自由空间和被占用区域。

该团队在来自Matternet3D和SoundSpaces数据集的数字环境中试验了两种设置，即主动和被动。在第一个实验中，使用一个虚拟摄像机在模型房屋的房间内移动时发出一种已知的声音。在第二种情况下，只依赖家中物体或人自然发出的声音。

研究人员表示，在未来的工作中，将计划考虑扩展多层平面图，并将绘图想法与机器人连接起来，主动控制摄像头。

AI 人工智能机器学习

点赞 0反对 0举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

0 条相关评论

头条阅读

推荐图文

西部数据推出 26TB 3.5 英寸硬盘，为创意专业人士和内容创作者增加容量	麒麟9006C：华为5纳米家族的新成员
中国大陆显示器线上市场：2023年11月销售火爆，创下新高	高通骁龙X Elite芯片挑战苹果M系列：硬件性能对决

相关资讯

• AI直播新时代：机器人主播与人类主播如何共舞？	• 油电可逆新潮流？Horse Powertrain上海车展展示
• iPhone 17系列机模抢先看：Air新登场，屏幕尺寸	• 从训练到部署一体化！攀升AIPC-开发者主机重新
• 抽签购买立减8000！50系AI战神宏碁暗影骑士·擎	• 50系AI战神今日开售！宏碁暗影骑士·擎7系列159
• 华硕灵耀14 Air骁龙版：轻薄本中的性能美学新典	• EMEET广交会亮相：双镜头AI直播产品，引领智能
• 能源AI新势力！中科类脑亿元融资，领跑万亿数字	• 华为Vision智慧屏5：鸿蒙AI引领，智能电视新体

从视频片段中推断楼层平面图 新AI研究令人大开眼界

从视频片段中推断楼层平面图新AI研究令人大开眼界