使用英特尔® 实感™ 技术实现深度感知和增强数字摄影





0/5 (0投票)
本文向软件开发者介绍英特尔®实感™技术在增强型数码摄影中实现深度感知所使用的关键机制。
英特尔®开发者专区提供跨平台应用开发工具和操作指南、平台与技术信息、代码示例以及同行专业知识,助力开发者创新和成功。加入我们的社区,了解 Android、物联网、英特尔®实感™技术和 Windows,下载工具、获取开发套件、与志同道合的开发者交流想法,并参与黑客松、竞赛、路演和本地活动。
通过为数码成像添加人类深度感知的“真实感知”,英特尔®实感™技术能够在主流平板电脑、二合一设备和其他支持实感技术的设备上实现 3D 摄影。这些功能基于从三个摄像头阵列捕获的图像中推断深度信息,生成可嵌入 JPEG 照片文件中的 3D 模型数据。
英特尔提供的软件开发套件和其他开发者工具将抽象化深度感知处理,从而简化应用程序的创建,无需具备深度处理的底层专业知识。支持此终端用户功能的设备现已上市。
本文向软件开发者介绍英特尔®实感™技术在增强型数码摄影中实现深度感知所使用的关键机制。
将数据编码为深度图
由英特尔实感技术实现的数码摄影的第三维度,是捕捉摄像头与场景中各种元素之间的相对距离。这些信息存储在深度图中,其概念类似于地形图,其中图像中的每个像素(x-y 坐标)都存储了一个深度值(z 维度)。如图 1 所示,使用三个摄像头传感器来实现支持深度映射的图像捕获。在此,8 兆像素 (MP) 的主图像通过捕获的两个 720p 红、绿、蓝 (RGB) 传感器信息进行增强。
实际的深度图是通过计算三个摄像头捕获的图像中各个点的位置之间的视差(基于摄像头在设备上物理分离产生的视差)来生成的。场景中每个点的视差被映射到一张灰度图像上。较小的视差用较暗的像素表示,表示离设备较远。较大的视差用较亮的像素表示,表示离设备较近。主图像分辨率较高,可独立使用,或者当应用程序需要时,可使用深度信息来模拟场景中的 3D 空间。
深度图的分辨率受限于最低分辨率传感器(720p)捕获的图像大小。它可以保存为 8 位或 16 位 PNG 文件。通常,深度图文件的大小会使最终 JPEG 文件的整体大小增加一倍。深度信息本身与主图像一起存储在单个 JPEG 文件中。JPEG 兼容标准图像查看器。但是,在支持英特尔实感 3D 摄像头的系统上查看时,还会检索深度信息供各种实感应用程序使用。
深度图的质量取决于多种因素,包括:
- 摄像头到主体的距离。 1 到 10 米的距离可提供最佳的深度体验,其中 1 到 5 米可提供最佳的测量体验。
- 光照。 光线昏暗的场景需要更高的 ISO 等效值,这可能会产生传感器噪点并干扰距离计算;眩光和反射表面也可能对深度图像产生不利影响。
- 纹理和对比度。 场景中元素之间清晰的视觉差异(而不是大片同色或复杂的几何图案)有助于提供可靠的深度算法结果。
硬件和用例
深度摄影目前可通过英特尔实感 R100 后置三摄像头阵列实现,该阵列配备在戴尔 Venue 8 7840 安卓平板电脑上。这款 Venue 平板电脑厚仅 6 毫米(不足 1/4 英寸),重约 300 克(0.7 磅),搭载 2.3 GHz 英特尔®凌动™ Z3580 处理器,并提供 8.4 英寸、2560 x 1600 分辨率的 OLED 显示屏。
在实际应用中,深度映射的一个常见用例是在拍摄图像 AFTER 后,对照片场景中的物体进行精确测量。这可以通过深度图中的 3D 数据来实现。为了以轻松有趣的方式说明这一点,英特尔创建了“鱼类演示”,如图 2 所示,其中两位朋友展示了他们捕获的鱼。
其中一人捕获的鱼较小(11 英寸,而他朋友的鱼长 3 英尺 1 英寸),但他将鱼凑近摄像头,使得他的渔获在传统照片中显得更大。在此演示中,“测量”应用程序允许通过轻点屏幕上每条鱼的头部和尾部来对每条鱼进行实际测量,并将实际测量值叠加在图像上。
可以实现广泛的类似用例。父母可以以数字相册的形式记录孩子的成长,而不是在门框上做标记。购物家具时,可以识别展厅里的家具如何摆放在家里的客厅中,从而简化购物过程。为了进一步说明,可以看看吉姆·帕森斯(Jim Parsons)出演的一系列电视广告,包括图 3 中的场景,他向一位特技自行车手解释,提前使用英特尔实感技术进行测量本来可以让自行车跳跃成功。
图 3. 吉姆·帕森斯建议使用英特尔®实感™技术为自行车特技做准备。
关于作者
凯尔·马宾 (Kyle Mabin) 在英特尔工作了 22 年,是 SSG 开发者关系部门的技术营销工程师。他常驻亚利桑那州钱德勒。