IT之家 2024年08月18日
Meta Quest 3 头显透视摄像头被“破解”,开发者成功运行计算机视觉模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

一位开发者成功利用 Quest 3 的透视摄像头运行自定义计算机视觉模型,绕过了 Meta 对第三方开发者访问摄像头权限的限制。开发者通过嵌入应用内的网页视图,利用 Meta 的投屏功能将头显画面投向同一个应用,并对接收的画面进行像素内容采样,从而实现对摄像头数据的访问。该方法虽然存在一些限制,但展现了开发者在 VR 设备上的创新能力,也引发了关于 Meta 对开发者权限控制的讨论。

🤔 开发者利用 Quest 3 的透视摄像头运行自定义计算机视觉模型,绕过了 Meta 对第三方开发者访问摄像头权限的限制。开发者通过嵌入应用内的网页视图,利用 Meta 的投屏功能将头显画面投向同一个应用,并对接收的画面进行像素内容采样,从而实现对摄像头数据的访问。

🧐 该方法虽然存在一些限制,例如投屏画面包含虚拟物体和界面元素,但开发者表示已经设计了变通方案。

🤯 这一发现引发了关于 Meta 对开发者权限控制的讨论,Meta 可能会在未来版本的 Quest 操作系统 Horizon OS 中使该方法失效。

🤔 开发者希望与 Meta CEO Mark Zuckerberg 或 CTO Andrew Bosworth 通话,向他们展示该技术,并希望 Meta 能够开放更多开发者权限。

🧐 相比之下,苹果仅向企业用户提供其 Vision Pro 头显的原始摄像头数据访问权限,并且仅限于非公开的内部应用。

IT之家 8 月 18 日消息,一位开发者巧妙地绕过了限制,成功利用 Quest 3 的透视摄像头运行自定义计算机视觉模型,可以识别摄像头看到的物体。

Meta 目前并不允许第三方开发者直接访问 Quest 系列头显的摄像头,然而 XRWorkout 健身应用的联合创始人兼首席开发者 Michael Gschwandtner 在社交媒体上发布了一段视频,展示了他成功绕过了这一限制。

演示视频中,开源的 MobileNet V2 目标检测模型以 0.75Hz 的帧率原生运行于 Quest 3 上。Gschwandtner 的应用构建了一个网页视图 (webview),即嵌入在应用内部的 Chromium 浏览器实例。该网页视图会自动加载支持 Quest 头显投屏的网址(oculus.com/casting),该网址可以让 Quest 头显将自身画面投送至其他设备。接下来,用户需要在该窗口内使用 Meta 账号进行完整登录。完成后,通过 Quest 系统菜单启动投屏功能。需要注意的是,这次的投屏并非投向另一台设备,而是从头显投向头显内部的同一个应用。

Gschwandtner 的应用随后会对接收投屏画面 (RenderTexture) 的 webview 进行像素内容采样,并可以根据需要进行进一步处理。在演示示例中,他将采样数据送入谷歌的 MediaPipe 设备端 SDK 进行处理。

IT之家注意到,该方法存在一个关键限制:投屏画面中除了透视摄像头画面之外,还包含虚拟物体和界面元素。这意味着该方法仅适用于透视画面占据大部分图像的情况。不过,Gschwandtner 表示他已为该限制设计了另一个变通方案。

目前尚不清楚 Meta 将如何应对 Gschwandtner 的发现。该公司可能会在未来版本的 Quest 操作系统 Horizon OS 中使该方法失效。Gschwandtner 在社交媒体上公开喊话,希望与 Meta CEO Mark Zuckerberg 或 CTO Andrew Bosworth 通话,向他们展示该技术。

上个月,Bosworth 在接受采访时谈到了有意向让 Quest 开发者访问透视摄像头的想法,并表示 Meta 将“继续关注”该问题。相比之下,苹果仅向企业用户提供其 Vision Pro 头显的原始摄像头数据访问权限,并且仅限于非公开的内部应用。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Quest 3 计算机视觉 开发者 Meta VR
相关文章