热门

最新

红包

立Flag

投票

同城

我的

发布
m0_46163918
程序员的店小二
2 年前
truem0_46163918

苹果开发出能 "看 "懂屏幕上下文的人工智能

而且不需要依赖屏幕截图和图像数据输入

也就是它可以在与用户交流的过程中,实时理解和识别用户屏幕上显示的内容,这意味着,如果你在与一个使用ReALM技术的应用交谈时,它能看到你看到的一切内容。

它能理解你在干嘛,随时提供帮助。

它不需要屏幕截图或图像作为输入。通过将屏幕上的元素和布局转换为文本形式,然后利用这些文本信息来解析用户提出的与屏幕内容相关的查询或指令。

如“打开我屏幕上显示的第一个应用”或“读取屏幕中央的新闻标题”,即使它实际上没有“看到”你的屏幕。这种能力特别适用于需要对屏幕上信息进行快速反应和处理的应用场景,如虚拟助手和辅助技术等。

详细:
https://xiaohu.ai/p/5493

AI资讯
CSDN App 扫码分享
分享
评论
2
打赏
  • 复制链接
  • 举报
下一条:
今天又又又又吃多了,烦得呢,白走这么多步了
立即登录