热门
最新
红包
立Flag
投票
同城
我的
发布
CSDN App 扫码分享
评论
点赞
打赏
- 复制链接
- 举报
下一条:
Genie:从单一图像提示生成无限种可玩(即可通过行动控制的)游戏场景。这些图像可以是合成图像、真实照片,甚至是手绘草图。生成的这些场景是可玩的,允许用户控制并与环境中的元素互动,从而提供了一个全新维度的游戏和探索体验。而且它还能够从数据中学习并再现这些复杂的物理行为。Genie主要功能:1、生成交互式环境:Genie能够从单一图像提示生成无限种可玩(即可通过行动控制的)世界。这些图像可以是合成图像、真实照片,甚至是手绘草图,为用户提供与想象中的虚拟世界互动的能力。2、无需行动标签的学习控制:通过分析大量的公开互联网视频(尤其是2D平台游戏和机器人视频),Genie学会了精细的控制技巧,而这些视频通常不含任何动作标签。3、激发新一代内容创作者:Genie的技术使得仅需一张图像即可创造出全新的交互环境,为内容创作者提供了新的工具和方法,用以生成和探索虚拟世界。4、训练通用型AI代理:Genie不仅为用户提供了创造交互式环境的能力,还为AI研究提供了一个有价值的资源。通过在不断生成的新世界中训练,未来的AI代理可以在多样化的环境下学习和适应,促进了通用型AI代理的发展。5、跨领域应用:尽管在该网站上主要展示了平台游戏的结果,Genie实际上是一个通用方法,可应用于多个领域,不需要任何额外的领域知识。这意味着其潜在应用范围非常广泛。通往通用型代理的基石1、模型训练:通过在没有动作标签的视频上训练一个较小的2.5B模型,Genie展示了它能够学习一致的动作空间。这种能力说明Genie可以识别和复制具有相同潜在动作序列的轨迹之间的相似行为,这对于训练具有身体实体的通用AI代理尤其重要。2、模拟可变形物体:Genie还能够模拟可变形物体,这是一个对于人类设计的模拟器来说极具挑战性的任务。模拟可变形物体的能力表明该系统能够从数据中学习并再现这些复杂的物理行为。3、推动AI发展:Genie不仅引入了从图像或文本生成完整交互式世界的新时代,而且被视为未来训练通用AI代理的催化剂。它的出现可能会极大地推动AI技术的发展,特别是在创建自适应、多功能的AI方面。项目地址:https://sites.google.com/view/genie-2024/