如何教会一只机器狗在瑜伽球上保持平衡并行走？DrEureka-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

程序员的店小二

2 年前

truem0_46163918

如何教会一只机器狗在瑜伽球上保持平衡并行走？

DrEureka：利用大语言模型自动化将机器人仿真环境训练结果转移到真实世界

首先在虚拟仿真环境中进行模拟训练，然后利用DrEureka将模拟环境训练结果直接转移到在现实世界中。

中间没有经过任何的其他操作和调整，直接转移！

DrEureka 能够在没有人为干预的情况下，完成机器人训练从仿真到现实的转换。

它主要通过两种方式工作:

1.自动生成奖励函数：DrEureka利用大语言模型(LLMs)自动化生成奖励函数，这是控制和指导机器人学习特定任务的关键。自动生成的奖励函数能够根据任务的需求调整，使机器人能更有效地学习所需的技能。

就像电子游戏中的得分系统，DrEureka可以自动生成奖励规则，这些规则告诉机器人在模拟训练中哪些行为是好的，应该学习。

⒉自动调整模拟环境：DrEureka能自动配置仿真环境中的域随机化参数。域随机化是一种技术，通过在仿真训练中引入物理参数的变化(如摩擦力和重力的随机调整)，增强机器人在现实世界中的适应性和鲁棒性。

也就是DrEureka能自动调整模拟环境的设置，比如地面的滑动程度或重力大小，这样机器人学到的技能就能更好地适应现实世界的各种情况。

实际应用中，DrEureka在处理复杂任务〈(如四足动物的行走和灵巧操作)时表现出色，还能解决新的挑战性任务，例如让机器人在瑜伽球上行走和保持平衡。

项目地址：http://eureka-research.github.io/dr-eureka/

AI资讯

CSDN App 扫码分享

分享

评论

1

打赏

复制链接
举报

下一条：

Times of India @桃花欲语春不归：数据注解：印度零工在人工智能革命前线辛勤工作 - The Economic Times. https://m.economictimes.com/tech/technology/indian-gig-workers-toil-at-frontlines-of-ai-revolution/articleshow/109864213.cms