当前位置:首页 > 内容聚合

英伟达AI AgentEureka开源 可完成转笔等复杂动作 达A动作这一成就令人瞩目

站长之家()10月21日 消息:英伟达最新的英伟AI AgentEureka搭载了强大的GPT-4模型 ,通过生成奖励函数的达A动作方式,使机器人能够完成多项复杂任务,开源可完其中包括一些看似简单但难以实现的成转出国劳务签证需要多久能办理出来?动作 ,如转笔、复杂打开抽屉、英伟抛球等。达A动作这一成就令人瞩目,开源可完尤其是成转在转笔这项技能上 ,即便是复杂靠人类逐帧制作动画 ,也难以达到如此高水准。英伟澳大利亚出国劳务费用一览表奥洲有没有养鸡厂工签研究结果显示 ,达A动作Eureka在超过80%的开源可完任务中都超越了人类专家,使机器人的成转平均性能提升了50%以上 。

英伟达AI AgentEureka开源 可完成转笔等复杂动作 达A动作这一成就令人瞩目

论文链接:

https://arxiv.org/abs/2310.12931

GitHub链接:

https://github.com/eureka-research/Eureka

Eureka的复杂关键创新在于采用了一种混合梯度架构 ,结合了无梯度的出国劳务费用一览表 正规出国中介武汉情境学习和强化学习 。这个系统使用GPT-4的零样本生成、代码编写以及上下文改进功能  ,对奖励执行策略进行优化。在外循环中,GPT-4细化奖励函数,而内循环则使用强化学习来训练机器人控制器。这种方法让机器人能够通过强化学习来掌握复杂的技能,而不需要特定的提示工程和奖励模版 。

Eureka还支持一种新形式的上下文强化学习,日本租房它能够将人类操作员的反馈融入自然语言中  ,以引导和调整奖励功能 。在对29种不同的开源RL环境进行基准测试时 ,Eureka在83%的测试中超越了人类 ,并实现了52%的改进。这些测试环境包括10种不同的机器人形态,如四足机器人 、四旋翼机器人 、双足机器人和机械手等。

最令人惊讶的是 ,Eureka在处理复杂 、高维电机控制的任务上表现更佳,有时甚至与人类奖励的相关性负相关  。这表明它的策略在某些情况下比人类策略更为有效  ,类似于AlphaGo在下棋策略上的表现 。这项研究由英伟达、宾夕法尼亚大学 、加州理工学院和德州大学奥斯汀分校的研究人员合作完成 ,其中近半数研究人员都是华人。这一成就为机器人学习和强化学习领域带来了革命性的突破 ,也引发了广泛的关注和期待 。

分享到: