深圳

点击搜索

发布

深圳工匠精神技术无模型的增强学习

区域:
深圳 > 宝安 > 龙华


据深圳工匠精神技术了解,也许,让机器人彼此学习的一个简单的方法就是把所有关于成功和失败的经验信息都汇总到一起。人类和动物通过直接试错进行学习,积累技巧。之所以称之为“无模型”,是因为并没有形成关于环境的明确模型,在这种“无模型”的学习中,它们通过即刻展示的行为发现变化,进而增强和探索可以得到更大回馈的变化。

通过与深度神经网络的结合,“无模型”的算法近已经被证明可以取得惊人的效果,在Atari 游戏系统和围棋对弈中,也取得了关键性的成功。拥有多个机器人让我们可以使用分享的经验来进行实验,以加速现实世界中这一类型的直接学习。

在实验中,我们给机器人的任务是移动手臂,触碰目标位置,或者接触并开门。每一个机器人都拥有一个复制版的神经网络,让它可以对特定情况下特定的任务的价值进行评估。通过在这一网络中进行搜索,机器人能快速地决定哪一种行动才是值得去做的。

当一个机器人开始行动时,我们会在它所选择的行动上增加噪音,这样,行为的结果有时候会比此前的观察更好一些, 有时候又会更差一些。这能让每一个机器人都可以探索处理某一任务的不同方法。关于机器人所采取的行动、它们的行为以及终结果的记录,终都会被发送到一个中央处理器中。

据深圳工匠精神技术了解,服务器会搜集所有机器人的信息,并循环使用,改进用于评估不同状态和行动的神经网络。我们采用的这种“无模型”的算法会对好的和坏的经验都进行评估,并把结果运用到新的网络中,新的网络将能更好地理解行动和成功之间的关系。这样,在每一个常规的间隔中,每一个机器人都会从服务器上获得升级后的神经网络的复制版本,然后开始使用这些新的神经网络中的信息指导行动。考虑到这些设计版的神经网络在评估现实世界中的真实行动会做得更好,机器人自身也会获得更好的结果。这种良性循环在任务的不断改进中得到重复。

随着我国工业机器人广泛普及,需求迅速增加,专业的机器人技术服务成为行业需求热点。工匠精神技术(深圳)十年来致力于提高国内自动化技术发展水平,为客户提供机器人自动化系统开发、工程仿真、安装调试、培训服务,同时为解决国内工厂劳动力短缺问题,工匠精神技术(深圳)将工厂工人从复杂的劳动强度及恶劣的工作环境中解脱出来,为企业提供自动化生产佳方案。
查看更多深圳其他生活服务信息

免责声明:此信息系发布者(UID:433811)自行发布,本站是服务平台,仅提供信息存储空间服务,该信息内容的真实性及合法性由该发布者完全负责。

© lieju.com 联系我们