中科院沈阳自动化所的Wang利用深度强化学习算法和视觉感知相结合的方法来完成移动机器人(如图3(a))在非结构环境下的移动操作[7]。作者将移动操作过程看做一个标准的强化学习问题,先通过双目相机通过DOPE获取目标物体的6D姿态p以及机器人本体的当前状态st,接着通过基于PPO的强化学习算法预测机器人的本体,机械臂以及机械手的运动并控制机器人本体运动,后机器人的运动状态st+1和响应rt,其中响应主要包含了整个系统的控制响应rctrl、机械手末端的位置响应rdist以及抓取状态rgrasp(如图3(b))。后作者在仿真环境和真实环境下测试了不同G度下的抓取成功率,在仿真中,立方体的抓取效果好达到了90%的成功率,而球类物体较差仅有60%左右,而在实际测试过程中,在姿态估计正确的前提下可实现目标物体的成功抓取(如图3(c)(d))。
在底层通过使用基于模型的操作单元,保证了手指与物体之间持续稳定的抓取;在中层使用强化学习进行规划,从而实现较长和复杂的手内操作流程
人类可以通过视觉和触觉融合感知快速确定抓取可变形物体所需力的大小,以防止其发生滑动或过度形变,但这对于机器人来说仍然是一个具有挑战性的问题
能快速将现有算法在实际生产环境落地,并能利用GPU加速实现大规模计算,摩登7自己搭建了一个GPU加速的大规模分布式机器学习系统,取名小诸葛
杜克大学的一种 AI 算法PULSE可以将模糊、无法识别的人脸图像转换成计算机生成的图像,其细节比之前任何时候都更加精细、逼真
饿了么算法专家刘金介绍推荐业务背景,包括推荐产品形态及算法优化目标;然后是算法的演进路线;最后重点介绍在线学习是如何在饿了么推荐领域实践的
优酷推荐业务,算法应用场景众多,需求灵活多变,需要一套通用业务框架,支持运行时的算法流程的装配,提升算法服务场景搭建的效率
通过分析其中的关键问题,建立了新热内容曝光敏感模型,并最终给出一种曝光资源约束下的多目标优化保量框架与算法
针对结算收银场景中商品识别的难点,从商品识别落地中的模型选择、数据挑选与标注、前端和云端部署、模型改进等方面,进行了深入讲解
神经形态结构融合学习和记忆功能领域的研究主要集中在人工突触的可塑性方面,同时神经元膜的固有可塑性在神经形态信息处理的实现中也很重要
机器学习就是通过经验来寻找它学习的模式,而人工智能是利用经验来获取知识和技能,并将这些知识应用于新的环境
滴滴机器学习场景下的 k8s 落地实践与二次开发的技术实践与经验,包括平台稳定性、易用性、利用率、平台 k8s 版本升级与二次开发等内容
大型商用时序数据压缩的特性,提出了一种新的算法,分享用深度强化学习进行数据压缩的研究探索