首页
推荐
搜索
单位
简历
APP
双选会
海优 网页头部-理聘AI图标
理聘AI

理聘网-职位详情页,强化学习工程师

强化学习工程师
5K以上/月
投简历
地点图标 上海
工作经验图标 经验不限
教育经历图标 本科
职位描述
模仿学习或强化学习
Python
强化学习算法
岗位职责: 1.通过强化学习或模仿学习开发端到端机器人学习 2.强化正确的动作,奖励正确的行为并否定不正确的行为(通过实时动作/奖励反馈循环) 3.执行大量指令,并利用不同的对象和环境概括新任务 4.学习使用高度自由的手执行灵巧的任务 5.从视觉上学习不同的机器人策略来解决语言条件任务 6.批量生产高质量、安全和关键的软件 7.设计并实现用于机器人步态控制的强化学习算法 8.搭建和管理模拟环境以训练 RL 模型 9.训练并评估 RL 模型,以实现稳定且自然的步态行为 10.与机器人工程团队合作,确保 RL 控制能与机器人硬件集成 11.跟踪 RL 和机器人领域的最新发展以改进系统 任职要求: 1.具有端到端机器人学习经验,包括模仿学习或强化学习 2.具有编写生产级深度学习框架 Python(包括 TensorFlow, Numpy 和 Pytorch)的经验 3.具有分布式深度学习系统经验 4.通过触觉和/或视觉传感器接触机器人学习者优先 5.拥有训练和部署真实世界神经网络的良好记录 6.拥有计算机科学、电气工程或相关领域的硕士学位,专注于机器学习或 AI。 7.精通强化学习算法,如 Q 学习、策略梯度方法或深度 RL 技术(如 DQN、 PPO 等)。 8.熟悉模拟工具,如 Gazebo、 MuJoCo 或 Issac Sim/Gym/Omniverse/Cosmos。 9.优秀的沟通和团队合作技能。 薪酬福利: 1.具有竞争力的薪酬和五险一金 2.员工股票购买计划和其他财务福利 3.病假和休假时间(薪资职位的弹性工作时间)以及带薪假期 4.轻松开放的团队氛围,丰富的团队活动; 5.资深伙伴一对一指导,快速上手融入团队;
工作地点
普陀区
上海矩阵超智系统集成有限公司
地点图标地点圆形图片
工商信息
工商信息图标 企业名称
上海矩阵超智系统集成有限公司
工商信息图标 法定代表人
--
工商信息图标 成立日期
--
工商信息图标 企业类型
--
工商信息图标 经营状态
--
工商信息图标 注册资本
--
相似职位
安全提示图标 理聘安全提示
求职中如遇到招聘方扣押证件、要求提供担保或收取财务、强迫入股或集资、收取不正当利益或其他违法情形,提高警惕并立即举报
下载app提示-背景图
理聘小程序
随时随地看职位
投递反馈秒知道
微信小程序-二维码图
上海矩阵超智系统集成有限公司
企业
热招 1 个职位
单位主页
Ai入口图
猜你喜欢
更多