任职要求:
岗位职责:1、设计并实现面向视觉-语言-动作(VLA)模型的强化学习算法。2、开发高效的机器人强化学习训练与推理框架,包含多环境并行渲染、分布式采样,人机交互接管等关键组件。3、优化从仿真到真实世界的迁移性能,提升策略在物理机器人上的可靠性和鲁棒性。任职要求:学历背景:计算机/自动化/机器人学/机器学习等相关专业硕士及以上学历。专业技能:1、深入理解强化学习基础理论(PPO,GRPO等)及实践经验。2、熟悉VLA/LLM等多模态模型的训练与推理。3、熟练掌握PyTorch/TensorFlow等深度学习框架。4、具备Linux环境下的C++/Python高性能编程能力。5、仿真环境:熟悉主流机器人仿真环境,包括但不限于IsaacSim、MuJoCo等,能进行环境构建、资产导入和大规模并行训练。6、项目经验:有机器人强化学习或仿真到现实迁移项目经验者优先。7、综合素质:良好的问题分析能力、工程落地能力和团队协作精神。
研究方向:
计算机自动化机器人学机器学习