工作内容
1.负责 VLA/VLM 大模型的研究和开发工作,探索基于 VLA/VLM 的端到端大模型技术方案,推动其在机器人、自动驾驶等领域的应用。
2.跟踪和研究 VLA/VLM 领域的前沿技术,设计和优化模型架构,包括对模型的数据处理、训练以及部署等工作,确保模型的高效性和准确性。
3.负责对LLM进行训练以及微调,包括数据预处理、模型训练参数调整、训练过程监控与优化等,确保训练出高质量的模型。
4.基于LLM,针对具体的应用创建智能体。
5.与团队成员紧密合作,共同解决项目中遇到的技术难题,推动项目的顺利进行。
任职要求:
1.硕士及以上学历,计算机科学、机器学习、人工智能、自动化等相关专业;
2.熟悉机器人模仿学习、强化学习理论,有相关领域paper或实际落地经验;
3.深度理解LLM原理,熟悉深度学习框架,如TensorFlow、PyTorch 等,能够基于框架进行模型开发、训练和优化。
4.有VLA(Vision Language Action Model)、VLM、LLM模型训练的实际经验,熟悉DeepSpeed、FSDP、PyTorch等深度学习框架;
5.具有大语言模型、多模态大模型、生成式模型(diffusion policy)、世界模型等算法背景;
6.有机器人领域、自动动驾驶领域AI算法经验优先。