上海自动驾驶VLM多模态大模型算法工程师招聘 (重庆千里智驾科技有限公司)

理聘网-职位详情页，自动驾驶VLM多模态大模型算法工程师

自动驾驶VLM多模态大模型算法工程师

面议

投简历

上海

经验不限

硕士

职位描述

计算机科学与技术

软件工程

控制科学与工程

信息与通信工程

数学

统计学

电子科学与技术

光学工程

物理学

人工智能

模式识别与智能系统

计算机应用技术

计算机软件与理论

信号与信息处理

通信与信息系统

自动化

系统科学

生物医学工程

大数据科学与工程

数据科学与大数据技术

任职要求：职位描述：1.研发并训练适用于视觉生成任务的文生图基座大模型，显著超越StableDiffusion、StableVideoDiffusion等开源基座模型；2.借助自然语言多模态大模型等基座模型，研发下一代高可控性、强交互性、高美学质量的视觉生成算法，包括3D生成、多场景长视频生成与编辑、多轮交互式图像生成、编辑与润色等。职位要求：1.2026届毕业生，有视觉生成领域工作经验优先。了解自然语言/多模态大模型的基本原理，对于视觉生成领域的流行算法（包括但不限于GAN系列，VQ-VAE/AutoRegressive系列，DiffusionModels和NeRF系列等）有一手的实践经验。有相关方向的顶会论文、知名开源项目或重要产品落地者优先；2.优秀的编程能力，熟练使用pytorch，熟悉megatron分布式训练框架；3.熟悉AIGC应用数据准备的全流程，包括数据采集、清洗、标注等，对于如何人工合成高质量训练数据有深入的理解；4.有强烈的责任心，良好的团队合作能力和跨团队沟通能力。研究方向：有视觉生成领域工作经验优先。了解自然语言/多模态大模型的基本原理，对于视觉生成领域的流行算法（包括但不限于GAN系列，VQ-VAE/AutoRegressive系列，DiffusionModels和NeRF系列等）有一手的实践经验。