岗位职责:
1.负责各类视频流(RTSP、RTMP、HTTP-FLV 等)数据的接入、处理与优化;
2.设计和开发视频图像处理算法,涵盖目标检测、目标跟踪、行为识别、场景理解等方向;
3.参与算法的模型训练、优化、部署工作,推动算法在实际业务场景中落地;
4.负责视觉算法服务端部署,包括推理框架(如 TensorRT、ONNX Runtime)优化、容器化部署(Docker );
5.关注行业前沿,调研并引入先进的视觉算法与多模态大模型技术,推动团队技术升级;
6.跨团队协作,支持产品需求,提供算法设计方案与技术支持。
任职要求:
1.计算机视觉、人工智能、机器学习、电子工程、自动化等相关专业,硕士及以上学历优先;
2.熟练掌握视频流接入与处理相关技术,具备实际开发经验;
3.扎实的图像处理、深度学习算法基础,熟悉主流视觉算法(YOLO, Faster R-CNN, DeepSORT, SAM, Segment Anything 等);
4.熟悉深度学习框架(PyTorch、TensorFlow 等)以及相关工具链;
5.熟悉模型训练流程,具备算法优化(剪枝、量化)、加速部署经验;
6.有良好的编码能力,熟悉 Python / C++,具备良好的工程实现能力和代码规范意识;
7.了解或具备跨模态、多模态大模型相关项目经验者优先;
8.良好的沟通协作能力和学习能力,具备解决复杂问题的能力。
9.视频流、视频图像处理算法 是主要的,多模态大模型技术作为加分项
加分项:
1.有智能安防、智慧城市、智能交通、工业质检等行业项目经验;
2.有大规模视频数据处理、分布式训练或实时推理部署经验;
3.熟悉多模态大模型(如 Qwen-VL、InternVL、BLIP 等)或视频理解相关算法。