工作内容:
1. 负责大规模预训练模型(LLM)的研究、训练及应用,包括但不限于多语言、多模态、模型调优、部署优化等工作。
2. 负责数据预处理、特征工程、模型训练、模型评估,确保模型的高效性、准确性和稳定性。
3. 利用深度学习等前沿技术,开展对话/文本/图像等内容理解工作,探索大模型在客服场景的大规模应用。
4. 跟踪和研究最新的大模型业界进展,时刻保持技术先进性。
岗位要求:
1. 计算机、数学或统计学相关专业;
2. 对LLM、多模态、多语言有深入理解和实践,在模型预训练、性能调优、内容生成方向有实际应用或项目经验;
3. 熟悉常见的深度学习算法,如LSTM、Bert等,熟悉TenserFlow、PyTorch、Keras、MxNet等其中一种或多种主流深度学习框架。
4. 具备良好的问题解决能力和团队合作能力,擅长通过技术手段解决复杂业务问题。