岗位职责:
1.主导国产大模型的调优工作,深入理解模型架构和算法原理,依据业务场景精准调整模型参数,提升模型性能和应用效果;
2.负责大模型在公司业务中的应用开发,结合业务需求,将大模型技术集成到各类产品和服务中,实现智能化升级;
3.与产品团队紧密合作,参与产品需求分析,从技术角度提供专业建议,确保产品功能的可行性和高效性;
4.持续关注行业最新大模型技术动态,对新技术进行评估和验证,探索其在公司业务中的应用可能性;
5.优化大模型的部署和推理流程,提高模型的运行效率和稳定性,降低资源消耗。
任职要求:
1.硕士及以上学历,计算机科学、数学、统计学等相关专业;
2.3 年以上相关工作经验,具备扎实的机器学习和深度学习理论基础;
3.拥有丰富的国产大模型调优经验,熟悉至少一种主流国产大模型,如DeepSeek、字节云雀模型、百度文心一言、阿里通义千问等;
4.熟练掌握 Python 编程语言,熟悉 TensorFlow、PyTorch 等深度学习框架;
5.具备良好的沟通能力和团队协作精神,能够在跨部门合作中有效推进项目进展。