职位描述:
负责大语言模型的训练与评估数据集构建、模型的训练与微调技术体系的搭建,以及面向业务场景的落地
任职要求:
1.计算机相关专业本科以上学历,精通至少一门语言,Java/C++/Python等,具有扎实的代码功底
2.深入理解transformer架构体系,具有两年以上算法实践及优化经验
3.具有实际的LLM语料库构建或模型训练与调优经历,熟悉常见的文本分类/去重做法,了解long context、peft、moe等技术
4.理解和熟练使用pytorch、deepspeed、megatron等训练框架
加分项:满足一项即可,多项更佳
1.在国内外一线互联网公司有通过算法提升核心业务指标的经验
2.在国内外顶级 AI 会议上发表过论文
3.在一线公司担任团队或技术负责人