任职要求:
1.NLP方向相关技术研发,包括大模型技术、分类,序列标注、信息抽取等任务;
2.NLP大模型前沿技术探索,解决大模型输出内容不可控、推理效率低等问题;
3.负责技术产品化转化,参与关键技术系统集成;
4.负责创新成果的专利化、论文化工作。
1.计算机相关专业获得博士学位,发表过NLP相关研究顶会论文优先,如ACL、AAAI、EMNLP等;
2.对NLP主流大模型如ChatGPT/LLaMA/ChatGLM等的原理和差异有深入的理解;
3.熟悉预训练模型的认知和知识学习(包括认知架构、知识增强、知识支持、知识监督等)、预训练模型的推理加速技术、预训练模型的压缩技术、预训练模型赋能的知识获取、预训练模型的领域适应与任务适应技术;
4.熟练掌握主流深度学习框架pytorch/tensorflow,有百亿/千亿大模型训练调优经验优先;
5.熟悉常见的模型小型化技术,如量化/剪枝/蒸馏等,熟悉onnx/tensorRT。
研究方向:
1.NLP方向相关技术研发,包括大模型技术、分类,序列标注、信息抽取等任务;
2.NLP大模型前沿技术探索,解决大模型输出内容不可控、推理效率低等问题;
3.负责技术产品化转化,参与关键技术系统集成;
4.负责创新成果的专利化、论文化工作。