岗位职责:
1.负责实现GPU、NPU架构下的算子定制开发工作。
2.负责昇腾算力平台算子库迁移、部署、更新维护,最大限度发挥芯片硬件性能。
3.能够使用分析工具分析算子性能,制定优化方案并高效实现;
4.负责应用加速库版权开发与维护,对接上层大模型,AI,CV,HPC等应用框架,支持训推一体关键业务应用。
5.实现模型在下游任务上的适配和泛化,包括但不限于下游任务模型开发/训练/优化/推理/部署等。
任职要求:
1.计算机、通信、数学及相关理工科专业(硕士)毕业,有华为、互联网企业工作经验优先。
2.熟悉CV、NLP、Audio、多模态、AIGC等至少一个领域的算法原理和工程经验。
3.熟悉Python,AscendC,C++开发语言,对计算机体系结构与组成原理有一定了解。
4.对CUDA, 华为CANN开发平台及环境熟悉者优先录用。
5.熟悉Pytorch/Tensorflow/Mindspore框架和自定义算子开发,熟悉LLM、AIGC等常见模型结构。