任职要求:
1)获得博士学位,年龄一般不超过35周岁,特别优秀者可适当放宽。
2)具备极佳的工程实现能力,熟悉C/C++、Python等常用开发语言。熟悉主流的深度学习平台,如tensorflow、pytorch、mxnet等,具备实际项目开发经验。
3)深入了解常见的大模型算法与模型,如GPT、BERT等,能够理解其原理和优化方法,并具备相应的实践经验。
4)具备在CPU或GPU上实现和优化高性能算子库的开发经验。
5)具备良好的团队合作精神,能够有效地与团队成员合作,共同完成项目任务。同时,具备较强的沟通能力,能够清晰地表达自己的想法和观点。
6)优先考虑有在AI及算法行业论坛发表过论文、在顶会上有论文发表或在行业中有一定影响力的候选人。
7)熟悉Tranformer、Diffusion等流行深度学习算法在新一代计算架构芯片(GPU、TPU、NPU等)上的优化算法;熟悉高性能计算领域的硬件特性(如带宽瓶颈、缓存优化),能够针对具体硬件进行性能分析并设计优化方案。
研究方向:
CPU或GPU上实现和优化高性能算子库的开发