任职要求:
1.熟悉C++编程(11标准及以上),了解常用数据结构及算法;2.熟悉Python编程,了解Python常见的高级特性;3.熟悉AI领域的模型和算法实现;加分项:1.熟悉CUDA编程;2.熟悉AI模型常见的推理加速手段;3.熟悉常见的推理引擎/框架,如TensorRT、vllm、sglang等;4.熟悉大模型的实现及优化手段,如FlashAttention,PagedAttention等.
研究方向:
针对视觉/语音/问答等大模型典型应用场景,开发清微自研推理引擎;1.负责推理引擎各个模块的实现;2.负责推理引擎Python/C++接口的实现;3.负责AI模型的精度调测、转换、部署及相关工具的开发;4.负责AI模型的推理性能优化;5.负责推理引擎前沿理论和实现的调研;