岗位职责:
1. 参与大模型训练环境子任务。
2. 面向大模型训练和推理应用,设计和优化高效的大模型存储架构,提升数据访问和传输性能,解决大模型应用中的存储瓶颈问题。
岗位要求:
1. 计算机科学、人工智能相关领域的博士学位,有大模型训练、深度学习框架或者高性能计算的经验优先。
2. 深刻理解存储系统原理、分布式系统概念以及机器学习算法;熟悉并行分布式文件系统Lustre, GPFS等;熟练使用C/C++, Python或其他适合系统编程的语言;具有实际的大语言模型训练和推理部署经验,尤其是面向深度学习算法的软硬件协同优化的经验优先。