工作年限要求:0
是否能接受应届生:是
岗位职责:
1.调研与方案设计:参与大模型相关系统项目的调研与设计,包括但不限于:
a.高性能推理引擎:研究KV-Cache优化、动态批处理、连续推理等技术,降低延迟,提升吞吐。
b.高效训练系统:探索分布式训练框架(如DeepSpeed,Verl)、混合并行策略、显存优化等。
c.硬件协同设计:针对GPU/国产AI芯片进行内核优化、算子融合与性能调优。
2.系统实现与评测:将算法与思想转化为高性能、可复现的代码(C++/CUDA/Python),并设计严谨的实验进行系统性的性能评估与分析,完成实验操作与维护、数据收集与分析、实验报告撰写。
3.学术贡献:完成文献的检索和管理,协助撰写高水平学术论文和专利申请材料,参与国际顶会(如OSDI,EuroSys,MLSys,PPoPP等)的投稿工作,参与国际顶尖竞赛打榜。
4.其他:参与维护实验室的开源项目,与社区互动,解决Issue,贡献代码;纵向、横向等项目的申请材料撰写;实验室日常管理,比如知识库维护、会议纪要、公众号宣传稿等。
任职要求:
1.熟悉AIInfra技术栈和主要优化技术的原理,能够自主设计相关技术方案和实验
2.扎实的文献调研、文档和PPT撰写能力
3.申请过专利或软著,发表过CCFB类同等水平及以上论文
4.熟练的编程和调试能力,能够自主构建和测试原型
5.有知名开源项目/技术博客/A类论文发表经验者优先