岗位职责:
1.跟踪前沿实时技术,洞察模型、算法、软件、硬件演进方向,在相关方向持续提供前沿学术贡献,保持技术领先并为软硬件设计提供科学指导。
任职要求:
1.熟悉主流模型架构(如transformer, DiT, ViT, Diffusion等);
2.熟悉深度学习前沿技术(如微调、long context、MoE、RAG、Agent、多模态、MCST等);
3. 熟悉深度学习软件栈(LLM框架、DNN框架、分布式框架、编译器、算子开发等);
4. 熟悉各种新型AI加速芯片架构;
5.熟悉分布式通信库(NCCL)、网络拓扑(片上和片间);
6. 有过2年以上系统或体系结构方向科研经历和顶会文章;
7.学历:硕士及以上或有过2+年经验的本科。