杭州大模型推理软件研发工程师招聘_之江实验室招聘-硕士博士找工作用理聘

工作职责： 1. 针对大模型推理场景，设计高效、低延迟的分布式KV缓存管理机制，优化缓存命中率，减少显存/内存冗余占用。分析大模型推理的访存模式，识别热点数据并设计动态缓存替换策略，平衡计算与存储资源开销。结合CXL、持久内存（PMem）等新型硬件特性，构建跨节点的内存池化方案，优化跨NUMA/跨设备的数据访问效率； 2. 基于硬件性能采样工具（如PEBS、PMU）分析推理负载的访存特征，定位缓存瓶颈并提出优化方案。探索面向大模型推理的KV缓存分级存储架构，结合SSD/NVMe块设备特性优化缓存持久化与读写放大问题。设计自适应调度策略，优化KV缓存在多GPU/多节点间的数据分布与同步机制； 3. 研究大模型推理中的显存压缩、数据预取、零冗余参数管理等技术，提升集群资源利用率。推动硬件加速技术（如GPU-CPU协同计算、SPDK用户态驱动）在缓存管理中的实践应用。任职要求： 1. 计算机科学、体系结构、存储系统相关方向硕士及以上学历； 2.了解Transformer模型的KV Cache机制及显存优化技术; 3. 熟悉分布式系统、内存管理、存储优化领域，精通C++/Python，熟悉Linux内核开发工具链（如eBPF、DAMON）,熟悉大模型推理架构（如vLLM、DeepSpeed); 4. 在CCF A类会议/期刊（如MICRO、USENIX ATC、TOS）发表过存储/系统优化相关论文，或持有相关专利者优先； 5. 熟悉SPDK、CXL协议、持久内存编程模型（如PMDK）优先； 6.具备KV缓存/图存储/数据库内核开发经验者优先。

理聘网-职位详情页，大模型推理软件研发工程师