首页
推荐
搜索
单位
简历
APP
双选会 网页头部-双选会热门图标
大模型推理软件研发工程师
17-30K/月
投简历
聊一聊
地点图标 杭州
工作经验图标 经验不限
教育经历图标 硕士
职位描述
Python
Transformer模型
KV Cache机制
显存优化
Linux内核开发工具链
eBPF
DAMON
vLLM
工作职责: 1. 针对大模型推理场景,设计高效、低延迟的分布式KV缓存管理机制,优化缓存命中率,减少显存/内存冗余占用。分析大模型推理的访存模式,识别热点数据并设计动态缓存替换策略,平衡计算与存储资源开销。结合CXL、持久内存(PMem)等新型硬件特性,构建跨节点的内存池化方案,优化跨NUMA/跨设备的数据访问效率; 2. 基于硬件性能采样工具(如PEBS、PMU)分析推理负载的访存特征,定位缓存瓶颈并提出优化方案。探索面向大模型推理的KV缓存分级存储架构,结合SSD/NVMe块设备特性优化缓存持久化与读写放大问题。设计自适应调度策略,优化KV缓存在多GPU/多节点间的数据分布与同步机制; 3. 研究大模型推理中的显存压缩、数据预取、零冗余参数管理等技术,提升集群资源利用率。推动硬件加速技术(如GPU-CPU协同计算、SPDK用户态驱动)在缓存管理中的实践应用。 任职要求: 1. 计算机科学、体系结构、存储系统相关方向硕士及以上学历; 2.了解Transformer模型的KV Cache机制及显存优化技术; 3. 熟悉分布式系统、内存管理、存储优化领域,精通C++/Python,熟悉Linux内核开发工具链(如eBPF、DAMON),熟悉大模型推理架构(如vLLM、DeepSpeed); 4. 在CCF A类会议/期刊(如MICRO、USENIX ATC、TOS)发表过存储/系统优化相关论文,或持有相关专利者优先; 5. 熟悉SPDK、CXL协议、持久内存编程模型(如PMDK)优先; 6.具备KV缓存/图存储/数据库内核开发经验者优先。
工作地点
之江实验室新园区
之江实验室
地点图标地点圆形图片
相似职位
安全提示图标 理聘安全提示
求职中如遇到招聘方扣押证件、要求提供担保或收取财务、强迫入股或集资、收取不正当利益或其他违法情形,提高警惕并立即举报
之江实验室
科研设计单位
热招 19 个职位
单位主页
猜你喜欢
更多
下载app提示-背景图下载app提示-文案图
下载app提示-二维码图