首页
推荐
搜索
单位
简历
APP
双选会

理聘网-职位详情页,大模型算法工程师

大模型算法工程师
20-60W/年
投简历
聊一聊
地点图标 深圳
工作经验图标 3-5年
教育经历图标 硕士
职位描述
大模型
算法
岗位职责: 1.大模型系统架构开发: (1)设计并实现高性能、可扩展的大模型训练与推理系统,优化分布式计算、显存管理、通信效率等关键模块。 (2)开发或改进大模型框架(如Verl、vLLM、Megatron等),支持十亿级/百亿级/千亿级参数的稳定训练与高效推理。 2.性能优化与调优: (1)解决大模型在训练/推理中的瓶颈问题(如计算、存储、通信),通过算子融合、流水线并行、量化压缩等技术提升效率。 (2)针对硬件(GPU/昇腾)特性进行底层优化,实现低延迟、高吞吐的推理服务。 3.基础设施构建: (1)搭建大模型开发与部署的全栈工具链,包括数据预处理、分布式训练集群管理、模型服务化(如vLLM、SGLang)等。 (2)设计容错、弹性伸缩的推理平台,支持多租户、高并发场景需求。 4.前沿技术探索: (1)跟踪LLM领域最新进展(如MoE、RLHF、多模态),将研究成果工程化落地。 (2)探索大模型与边缘计算、知识图谱、具身智能等技术的结合。 岗位要求: 1.计算机科学、人工智能或相关领域的硕士/博士学历,2年以上系统研发经验; 2.精通以下至少一个方向: (1)分布式系统:熟悉NCCL、RDMA、MPI等通信协议,有大规模分布式训练调优经验。 (2)GPU/NPU编程:精通CUDA、OpenAI Triton或Ascend C,能进行内核级性能优化。 (3)机器学习框架:深入理解Verl/vLLM/Megatron底层机制,参与过框架开发或贡献者优先。 3.扎实的算法基础,熟悉Transformer架构及大模型关键技术(如KV Cache、Flash Attention)。 4.优秀的编程能力(Python/C++),熟悉Linux开发环境与容器化技术(Docker/K8s)。 5.熟悉LLM生态工具链(如Hugging Face、LangChain、LoRA)。 加分项 1.发表过MLSys、NeurIPS、OSDI等顶会论文,或开源项目核心贡献者。 2.有百亿以上参数的大模型训练/推理落地经验。 3.熟悉LLM生态工具链(如Hugging Face、LangChain、LoRA)。
工作地点
深圳市大数据研究院
深圳市大数据研究院
地点图标地点圆形图片
相似职位
安全提示图标 理聘安全提示
求职中如遇到招聘方扣押证件、要求提供担保或收取财务、强迫入股或集资、收取不正当利益或其他违法情形,提高警惕并立即举报
下载app提示-背景图
理聘小程序
随时随地看职位
投递反馈秒知道
微信小程序-二维码图
深圳市大数据研究院
其他事业单位
热招 14 个职位
单位主页
上传简历提示图
极速找工作!
AI智能解析简历, 精准推荐职位
立即上传
猜你喜欢
更多