首页
推荐
搜索
单位
简历
APP
双选会
软件架构师
40-70K/月
投简历
聊一聊
深圳
3-5年
本科
职位描述
AI模型工程化
模型优化
框架设计
推理加速
模型部署
模型轻量化
算子优化
异步并发
工作职责: 负责AI模型工程化相关工作,如框架设计、模型优化、推理加速等。 任职资格: 1.计算机、人工智能等相关专业本科以上学历,3年以上工作经验,具备扎实的C/C++/Python/CUDA等编程经验及工程化经验 2.2年及以上大模型分布式推理引擎开发经验;国际竞赛和核心会议发文 3.有AI Infra公司和AI芯片公司、大语言模型推理框架研发经验优先 4.有内存管理、算子优化、机器学习编译、异步并发、IO优化相关研发经验优先 5.熟悉深度学习算法(transformer、LLM、VLM、DM等)及及常用开源大模型 6.熟悉AI常用训练和部署(如PyTorch/DeepSpeed/QNN/vllm/TensorRT/sglang/ktransformer/openvino/ncnn/onnx等)应用与原理 7.熟悉常见模型轻量化方法(量化AWQ/GPTQ、剪枝、蒸馏等)和大模型推理加速(off-loading、投机采样等)及相关工具链 8.有CUDA性能优化及其他硬件(如 CPU、NPU 等)的使用、相关的性能调优经验,如FastTransformer、TensorRT、triton等经验优先
工作地点
庭威产业园
深圳市亿道信息股份有限公司
相似职位
理聘安全提示
求职中如遇到招聘方扣押证件、要求提供担保或收取财务、强迫入股或集资、收取不正当利益或其他违法情形,提高警惕并立即举报
深圳市亿道信息股份有限公司
企业
1000-9999人
热招 3 个职位
单位主页
猜你喜欢
更多