职位描述:
实现DeepSeek等开源大模型在华为昇腾(Ascend 910B等)上的迁移、优化及服务化封装,支持智能体对底层基座大模型的调用。
工作职责:
1.模型迁移与适配:负责 DeepSeek 等开源大模型在华为昇腾(Ascend 910B等)硬件环境下的环境搭建、权重转换及模型跑通,完成大模型接口与现有系统的对接及流式输出优化。
2.RAG 系统开发优化:负责检索增强生成全链路开发,包括文档多格式解析、向量化嵌入、向量数据库维护及召回重排序策略的调优。
3.提示词工程与调优:针对复杂业务逻辑进行 Prompt 设计、测试与迭代,通过结构化提示词与思维链设计,提升模型输出的准确性、稳定性并有效遏制幻觉。
4.Agent智能体实现:设计并实现基于Function Calling或ReAct框架的智能代理系统,完成工具调用、任务分解及多Agent协同工作流的开发。
5.系统性能与成本管控:监控并优化大模型应用的响应延迟,通过缓存机制、Token 消耗管控及模型并发处理,提升用户体验并降低运行成本。
6.稳定性保障:解决国产硬件环境下的算子兼容性报错、显存溢出(OOM)等技术难题。
任职要求:
1. 计算机、软件工程、人工智能、数学等相关专业在校学生(本科高年级、硕士或博士均可),理工科背景优先。
2. 精通 Python 编程,熟悉DeepSeek、Llama3、Qwen等开源大模型架构,了解OpenAI、Claude及国内主流大模型的能力边界与技术特性。
3.熟练掌握向量数据库的使用,熟悉常用词嵌入模型及语义检索技术。
4.对 AI 领域前沿技术(如长文本处理、多模态应用、Agentic Workflow)有高度兴趣和敏感性,能快速阅读并转化最新的开源技术文档。