职位简介:
本岗位聚焦大模型行业应用落地与垂类模型研发,负责大模型解决方案设计、工程化落地、推理部署与系统优化,深度参与大模型在垂直场景的全流程研发工作,助力大模型技术的业务价值落地。
工作职责:
1. 参与大模型行业应用解决方案设计、产品工具研发与全流程落地,结合业务场景与落地反馈,持续优化大模型产品能力与系统体验。
2. 负责垂类领域大模型的设计与研发,深入研究大模型精调、对齐、推理优化技术,结合场景需求参与大模型训练与工程化落地工作。
3. 负责大模型相关业务系统的架构设计、开发与维护,完成数据处理、向量检索、推理服务等核心模块的搭建与优化。
4. 跟踪大模型与AI领域前沿技术,完成技术调研、方案输出、技术报告及项目文档的撰写与沉淀。
5. 配合团队完成跨部门协作,高效完成团队负责人安排的其他相关工作。
基本任职要求:
1. 硕士及以上学历,本科和研究生阶段毕业于211/985或同等层次的国内外(QS200内)知名高校,人工智能、计算机科学与技术、数学、软件工程等相关专业背景。
2. 具备2年及以上大模型/人工智能研发相关工作经验,有完整的大模型落地项目经验。
3. 具备良好的团队沟通协作能力、自驱力与抗压能力,能快速响应业务需求与技术挑战。
核心专业能力要求:
1. 精通Python语言,精通AI场景编程开发,熟练掌握PyTorch / TensorFlow等至少一种主流深度学习框架,具备扎实的代码功底与工程化能力。
2. 深入理解GPT、LLaMA、ChatGLM、通义千问等主流大模型的核心原理,具备大模型推理优化、服务化部署的实战经验。
3. 具备扎实的软件系统设计能力,能独立完成业务系统的模块设计与开发;熟练使用SQL语言,精通MySQL等结构化数据库与MongoDB等非结构化数据库的使用与优化。
4. 熟悉Elasticsearch搜索引擎的使用与调优,熟练掌握Milvus/FAISS/Pinecone等主流向量数据库的搭建、使用与性能优化,能基于向量检索搭建RAG等大模型应用系统。
5. 精通Docker容器化部署技术,熟悉K8s等容器编排工具优先,能独立完成大模型推理服务、业务系统的容器化部署与运维。
6. 熟练掌握常用的机器学习、深度学习、强化学习算法,有算法设计、落地与优化的实战经验。
优先考虑项:
1. 在AI/大模型领域拥有相关发明专利,或在顶级学术会议/期刊发表过高水平论文者。
2. 在国内外顶级软件研发、AI算法相关竞赛中获得优异成绩者。
3. 有大规模大模型预训练、全流程行业解决方案落地、高并发大模型推理服务搭建经验者。
4. 有工业垂直领域大模型落地实战经验者。