岗位职责:
1.负责大语言模型(LLM)的训练、调优和部署,确保模型性能达到最优;
2. 深入研究和实现大规模语言模型(如ChatGLM、YaYi、LLAMA等),用于知识库构建、垂直领域数据微调、AI AGENT等,以提升模型的知识储备和特定领域的性能;
3. 协助团队其他成员理解和应用大语言模型(LLM)技术,提供技术支持和培训;
4. 跟进大语言模型(LLM)前沿技术,基于场景进行技术迭代与完善,打造有行业影响力的技术产品。
5. 深入理解大语言模型(LLM)推理的原理和算法,持续优化工具的性能和效率;
6. 配合团队成员进行工具的测试、部署和集成;
7. 编写相关技术文档,提供技术支持和培训。
任职要求:
1. 硕士及以上学历,计算机科学、人工智能或相关领域专业;
2. 三年以上大语言模型(LLM)训练工作经验 或 三年以上大语言模型(LLM)流程加速工具开发经验优先;
3. 熟练掌握至少一种编程语言(如Python、C++等),具备良好的代码风格和编程习惯;
4. 对大语言模型(LLM)推理和AI AGENT技术有深入了解,具备相关算法和数据结构的知识;
5. 对大语言模型(LLM)训练的原理、算法和技巧有深入了解,具备相关知识和实践经验;
6. 与其他团队密切合作,包括数据工程师、前后端工程师、产品经理等,实现高质量的产品和解决方案;
7. 对新技术充满热情,具备快速学习能力和创新思维。