职责概述:
1.负责大模型的研发与工程落地;
2.整合文本、图像、音频等不同形式的数据,增强模型对复杂输入的理解和响应质量,推动应用创新;
3.主导多模态训练集及测试集的构建,确保数据质量和多样性,支持模型训练需求;
4.建立实验环境评估算法效果,分析模型表现,撰写技术报告,持续改进对话系统的性能和服务质量。
岗位要求:
1.博士研究生,计算机、人工智能等相关专业;
2.对AI大模型、LLM Agent、RAG有深入了解,对Prompt Engineering有经验;
3.精通Python或其他编程语言,熟悉常用的深度学习框架(TensorFlow,Pytorch等),了解其底层原理;
4.熟悉常见的开源大模型(例如Llama, Qwen, DeepSeek等);
5.熟悉多模态数据集的构建流程,包括数据收集、清洗、标注和验证,能够确保数据集的质量和适用性。