岗位职责:
1.追踪并实现前沿大模型多模态数据质量相关技术,包括但不限于文本、图像、音频、视频质量相关技术;
2.负责基于大规模语言模型(LLM)的多模态数据质量研发工作,包括数据分析、模型训练和优化、服务部署等,以提升多模态数据的质量并进一步提升大模型效果;
3.负责大规模语言模型的设计、训练和优化,特别是在自然语言处理和语音识别交互中的应用;
4.探索和开发大模型在语音识别、语音合成和多模态交互中的前沿应用;
5.参与自然语言处理技术的平台化开发,推动大模型技术在语音语义交互领域的创新应用;
6.负责数据挖掘、数据增强等算法工具的研发,并针对大模型进行专项优化;
7.跟踪大模型在NLP领域的最新研究进展,并研究实施应用。
岗位要求:
1.博士以上学历,计算机、人工智能或相关专业;
2.具有深入的大模型研发背景,熟悉Transformers、BERT、GPT等现代NLP模型架构;
3.熟悉Linux平台下的数据处理与Shell脚本编写,精通Python、perl、C、C++等编程语言,对数据结构和算法设计有深入理解;
4.在语音识别与交互方向有浓厚兴趣,有相关的大模型应用经验者优先;
5.优秀的逻辑思维和问题分析能力,对数据敏感,能够快速定位和解决核心问题;
6.具备扎实的数学基础,尤其在统计学和线性代数方面;
7.较强的沟通能力和逻辑表达能力,具有持续学习的热情,良好的团队合作态度,以及强烈的责任心。