岗位职责:
1.面向华为昇腾AI大模型和业内主流商业大模型,完成大模型训练框架、推理框架等开发与构建。
2.从事预训练大模型、对话和问答系统、预测预防、深度自然语言处理、多模态、知识图谱等前沿方向的预研、开发及调优,提升AI相关算法模型的训练效率和模型性能精度;
3.参与大规模语言模型在真实业务场景的落地,根据业务场景的需求,快速迭代和开发AI应用程序,解决业务上的痛点和挑战,实现卓越的用户体验。
4.积极跟进AI学术界和工业界大模型研究的最新动态,关注相关算法模型的训练效率和模型性能精度的持续迭代演进和优化。
5.结合商业应用场景,设计基于行业大模型的系统解决方案,协同其他部门进行创新方案设计和产品化开发。
任职要求:
1.数学/计算机/运筹优化/通信/信号处理等专业优先(博士),在深度学习、深度强化学习、统计分析、知识图谱、形式化技术、运筹优化中一个以上的领域有着深入的研究和丰富的实践。熟悉基础的机器、深度学习算法(DNN,Transformer、大模型等)、统计分析算法或优化算法(线性规划、整数规划)。
2.熟悉Python/Java/Scala/C++/C等至少一种编程语言,熟悉Linux系统和Hadoop/Spark等大数据平台者优先。
3.具有NLP领域实际项目或AI大模型实际落地经验,作为项目的主要成员进行过相关产品的研发;
4.具有系统思维能力、结构化表达能力和优秀的抽象建模能力。对技术有持续热情,敢于面对各种技术挑战,乐于学习新知识。
5.在NLP和人工智能领域内的国际权威期刊/顶会发表过论文者优先。