岗位职责:
1.负责大语言模型(LLM)、多模态大模型相关算法设计与关键技术研究
2.跟踪学术界与工业界前沿技术(如RLHF、DPO、MoE架构),推动算法在业务场景中的落地;
3.与工程团队、数据团队、产品团队协作,完成数据清洗、领域知识注入及模型服务化部署;
4.撰写技术文档。
任职要求:
1.教育背景:
计算机科学、软件工程相关专业博士及以上学历
2.技术能力:
(1)熟悉主流大模型架构(如Transformer、BERT、GPT、LLaMA、CLIP等),深入理解模型构建技术原理,并具有改造模型架构能力;
(2)具有较强的研究论证能力