岗位职责:
1.大模型基础算法研究:负责大语言模型预训练、微调、高效适配、稀疏化、量化压缩等核心算法的研究与迭代,跟踪国内外LLM前沿技术动态,探索新型模型架构、训练范式与优化方案,提升模型通用能力、推理效率与稳定性。
2.模型对齐与安全研究:开展大模型RLHF、SFT、Agentic RL等对齐技术研发,优化模型对话逻辑、事实准确性、逻辑推理能力;研究大模型幻觉、偏见、安全风险等问题,搭建模型安全评估与优化体系,保障模型合规可用。
3.前沿技术攻关与创新:针对大模型长文本理解、多模态融合、工具调用、Agent、记忆机制等前沿方向开展专项攻关,突破模型性能瓶颈,落地差异化技术创新点。
4.科研成果产出:独立牵头科研项目,完成技术方案设计、实验验证、数据复盘与成果沉淀,高质量输出学术论文、发明专利、技术白皮书等科研成果。
5.技术落地与业务赋能:结合所需的业务场景,将大语言模型核心技术落地至智能问答、内容生成、代码辅助、知识推理、企业智能化解决方案等场景,解决业务实际痛点,推动技术商业化落地。
6.团队技术共建:参与团队技术研讨、算法迭代与技术分享,指导访问学生、联培博士等,搭建完善的大模型研发流程与技术规范,推动团队整体技术能力提升。
任职要求:
1.学历:博士学历,具备扎实的学术科研功底。
2.专业:人工智能、计算机科学与技术、机器学习、深度学习、自然语言处理、大数据、模式识别等AI相关专业。
3.能力基础:精通深度学习、自然语言处理、大语言模型核心理论与技术,熟悉计算机视觉的基本原理,具备扎实的数学、算法基础。
4.有学术会议(NeurIPS、ICML、ICLR、ACL、CVPR、KDD等)论文发表、核心专利授权、国家/省级科研项目参与经验者优先。
5.熟悉主流开源大模型(LLaMA、Qwen等)的二次开发与优化,有落地企业级大模型项目经验者优先。