任职要求:
1.大模型训练与优化:参与大规模语言模型(LLM)推理引擎的整体设计和开发,优化引擎,算法和模型架构,提高计算性能,并参与设计与开发LLM模型和应用的端到端部署系统,提升模型与应用的交付效率。2.应用场景落地:结合业务需求(如对话系统、内容生成、ChatBI、Agent),熟练运用不同训练方法解决实际问题,研究和洞察大模型测试体系和数据构建方法,评估大模型在理解、推理、agent、rag等全方面的能力,有实际项目经验者优先。3.参与产品研发:参与公司多智能体编排框架、模型智能体库和大模型平台等相关产品的研发,追踪并实现前沿思想。4.前沿技术研究:跟踪大模型领域最新论文(如Transformer梨构改进、多模态融合、Agent技术等),了解行业前沿动态,不断迭代大模型相关算法模块,实现产品愿景及目标。5.经验总结:协助撰写技术文档、报告。任职要求:1.计算机、人工智能等相关专业,本科及以上学历。2.技术基础:-熟悉Python和至少一种主流深度学习框架(PyTorch/TensorFlow/Paddle)-掌握NLP基础知识(如Transforme
研究方向:
计算机、人工智能等相关专业计算机科学与技术,物联网工程,信息安全,计算机技术,软件工程,电子信息,数学,统计学,数学与应用数学,信息与计算科学
福利待遇:
1、可办理居住证,硕士及以上可择优解决北京户口2、六险一金、定期体检、商业医疗保险3、年度调薪机制,股权激励4、公司提供通用技能、专业能力、管理能力、领导力等多层次培训5、与国际、国内知名高校设立联合培养模式,提供最前沿、最顶尖的行业学习及成长机会6、餐补、交通补助、通讯补助、电脑补助等各类补助7、节假日关怀及各类团建活动