任职要求:
1、计算机/电子/人工智能/数学等相关专业硕士/博士在读,具备扎实的ML基础(深度学习/强化学习);
2、熟悉预训练语言模型(BERT/T5/Llama等)与Post-Training范式(SFT/LoRA/RL)。模型优化与推理加速方法(模型蒸馏/量化压缩/动态计算图);
3、熟练使用PyTorch/TensorFlow/TRANSFORMERS等框架,熟悉Linux环境开发。至少精通一门语言(Python/Java/C++),代码逻辑清晰,有工程落地经验者优先。
加分项:
1、参与过大模型/推荐系统/AI客服项目,有模型从0到1开发经验;
2、在NeurIPS/ICML/ACL等领域顶会/期刊(一作/二作)发表过论文,或在Kaggle/天池竞赛中获奖;
3、ACM/NOI竞赛获奖者或工业界AIHackathon项目主导者。
研究方向:
1、主导电商场景下NLP、多模态融合及大模型技术的创新应用,如智能对话机器人/智能客服辅助系统开发,推动技术从实验室到生产环境的转化;
2、探索基于Transformer架构的预训练模型优化(如LoRA、PrefixTuning等),提升客服场景下的上下文理解能力与任务执行效率;
3、设计基于LLM的多轮对话管理机制,实现用户咨询意图识别(QueryParsing)、跨模态内容理解(如图文混合Query分析)及个性化回答生成,
结合强化学习(RLHF)优化对话策略;
4、从预训练到微调全流程优化,重点突破:模型量化压缩(GPTQ/NNPQ)、推理加速及长文本生成连贯性问题。