岗位职责:
1.场景落地与交互设计: 负责个人多组学数据(基因、微生物、代谢等)交互场景下的 AI 应用开发。深入理解生物信息解读需求,将复杂的组学分析流程·转化为用户可理解的自然语言交互体验(Copilot/Agent形式),提升用户对自身健康数据的认知效率 。
2.应用框架搭建与优化: 基于主流大模型(LLM),搭建并优化适合垂直领域的应用框架(如 RAG、Agent)。重点解决组学知识的精准检索、长文本理解、复杂任务拆解(Task Planning)以及生信分析工具的自动化调用问题 。
3.效果调优与评测: 通过 Prompt Engineering、In-context Learning 或轻量级微调(SFT)等手段,优化模型在生物医学领域的回答准确率与合规性;建设垂直领域的评测集,持续监控并提升问答链路的效果 。
4.前沿技术转化: 跟踪业界在大模型应用(如 GraphRAG、多模态交互)及 AI for Science 方向的前沿进展,结合产品实际痛点,快速进行技术验证与功能落地 。
任职要求:
1.学历背景: 本科及以上学历,计算机、生物信息学、人工智能或相关专业背景。
2.技术栈要求:
(1)熟练掌握 Python 开发,熟悉 LangChain、LlamaIndex 或类似的大模型应用开发框架。
(2)熟悉主流 LLM 模型(如 GPT-4, DeepSeek, 混元, Llama 等)的 API 调用与特性,有 RAG(检索增强生成)或 Agent(智能体)系统的实际落地经验 。
(3)熟悉基本的后端工程实践(接口设计、日志与监控、简单性能优化等)者优先。
3.业务理解能力:
(1)具备良好的“场景感”:能够理解复杂/非结构化健康报告如何面向非专业用户进行解释与重构,能敏锐洞察用户在健康咨询场景下的意图 。
(2)生信背景加分:了解基础的生物信息学分析流程(如 WDL/Docker 流程、变异检测、微生物丰度分析等)或有多组学数据处理经验者将被优先考虑。
4.综合素质: 具备良好的工程落地能力和问题解决能力,不局限于纯算法研究,更看重利用现有工具(开源模型、云服务、工具库)解决实际业务问题的能力 。
加分项:
1.有医疗健康、生物科技或科研数据服务领域的 AI 产品开发经验。
2.有实际的 Prompt 调优经验,或熟悉 SFT/RLHF 等后训练流程 。
3.熟悉向量数据库(Milvus/Faiss等)及知识图谱相关技术。
base杭州,薪资一事一议。