岗位需求:
中心招聘对生物信息学、基因组学与人工智能交叉领域充满热情的实习生,参与基于大语言模型(LLM)和深度学习的基因数据分析项目,与团队一起探索AI在基因组学中的应用,包括但不限于基因序列建模、变异检测、功能预测及多组学数据整合。
岗位职责:
1.使用Python/R等工具处理高通量测序数据(如WGS、RNA-seq、单细胞数据);
2.结合深度学习(如Transformer、扩散模型)优化基因数据分析流程;
3.探索大模型(如DNABert、GenSLM)在基因功能注释、疾病关联分析、CRISPR靶点设计等任务中的应用;
4.协助团队搭建自动化分析流程,提升生信分析效率;
5.参与科研论文或技术报告的撰写(优秀者可署名)。
任职要求:
1.基本要求
(1)生物信息学、计算生物学、计算机科学、统计学或相关专业本科及以上在读学生;
(2)熟悉Linux环境及常用生信工具(如GATK、STAR、DESeq2、Bioconductor等);
(3)熟练使用Python/R进行数据分析,掌握Pandas/Numpy/Scikit-learn等库;
(4)具备基础的机器学习知识(如SVM、随机森林、神经网络)。
2.优先考虑
(1)有深度学习(PyTorch/TensorFlow)项目经验,熟悉NLP或序列建模(如BERT、LSTM);
(2)接触过大模型(如EVO2、LLM、AlphaFold)或生物领域预训练模型(如DNABert、ESM);
(3)熟悉云计算(AWS/GCP)或HPC集群的使用;
(4)在GitHub上有生物信息或AI相关开源项目。