任职要求:
【岗位职责】
1、系统与网络基础维护工作
基础设施管理:服务器(物理机/虚拟机/云主机)操作系统安装、调优;基础服务(ntp/http/nginx等)搭建;软硬件故障排查。
网络运维:配置火墙、明细路由;追踪路由,排查网络延迟、丢包等故障。
2、监控与故障响应
实时监控:通过Prometheus等工具监控系统性能(CPU/内存/磁盘)、软件状态、日志异常。
故障处理:通过日常系统巡检和监控软件告警信息快速定位问题,并解决问题(如软件运行异常、数据库宕机)。
值班与问题反馈:必要时参与假期值班,响应告警信息,对问题进行及时反馈。
3、自动化与AI运用
运维工具开发:编写脚本(Shell/Python/Ansible)实现自动化部署、日志分析、批量操作等;有意识使用AI技术结合系统日志、指标等进行异常预判。
4、安全与漏洞修复
安全加固:对Windows、centos、麒麟操作系统的漏洞信息较敏感,关注像Java、mariaDB等组件的补丁信息,熟悉Linux操作系统用户的权限管控。能够对操作系统进行安全加固,漏洞修复。
5、独立与协作
独立能力:可以独立完成系统项目的部署、运维、软件变更、问题定位工作。
沟通协作:与研发人员有较好沟通、合作能力;参与软件变更测试工作;团队成员间高效合作。
文档沉淀:编写运维手册、故障复盘报告,推动知识共享。
【技能要求】
1、熟悉Linux/Windows系统。可以熟练使用sed、awk、grep、find等Linux命令。
2、了解Docker/K8s、Nginx/MySQL/Redis等中间件。
3、可熟练使用shell、Python编写脚本处理工作。
4、熟悉目前使用广泛的集群组件,像Kafka、Zookeeper、Flink、Clickhouse、Spark、Hive、Doris等。了解各组件集群工作原理,可根据资料进行部署和使用,并进行简单调优。
5、掌握TCP/IP、HTTP/HTTPS、DNS等协议原理,可以使用wireshark、tshark、tcpdump等工具进行流量捕获和简单分析。
6、熟悉监控软件,了解Prometheus工作原理,可进行grafana+Prometheus的监控软件部署及使用。
7、软技能:
1)较高效沟通能力,快速理解用户和领导需求,给出反馈信息
2)有较好的抗压能力
3)勇于克服困难,对运维岗位工作有极大热情
4)接收必要时的值班、出差要求
研究方向:
网络空间安全,计算机
福利待遇:
工资福利待遇及合同管理按国家和研究所相关规定执行。符合条件的申请人,可解决北京市居民户口。