职位描述
负责Linux/Windows服务器的部署、配置、监控、调优与故障处理。
管理虚拟化平台(如VMware/KVM)及云资源(如AWS/Azure/阿里云)的日常运维与容量规划。
制定并执行系统备份、恢复策略,定期验证数据可恢复性。
实施系统安全加固、漏洞修复与合规性配置。
确保业务应用所依赖的中间件及运行环境稳定可靠。
负责Web服务器(Nginx/Apache)、应用服务器(Tomcat/WebLogic)等中间件的安装、配置与维护。
配合应用团队进行系统部署、版本发布与问题排查。
监控系统与应用性能,分析瓶颈并提出优化建议。
提升运维效率与系统管理的自动化水平。
编写脚本(Shell/Python/Ansible等)实现日常运维任务自动化。
维护与优化监控告警系统(如Zabbix/Prometheus),确保关键指标可观测。
参与运维工具链的选型、部署与改进。
参与系统架构设计与容灾建设,保障系统高可用。
参与新系统架构评审,提供运维视角建议。
实施高可用方案(如集群、负载均衡)与容灾演练。
编写运维技术文档与应急预案。