我们正在寻找一位高级云基础设施工程师,全面负责并不断演进以 Azure 为主的基础设施环境。这是一个需要实战能力的高级个人贡献者岗位,在云基础设施、身份管理、终端管理和安全等方面拥有高度自主权和责任。
理想候选人应是微软生态的技术权威,负责设计、运维并持续改进以云为先的环境,以支持分布式团队和现场运营在规模化场景下稳定运行。该岗位要求较强的主人翁精神、主动沟通能力,以及在缺少持续指示的情况下合理排定优先级的判断力。
环境概览
- 云:Azure IaaS(主要平台)——虚拟机、网络、存储账户、Key Vault、Azure Virtual Desktop
- 身份与访问:Microsoft Entra ID、Active Directory、RBAC、条件访问、MFA
- 数据:SQL Server、Azure SQL 托管实例
- 终端:约 2,000 台 Windows 11 现场设备 + 约 800 台 Zebra Android 手持设备
- 办公套件:Microsoft 365 E5——Exchange Online、Teams、SharePoint、Defender 套件
- 网络:全 Fortinet 方案,日常管理由第三方供应商负责
- 安全:Microsoft Defender for Endpoint、EDR、基于 M365 E5 堆栈的漏洞管理
核心职责
- 负责 Azure IaaS 基础设施的日常管理:虚拟机、网络、存储、Key Vault 以及 Azure Virtual Desktop
- 管理 Entra ID 和 Active Directory:用户全生命周期、RBAC、条件访问策略、MFA 及 SSO 集成
- 管理 SQL Server 和 Azure SQL 托管实例,包括补丁、性能监控和可用性
- 通过 Microsoft Intune 负责 Windows 11 和 Android(Zebra)设备的端点管理:策略配置、合规性、应用部署以及 Zebra 设备的持续推广
- 维护和优化 Microsoft 365 E5 服务:Exchange Online、Teams、SharePoint 及 Defender 安全套件
- 执行补丁管理、漏洞修复以及在服务器和终端层面实施安全基线
- 执行和维护灾备与备份流程;参与灾备演练和非计划停机响应
- 开发和维护 PowerShell 自动化脚本,降低团队的手工运维工作量
- 编写和维护系统配置、架构决策和变更历史文档,维护运行手册(Runbook)
- 参与值班轮值;支持计划内维护窗口及非工作时间的补丁更新
- 作为基础设施相关问题从 IT 团队升级时的技术支撑点
任职要求
- 【必备条件】
- 5 年以上生产环境中的 Windows Server 实战管理经验
- 4 年以上 Azure IaaS 经验:虚拟机、VNet、NSG、存储、Key Vault、Azure Virtual Desktop
- 扎实的 Entra ID(Azure AD)经验:RBAC、条件访问、身份治理、混合身份
- 具备 SQL Server 和/或 Azure SQL 托管实例的生产环境经验
- 熟练使用 PowerShell 编写基础设施自动化及运维工具
- 具备 Microsoft 365 管理经验:Exchange Online、Teams、SharePoint
- 熟悉 Microsoft Defender 套件以及在 M365 E5 环境下的终端安全运营
- 具备扎实的网络基础:TCP/IP、DNS、防火墙概念、VPN、路由等
- 具备较强的自我驱动能力,可自主设定优先级、管理工作量而无需日常监督
- 优秀的英文读写与口头沟通能力,能够自如参与供应商和业务干系人会议
- 【加分项】
- Fortinet 经验:FortiGate 实操或熟悉 FortiManager 者优先
- Microsoft Intune 与终端管理:Intune 策略编写、合规基线设置、在 Windows 和 Android 设备上的应用部署经验
- 漏洞管理经验:使用 Defender Vulnerability Management 或 M365 E5 堆栈中类似产品的经验
- Android / 移动设备管理:有 Zebra 或其他加固型 Android 设备部署经验为佳(当前正在大规模上线)
- 相关认证:AZ-104(Azure 管理员)、AZ-305(Azure 解决方案架构师)、SC-300(身份与访问)、MS-102(M365 管理员)或同等证书
值班期望
- 参与轮班值守(例如每几周值守 1 周)
- 不定期参与非工作时间的维护窗口,用于打补丁和升级
- 事件量整体偏低至中等,更关注主动提升稳定性
匹配特质
- 将基础设施视为“产品”,注重文档化、标准化,并持续改进
- 能主动识别问题和缺口,并提供可行解决方案,而不仅仅是报告问题
- 能在同一工作日内在架构层面的战略讨论和一线排障之间灵活切换
- 能与非技术干系人进行清晰沟通,并在与供应商沟通时保持理性、建设性地坚持立场
- 能在最少“手把手”指导的前提下端到端负责工作流
职位价值
- 全面负责和塑造一个 99% 基于 Azure IaaS、极少本地部署的环境
- 推动身份、终端管理和安全态势的持续提升
- 在高自主权环境中工作,直接影响基础设施方向
- 接触支持数千终端和用户的企业级系统
- 参与制定标准、自动化方案及长期基础设施战略