【关于 DEFCON AI】
DEFCON AI 致力于在充满不确定性和中断风险的环境中打造“具备韧性的系统”。公司利用人工智能、数学优化、数据分析和软件工程,对复杂系统进行具备韧性的优化。在当今动态变化的世界中,DEFCON AI 的技术帮助客户将业务结果与运营目标对齐,做出更佳决策,并提前预判、评估和减轻中断带来的影响。
【职位简介】
我们正在招聘一名有经验的云基础设施工程师,负责云环境的设计、部署和运维,重点聚焦虚拟化、自动化和安全。该角色对云基础设施的全生命周期负责——从虚拟机创建、网络架构设计,到 IaC(基础设施即代码)部署以及持续监控。
理想候选人需要具备在 AWS 和/或 Azure 环境下的实际管理经验,能够运营容器平台,并能将复杂的运维需求转化为可扩展且安全的解决方案。有在受监管或合规驱动行业(如医疗、国防、金融等)工作的经验将是重要加分项。
- 【主要职责】
- 云基础设施与虚拟系统管理
- 管理和维护 AWS 和/或 Azure 环境,包括虚拟机、网络与存储的日常运维。
- 管理 VPC、子网、路由表、安全组、NACL 及各类私有网络结构。
- 部署、维护和优化 EC2、RDS、S3、IAM、KMS、Secrets Manager 与 CloudTrail 等服务。
- 构建和管理加固的虚拟机镜像(AMIs / golden images),确保部署的一致性和可重复性。
- 实施并支持高可用、自动伸缩与灾备(DR)架构。
- 支持多账号或多订阅的云治理结构(如 AWS Organizations、Azure Management Groups)。
- 基础设施即代码(IaC)
- 使用 Terraform 设计和维护基础设施,包括模块化设计、远程状态管理和 workspace 策略。
- 牵头或协助将遗留的 IaC 工具(如 CloudFormation)迁移到现代框架。
- 落实策略即代码(policy-as-code)防护措施,维护版本化管理的基础设施代码仓库。
- 为 VPC 架构、IAM 角色、日志、监控和加密等构建可复用且安全的基线模块。
- 虚拟化与容器化
- 在云环境中管理虚拟化工作负载,包括规格规划、补丁管理、生命周期管理和成本优化。
- 支持在 ECS 和/或 EKS 上运行的容器工作负载,包括集群管理、网络和镜像安全。
- 协助从传统计算模式(如基于 EBS 的实例)向现代容器或无服务器架构迁移。
- 为虚机与容器化环境实现自动化漂移检测和修复。
- 自动化与 DevSecOps 集成
- 识别并落地自动化机会,降低手工运维工作量、提升团队效率。
- 将基础设施部署和安全控制集成到 CI/CD 流水线中(如 GitHub Actions、GitLab CI 等)。
- 实施和维护安全的密钥/机密管理实践。
- 与 DevSecOps 团队和应用工程团队协作,落实最小权限 IAM 策略和默认安全配置。
- 安全、合规与监控
- 在 Linux 与 Windows 虚拟系统上应用并维护安全加固基线(如 CIS Benchmarks、DISA STIGs)。
- 配置和监控 AWS CloudTrail、GuardDuty、Security Hub、Config 以及集中式日志管道。
- 支持与 SIEM 平台(如 Splunk、Microsoft Sentinel)的集成,并协助事件响应。
- 维护漏洞管理生命周期,包括补丁、整改跟踪和报告。
- 支持与相关合规框架(NIST 800-171、CMMC、HIPAA、SOC 2 或 FedRAMP 等)的对齐与落地。
- 跨职能协作与文档
- 与开发、安全和 IT 运维团队合作,交付稳定且可扩展的服务。
- 产出并维护完善的文档,包括架构图、运行手册(runbooks)、标准操作流程(SOP)以及审计/评估所需的证据材料。
- 协助云环境的预算管理、资源规划和容量预测。
- 【任职资格】
- 必备条件:
- 5 年以上系统管理、云运维或基础设施工程相关经验。
- 3 年以上在 AWS 和/或 Azure 环境中实际管理经验,包括虚拟机管理。
- 扎实的 Terraform 实战经验,包括模块化设计与状态管理;有 IaC 迁移经验更佳。
- 有能力在规模化场景下自动化运维流程、减少人工操作。
- 深刻理解 IAM、加密技术(如 KMS、TLS)及网络分段。
- 具备云环境下 Linux(RHEL/Amazon Linux)和/或 Windows Server 使用经验。
- 熟悉容器化技术(Docker、ECS、EKS 或 Kubernetes)。
- 对 CI/CD 流水线与 DevSecOps 实践有扎实理解。
加分条件
- 跨云(multi-cloud)经验,覆盖 AWS 与 Azure。
- 在医疗(HIPAA)、国防(CMMC/NIST 800-171)或金融服务(SOC 2)等受监管行业的经验。
- AWS 认证(解决方案架构师、SysOps 管理员、安全专项)或 Azure 同等认证。
- CompTIA Security+ 或同级别安全认证。
- 有 AWS Control Tower、Landing Zone 或同类治理工具使用经验。
- 熟悉 SIEM 平台(Splunk、Microsoft Sentinel)。
- 有管理或辅导分布式技术团队的经验。
- PMP、CSM 或类似项目/项目群管理认证。
- 具备有效的美国国防部安全许可(Secret 或以上)或有能力获取并保持该许可。
- 【核心能力】
- 基础设施所有权:对云环境的健康状态、安全性和性能承担端到端责任。
- 自动化思维:主动识别人工流程并用可扩展、可复用的方案替代。
- 安全优先:在基础设施设计和运维的每一层都融入安全考量。
- 跨职能沟通:能够向业务和合规相关方清晰解释技术复杂性。
- 纪律严谨的文档习惯:主动输出清晰、可审计的文档。
- 适应性:能在多云、不同工具链和动态变化的合规环境下高效工作。
- 【成功标志】
- 云环境(AWS/Azure + EKS)稳定、安全、可观测且有完备文档。
- 基础设施变更通过 IaC 可重复实施,具备清晰的评审和回滚路径。
- 监控/日志及漏洞整改流程常态化、流程化,而非临时救火。
- 审计所需的支持性材料(架构图/运行手册/证据)保持最新且可用。
- 【薪酬与平等机会】
- 薪资范围:14 万–18 万美元,具体视经验、技能及其他因素而定。
- 公司为平等就业机会雇主,求职者不会因种族、性别、肤色、宗教、性取向、性别认同、国籍、受保护退伍军人身份或残疾而受到区别对待。
- 【申请数据披露说明(摘要)】
- 通过提交申请,你同意 DEFCON AI 使用第三方服务提供商(招聘平台)支持招聘和录用流程,包括 ATS、候选人验证平台和反欺诈工具。你提交的简历、求职信、作品、问卷回答等信息可能会被这些平台接收和处理,用于:
- 管理和推进你的招聘流程;
- 验证申请材料的准确性和真实性(例如与公开信息和数据库交叉比对);
- 识别可能存在欺诈或重大误导的申请内容(如简历与公开资料不符、地理信息异常、虚构工作经历等)。
若申请被识别为存在欺诈或重大失实,可能会被拒绝继续考虑。如对申请状态或评估流程有疑问,可联系 [email protected]。第三方平台将仅在法律允许范围内、并为上述目的处理你的数据,数据会按 DEFCON AI 的数据保留政策保存必要期限后删除。详情可参阅公司的隐私政策和应聘者隐私声明。