前端工程师(Codemotion 26)
我们是电视和视频服务的领先专家,对技术和创新有着真正的热情。我们帮助组织将电视和视频业务转变为成功满足当今观众需求和期望的方式。
加载中...
负责确保企业关键平台的可靠性、可扩展性、安全性和性能,领导SRE实践,管理容器化工作负载,负责可观察性、身份和事件响应能力,与基础设施、安全和应用团队合作。主要职责包括:系统可靠性与运维:领导并成熟SRE实践,包括SLIs、SLOs、SLAs、错误预算和可靠性指标,负责事件响应、值班准备、根本原因分析(RCA)和事件后整改,推动减少MTTR、事件频率和客户影响的停机时间。云与平台工程(Azure):设计、操作和优化高可用Azure环境,确保平台在计算、网络、存储和身份服务上的韧性,与基础设施和安全团队合作制定安全默认的云标准。容器化与运行时平台:领导容器化平台(Kubernetes/Azure Kubernetes Service)的可靠性工程,定义部署、扩展、健康检查和韧性标准,支持CI/CD流水线和自动化发布策略以提高稳定性。可观察性与监控(Datadog):使用Datadog管理企业可观察性策略,建立可操作的仪表板、警报标准和噪音减少实践,确保监控支持运营响应和高管可见性。身份与访问可靠性(Auth0):与安全团队合作确保Auth0基于的身份服务的高可用性和可靠性,监控认证和授权流程以防止影响客户或员工的停机。领导与协作:作为技术负责人和导师指导SRE和平台工程师,影响应用团队采用可靠性优先的设计模式,提供清晰的风险、可用性和可靠性报告给管理层。
7年以上系统可靠性工程、平台工程或云运维经验;具备Microsoft Azure实战经验;有容器化平台(Kubernetes/AKS)支持经验;熟悉可观察性平台(首选Datadog);具备身份平台(首选Auth0)支持经验;有事件管理、根本原因分析和运营韧性经验;能用通俗语言向技术及管理层传达可靠性风险。
注册并登录后即可查看
我们是电视和视频服务的领先专家,对技术和创新有着真正的热情。我们帮助组织将电视和视频业务转变为成功满足当今观众需求和期望的方式。
关于Revolut 人们希望从他们的钱中获得更多。更多的可见性,更多的控制,更多的自由。自2015年以来,Revolut一直在致力于实现这一点。我们的强大产品组合——包括支出、储蓄、投资、兑换、旅行等——帮助我们的7000多万客户提供每天更多的钱。
About Joveo: Every company says they're "AI-first." We actually are. Joveo's recruitment advertising platform processes millions of hiring decisions through machine learning, real-time bidding, and predictive analytics — helping the world's largest employers find the right people, faster and fairer.
关于 Joveo:每家公司都说他们都是‘AI 首选’。我们确实如此。Joveo 的招聘广告平台通过机器学习、实时竞价和预测分析处理数百万次招聘决策,帮助全球最大的雇主更快、更公平地找到合适的人。但我们的工作还没有结束。