[On-Site|全职] 阿里云智算安全容器
职位描述
主要职责:
1 )负责 GPU 超级节点新硬件的技术评估与选型标准制定,输出硬件适配路线图。
2 )主导安全容器环境中设备虚拟化的关键技术攻坚,涵盖 vSMMU 、SVA 、GPUDirect RDMA 等核心模块的研发与优化。
3 )设计并建设面向 GPU 超级节点的底层 VMM 自动化评测体系,支持性能、稳定性、安全性等多维度量化评估。
4 )支撑系统在超大规模 AI 集群中的生产级落地,确保系统具备高可用、高性能、低成本的工程优势。
5 )输出高质量系统设计文档,参与智算多租容器计算系统的底层架构评审与技术决策,推动架构持续演进。
任职要求
职位要求
1 )计算机科学或相关专业,5 年以上系统开发经验。
2 )精通 linux 内核和虚拟化技术,具备大规模生产系统底层技术开发上线经验。
3 )熟悉容器技术( Docker 、containerd )及容器运行时( runc 、gVisor )。
4 )具备虚拟化或轻量虚拟机( microVM )开发经验,熟悉 Firecracker 、QEMU 、KVM 者优先。
5 )具备强烈的安全意识,了解常见漏洞(如 CVE 、逃逸攻击)及防御机制。
6 )有开源项目贡献经验或技术博客输出者优先。对 AI 硬件及系统技术有深入理解,熟悉常见 GPU 卡型及相关底层技术,熟悉相关发展趋势者优先。
7 )工作中有责任心,注重团队协作,具备快速学习和动手实践的能力。
福利待遇
公司介绍
阿里云智算团队。
我们正在构建面向 GPU 超级节点架构的新一代智算多租容器计算系统,采用以 Rust 编写的轻量级 VMM 为核心的安全容器架构,致力于打造具备强隔离、低虚拟化开销、高兼容性的 AI 原生运行时环境。你将作为核心系统工程师,深度参与底层虚拟化关键技术攻关,解决安全容器在大规模 GPU 计算场景下的性能、隔离与可扩展性难题。
这不仅是一次系统级编程的挑战,更是参与定义 AI 时代安全容器基础设施标准的战略机遇。
感兴趣的可以聊一聊,负责内推,全程跟踪。
注册并登录后即可查看