职位描述
主要职责:
1 )负责 GPU 超级节点新硬件的技术评估与选型标准制定,输出硬件适配路线图。
2 )主导安全容器环境中设备虚拟化的关键技术攻坚,涵盖 vSMMU 、SVA 、GPUDirect RDMA 等核心模块的研发与优化。
3 )设计并建设面向 GPU 超级节点的底层 VMM 自动化评测体系,支持性能、稳定性、安全性等多维度量化评估。
4 )支撑系统在超大规模 AI 集群中的生产级落地,确保系统具备高可用、高性能、低成本的工程优势。
5 )输出高质量系统设计文档,参与智算多租容器计算系统的底层架构评审与技术决策,推动架构持续演进。
任职要求
职位要求
1 )计算机科学或相关专业,5 年以上系统开发经验。
2 )精通 linux 内核和虚拟化技术,具备大规模生产系统底层技术开发上线经验。
3 )熟悉容器技术( Docker 、containerd )及容器运行时( runc 、gVisor )。
4 )具备虚拟化或轻量虚拟机( microVM )开发经验,熟悉 Firecracker 、QEMU 、KVM 者优先。
5 )具备强烈的安全意识,了解常见漏洞(如 CVE 、逃逸攻击)及防御机制。
6 )有开源项目贡献经验或技术博客输出者优先。对 AI 硬件及系统技术有深入理解,熟悉常见 GPU 卡型及相关底层技术,熟悉相关发展趋势者优先。
7 )工作中有责任心,注重团队协作,具备快速学习和动手实践的能力。