职位描述
1 、负责超大规模机器学习系统的架构设计与实现,直面高并发、低延迟、高可靠性与可扩展性等核心工程问题;
2 、覆盖系统多个关键子领域:资源调度、分布式模型训练、数据管理与高性能计算等,能在不同岗位边界间灵活切换与贡献;
3 、与算法团队紧密协作,推动算法与系统的协同优化;
4 、主动跟踪并引入前沿技术,把最新硬件、异构计算、编译优化、以及 RL/Agent 型交互等新方向落地到工程实践中。
任职要求
1 、在工程实现或机器学习算法上有扎实基础与丰富实践经验;
2 、有解决棘手问题的经历,愿意钻研根源、追查底层问题,具备敏锐观察力和清晰的逻辑思维;
3 、热爱技术、有责任感、学习能力强、沟通顺畅并能自驱推进工作;
4 、善于团队协作,积极创新,乐于挑战,具有自我驱动和自我管理能力。