职位描述

工作内容

作为一线技术专家，处理复杂问题，包括 GPU 资源、Kubernetes 容器平台、API 调用与集成问题；
为客户提供 LLM 部署与推理优化建议，协助定位训练和推理性能瓶颈；
汇总客户问题与工单趋势，推动产品与工程团队持续优化平台稳定性；
编写并维护技术文档和知识库，降低重复工单，提高客户自助解决能力。

任职要求

基础要求

计算机、软件工程或相关专业，本科及以上学历；
5 年及以上云计算 / DevOps / 基础设施相关经验；
有项目沟通经验和带团队经验优先。

技术能力

熟悉 GPU 架构及云计算基础设施；
熟练使用 Kubernetes ，有容器平台运维或排错经验；
熟悉至少一种主流数据库（ MySQL / PostgreSQL / MongoDB 等）；
理解大语言模型（ LLM ）基本原理，有模型服务或推理相关经验；
能阅读并调试 Python / Go / Java / JavaScript 中至少一种语言；
有 REST / gRPC API 排错经验；
面向全球客户和团队协作，可接受晚间沟通或 on-call 支持。

语言能力

能进行技术层面的中英文沟通（对接海外客户和团队）

福利待遇

员工福利

具有竞争力的薪资；
五险一金，节假日福利；
良好的办公环境，轻松的办公氛围。
可远程工作

公司介绍

Atlas Cloud （官网： https://www.atlascloud.ai ）是一家快速发展的 AI 基础设施初创公司，专注于模型即服务（ MaaS ）和基础设施即服务（ IaaS ）。公司总部位于纽约，在硅谷、北京和加拿大卡尔加里设有团队，为全球客户提供大语言模型（ LLM ）训练、微调与推理服务所需的 GPU 与云基础设施。我们正在构建面向下一代 AI 应用的高性能计算平台。

首席技术支持工程师

职位描述

工作内容

任职要求

任职要求

基础要求

技术能力

语言能力

福利待遇

员工福利

公司介绍

相似职位

EPAM Systems 寻找 Lead Python Developer 人才 | LinkedIn

Social Discovery Group招聘DevOps工程师（波兰）| LinkedIn

高级系统运维工程师

Decskill西班牙正在寻找Cloud Platform Engineer职位 | 自由职业 | 100%远程 | 西班牙 | LinkedIn