职位描述
- 设计、搭建并维护中国区核心后端与 AI 服务架构,对系统稳定性、可扩展性与长期可维护性负责,覆盖支付、订阅、模型接入与推理服务;
- 在国内云环境 部署并接入大语言模型与语音模型,管理多家模型 API ,理解能力差异并优化调用策略;
- 设计并维护 本地化推理与 AI 服务,包括低延迟优化、吞吐扩展、内容安全与合规处理;
- 建立并优化 LLM Ops 流程:Prompt 管理、自动化评测、日志监控、多模型路由与成本控制;
- 与总部工程团队协作,对接全球服务与代码主干,确保中国区系统与整体架构的一致性;
- 与客户端( iOS / Android )及产品团队协作,保障端到端体验稳定、可扩展、可持续迭代
任职要求
- 本科及以上学历,计算机或相关专业,3 年以上全栈 / 服务端 / 平台开发经验;
- 熟练掌握 Python / Node.js / TypeScript ,具备扎实的服务端开发与系统设计能力;
- 熟悉 Web 架构、API 设计、性能优化与安全性设计(高并发、稳定性、权限与数据安全);
- 熟悉数据库设计与实现(如 MySQL 、MongoDB 等),具备 API 网关或中间层开发经验;
- 对 LLM 应用开发有实践经验,了解 LangChain / Vector DB / RAG / Embedding 等相关技术;
- 熟悉云原生技术( Docker 、Kubernetes ),有国内云环境部署与运维经验;
- 具备良好的英文沟通能力,能够与海外团队进行跨国、跨职能协作;
- 具备良好的产品意识与沟通能力,自我驱动力强,能在不确定环境中快速推进和迭代;
加分项 (可选)
- 有支付、教育等 强合规场景 的系统或 AI 服务部署经验;
- 有大规模 AI 应用、语音或多模态应用的研发经验;
- 有 LLM Ops 、成本优化或多模型调度的实际经验;
- 有开源项目贡献或技术社区活跃经历;