职位描述
全栈 / 服务端工程师(搞定 LLM Ops 、高并发与复杂支付链路)
岗位职责
- 设计、搭建并维护中国区核心后端与 AI 服务架构,对系统稳定性、可扩展性与长期可维护性负责,覆盖支付、订阅、模型接入与推理服务;
- 在国内云环境 部署并接入大语言模型与语音模型,管理多家模型 API ,理解能力差异并优化调用策略;
- 设计并维护 本地化推理与 AI 服务,包括低延迟优化、吞吐扩展、内容安全与合规处理;
- 建立并优化 LLM Ops 流程:Prompt 管理、自动化评测、日志监控、多模型路由与成本控制;
- 与总部工程团队协作,对接全球服务与代码主干,确保中国区系统与整体架构的一致性;
- 与客户端( iOS / Android )及产品团队协作,保障端到端体验稳定、可扩展、可持续迭代