职位描述
一、岗位亮点
1、参与从 0→1/1→N 的 AI 流程编排与自动化平台建设(RAG、工具调用、Agent 协作、异步编排)。
2、实战引入 Diffy 或同类“影子流量回放 + 响应差异对比”方案,用于模型/版本回归检测与灰度上线。
3、对接多业务线(IM、客服、营销自动化、数据处理等),落地真实生产级闭环。
二、主要职责
1、AI/LLM 工作流编排 设计与实现多步推理、Agent 协作、工具调用(Tool-Calling/Function-Calling)、异步任务队列与补偿机制。 构建与优化 RAG:数据摄取、切片与向量化、召回/重排序、上下文压缩、缓存与降本。
2、评估与质量保障 搭建自动化评估与对齐体系(基准集、Ragas/G-Eval/自研指标),接入 A/B 测试与在线监控。 基于 Diffy(或等价方案)做影子流量回放与响应差异对比,识别模型/提示词/服务升级的回归风险;支持灰度/金丝雀发布与快速回滚。
3、工程化与可观测 建设模型/提示词版本管理、特征与数据版本管理、实验追踪(MLflow/W&B)与审计日志。 建立端到端可观测:延迟、错误率、提示词/上下文长度、命中率、成本监控(tokens/$)。
4、平台与集成 将工作流以 API/SDK/微服务形式对外;与业务后台(Go/PHP/Node)、队列(Kafka/RabbitMQ)、存储(Postgres/Redis/对象存储)及向量库(Milvus/Qdrant/pgvector)集成。 落地安全与合规(脱敏、PII 保护、审计、速率与配额、模型治理)。