机器学习工程师
E
emochi.com76 阅读
内容
岗位职责:
- 参与公司机器学习工程(MLE)相关工作,专注于提升大语言模型(LLM)的生成质量,推动技术创新和产品落地,具体职责包括但不限于:
- 监督微调(SFT)与强化学习优化:深入研究和实施大语言模型(LLM)的监督微调(Supervised Fine-tuning, SFT)技术,结合业务需求精准优化模型性能;开发数据增强和过滤策略,进一步优化模型训练数据的质量。
- 工程化与部署:设计并实现从训练到推理的完整模型工程化流程,包括分布式训练、推理优化和多机部署。
- 系统设计与支持:与后端团队协作,设计高性能模型微服务架构,支持大规模并发请求;建立模型评估体系,通过自动化评估指标(如BLEU、ROUGE、PPL)和用户反馈迭代生成能力。
- 新策略调研与模型恢复优化:针对生成质量问题,调研最新优化技术,验证其在模型恢复和提升生成一致性中的效果;通过快速原型和实验设计,将创新策略转化为实际应用,并推动工程化落地。
- 跨团队协作与支持:与数据科学家、AI产品经理密切协作,进行需求分析、技术方案评审及落地实施。
任职资格:
- 编程能力:精通至少一种后端开发语言(如 Python、Go、Node.js),熟悉主流开发框架和工具链;具备分布式系统和并行计算开发经验,能设计高效的训练与推理管道;熟悉代码优化、内存管理和调试技术。
- 模型开发与优化:深入理解深度学习框架(如 PyTorch、TensorFlow),有大规模模型训练、调优经验;熟悉SFT、RLHF、DPO等生成优化技术,并能够结合业务场景灵活应用;精通奖励模型构建及其在强化学习中的应用,能够在生成场景中提升上下文一致性和内容质量;具备调研最新生成优化技术并高效转化为实际应用的能力。
- 工程化与系统设计:有从零搭建机器学习系统的经验,熟悉推理加速、模型优化和微服务架构设计;熟悉云服务平台(如 AWS、GCP、Azure),具备大规模分布式部署能力;熟悉面向LLM的A/B测试框架,能够通过实验持续优化生成质量。
加分项:
- 有从零搭建生成式AI模型或团队的经验。
- 有角色扮演场景经验。
- 在开源社区有贡献记录。
- 对产品和技术有热情,并有自己的思考和想法。
- 具有极强的主观能动性。
联系方式:
微信:LLGG9501