加载中...
加载中...
我们正在寻找一名应用机器学习工程师,负责构建和扩展我们大型视频生成模型的数据管道。此角色专注于收集大量相关视频数据,准备高质量的训练样本,并开发稳健的预处理、过滤和解析工作流程。您将负责协调跨平台的注释流程(如MTurk和自有平台),并负责训练数据的整个生命周期,从原始数据输入到清洁、模型准备的样本,直接推动质量改进。此角色位于数据工程和机器学习研究的交汇点,是将杂乱的现实数据转化为推动模型前进的燃料的关键。
3年以上在机器学习、应用机器学习、数据管道或相关工程职位的经验,理想情况下在大型多模态、视频或基于视觉的系统中工作。
熟练的Python编程技能和构建可靠的数据处理和预处理管道用于机器学习工作流程的经验。
有准备机器学习模型训练数据的经验,包括解析、过滤、数据集整理、质量控制和大规模数据处理,使用工具如AWS S3和DynamoDB。
熟悉注释和标签工作流程,包括任务设计、供应商或crowd-platform orchestration(如MTurk或Prolific)以及确保标签质量的方法。
有在Kubernetes上协调分布式工作负载的经验,包括数据预处理、管道执行和数据集交付到训练集群。
在AWS和RunPod等云和按需计算环境中工作的能力,能够将管道移植和优化到不同基础设施。
熟悉分布式数据处理框架,有在许多节点或工作者上可靠运行系统的设计经验。
对PyTorch和更广泛的深度学习栈有工作知识,能够阅读、调试和优化研究模型推理代码用于生产预处理管道。
能够与研究和工程团队跨职能合作,将实验想法转化为稳健、可扩展的系统。
计算机科学、机器学习、工程、数学或相关技术领域的学士、硕士或博士学历;在生成视频、计算机视觉或多模态ML方面的经验优先。
额外加分:在ML管道中训练、评估或微调较小的ML模型的经验(用于分类、过滤、排名、质量评估或其他支持任务)。
具有竞争力的薪资和丰厚的公司股权,医疗保险、牙科保险和视力保险,99.99%的保费由Cantina承担,42天带薪假期,包括15天年假、10天病假、15天公司假期、2天弹性假期,丰厚的产假与生育支持,401(k)退休储蓄计划,生活方式支出账户——每月500美元,可自由使用,办公室员工的免费午餐和零食,一份医疗会员资格,更多!
Cantina Labs是一家社交AI公司,开发了一套先进的实时模型,推动表达、个性和真实性的边界。我们让角色栩栩如生,改变人们讲述故事、连接和创造的方式。我们构建并 powering 生态系统。Cantina,我们的旗舰社交AI平台,只是开始。
注册并登录后即可查看