AI工程师 (武汉)
该职位来源于猎聘 【岗位职责】 负责电力和能源行业大模型的研发和应用,洞察AI领域最新趋势,协同业界领域专家探索具备高度适应性的高能效AI算法、架构和平台,并进行AI算法及系统的设计和实现,加速在能源领域的业务应用和解决方案中落地。
加载中...
我们正在寻找一名AI基础设施工程师,负责设计、构建和操作支持大规模AI训练和推理工作负载的平台层。该职位专注于GPU集群、分布式训练框架、调度、存储性能和ML工程师及研究人员的开发体验,强调可靠性、效率和成本控制。理想的候选人具备在大规模上构建或操作生产AI基础设施的经验,理解硬件、内核、调度器和ML框架之间的交互,并将强软件工程纪律应用于平台工作。
学士或硕士学位,计算机科学或相关领域;6年以上在基础设施、平台或HPC工程的经验;有操作GPU集群或大规模ML训练基础设施的实践经验;精通Python和至少一种系统语言如Go或C++;深入理解分布式训练、加速器架构和集体通信;有Kubernetes、Slurm、Ray或类似调度系统在ML工作负载中的经验;对Linux内核、网络和高性能存储有深入理解;有至少一个主要云提供商的ML基础设施服务经验;强软件工程实践,包括测试、CI/CD和代码审查;优秀的沟通和跨职能协作技能。
具有竞争力的基础工资,与经验相称,加上福利;全职直接W2职位;无第三方客户、供应商或实施合作伙伴;支持H1B转签;无C2C/1099/第三方公司;技术评估是必需的。
Bright Vision Technologies是一家专注于创新解决方案的软件开发公司,致力于帮助企业自动化和优化运营。我们利用尖端技术构建可扩展、安全且用户友好的应用程序。
请发送简历至 [email protected] 或联系 (908) 505-3899。
注册并登录后即可查看
该职位来源于猎聘 【岗位职责】 负责电力和能源行业大模型的研发和应用,洞察AI领域最新趋势,协同业界领域专家探索具备高度适应性的高能效AI算法、架构和平台,并进行AI算法及系统的设计和实现,加速在能源领域的业务应用和解决方案中落地。
CluePoints重新定义临床试验运行方式,作为风险基于质量管理(RBQM)和数据质量监控软件的领先提供商,利用先进统计学、人工智能和机器学习确保临床试验数据质量。寻找具备可观测性工程经验的系统可靠性工程师,负责提升平台和客户应用的端到端可观测性,专注于前端和真实用户监控(RUM)。
关于Telnyx Telnyx是行业领导者,我们不仅在想象全球连接的未来,我们正在建造它。从设计和放大私有、全球、多云IP网络的范围...
About The Job We are looking for a senior site reliability engineer to join the Cloud FinOps team at Hopper. We manage a large infrastructure in Google Cloud that is used by hundreds of engineers to provide a first class...