职位描述
1、设计“科学发现的 LLM”。开发新颖的强化学习技术,利用合成环境和反馈来改进大规模模型在Al4Science 领域的后训练,包括但不限于数据收集与清洗、SFT、RL等环节;
2、负麦前沿模型的后训练,支持 LLM 自主科学探索。与领域专家合作,使得 LLM 具备科学生成假设设计计算模拟和真实实验、以及撰写代码和操控复杂仪器等能力;
3、发表有影响力的成果。追踪 LLM与 Al4Science 的前沿技术,与其他研究人员紧密合作,设计实验、分析学习动态,并将研究洞察转化为新的训练方法;
4、配合参与建设大模型 Infra、算法框架基建,形成完善的工业链路,
任职要求
1、硕士学历及以上,科研经验和水平优秀,有至少2篇一作 Paper 发表在人工智能顶会(如ICML、NIPS)或自然科学顶级刊物(如Nature、Science)。有高引用、高影响力paper 或开源项目:
2、研究或工作方向与 LLM 后训练和 RL高度相关,能构建并扩展 LLM 的 RL环境,并有利用 RL 训
练前沿 LLM 的经验;
3、有过开发能够有效反映下游实际任务性能的评估体系的经验;
4对深度学习、大模型相关框架如 verl 等非常熟悉,能独立完成相关的上下游工程建设;开放简单,沟通顺畅,合作能力强,对先进技术充满热情;
5、开放简单,沟通顺畅,合作能力强,对先进技术充满热情;
三、加分项:
1、在著名大厂基座模型组、大模型公司、和顶尖研究院有工作经验;
2、对后训练 Infra 有深入了解和实操经验;
3、对 Al4Science 有研究经验;