职位描述
1.深入研究大语言模型(LLM)的推理与生成能力,探索 LLM 推理技术(如思维链、多步推理),优化复杂创作任务的流程与效果;
2.构建端到端的 Agent 系统,涵盖用户意图识别、知识检索、内容生成与风格偏好对齐,提升用户体验与个性化输出能力;
3.通过指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,优化模型在创作场景中的适应性。
岗位职责:
4.深入研究大语言模型(LLM)的推理与生成能力,探索 LLM 推理技术(如思维链、多步推理),优化复杂创作任务的流程与效果;
构建端到端的 Agent 系统,涵盖用户意图识别、知识检索、内容生成与风格偏好对齐,提升用户体验与个性化输出能力;
5.通过指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,优化模型在创作场景中的适应性。