岗位职责
1、主导大模型核心算法研究,包括预训练框架设计、注意力机制优化、混合精度训练等关键技术。
2、探索多模态融合、持续学习、安全可控等前沿算法方向,提升模型泛化能力与场景适配性。
3、设计高效的模型压缩与推理优化方案(如量化、剪枝、动态计算图),降低部署成本。
4、开发领域适配算法(如小样本微调、prompt 工程),提升模型在特定场景的精度与可靠性。
5、与业务团队协作,完成算法到产品的转化,确保技术方案可规模化部署。
任职要求
1、计算机科学、人工智能、电子信息等相关专业,硕士及以上学历(博士优先)。
2、5 年以上 AI 研发经验,3 年以上智能体或大模型相关领域经验。
3、主导过至少 1 个智能体系统或大模型落地项目,具备从 0 到 1 的全流程经验。
4、精通 TensorFlow/PyTorch 框架,熟悉分布式训练(如 DeepSpeed、Megatron-LM),深入理解 Transformer 架构、自监督学习、强化学习等核心技术。具备模型压缩(量化 / 剪枝)、高效推理(TensorRT/ONNX)等工程经验。
5、熟悉智能体架构(如 Reactive、BDI、分层决策)及相关算法(强化学习、规划控制)。掌握自然语言处理(NLP)、知识图谱、多模态交互等技术。有对话系统(如 Chatbot、任务型 Agent)或机器人控制经验者优先。