岗位职责:
1、参与大模型本地化部署与性能优化,支持大模型的本地化部署,参与模型量化(INT4/FP8)、显存优化及推理加速等工作;参与构建商业应用,确保响应延迟满足客户要求,并支持高并发;
2、AI Agent开发与优化,开发面向智能客服、数据分析Agent等的AI应用,使用LangChain/Dify等框架实现任务规划、工具调用及多智能体协作;
3、通过用户反馈分析持续优化应用的交互体验、性能等,提升客户满意度优化
任职要求(需满足条件1,条件2-4至少满足其中一条)
1、计算机/人工智能相关专业,有课程设计、开源项目或竞赛,接受应届毕业生,实习生(在校生可全职实习≥6个月);
2、AI Agent开发,熟悉LangChain/Dify等框架,具备工作流、智能体、工具(如API集成)开发经验(课程/项目均可);
3、了解RAG、记忆管理(向量数据库)或多智能体通信(MCP协议)者优先;
4、大模型部署与优化,掌握PyTorch基础,了解模型量化、蒸馏或推理加速技术,了解常见的本地模型推理框架,有非cuda设备(ROCM/昇腾)部署经验者加分。