岗位职责
1.模型部署与优化:使用MindIE、vLLM等框架进行大模型及AI模型的部署和服务化封装,并优化性能;
2.模型训练与评估:承担AI模型的微调(如LoRA、P-Tuning)、强化学习训练及模型评估工作;
3.AI应用开发:根据业务需求,使用Python/Java开发AI驱动的应用模块,例如智能对话、智能问数、个性化推荐、多智能体协作等;
4.系统架构设计:设计并开发高可用、可扩展的AI服务平台与后端系统,进行服务编排、任务调度和接口集成;
5.架构改进:参与AI系统的整体架构设计,包括模型推理pipeline、缓存策略、负载均衡和容错机制;
6.前沿技术跟踪:关注并探索LLM相关前沿技术,包括预训练、后训练、RAG、Agent等,能判断技术实际价值,并高效落地应用;
7.跨团队协作:与产品、前端和运维团队紧密合作,确保AI能力在产品中的高效集成与交付;
8.技术创新:跟踪AI工程化的最新技术趋势,推动技术升级与架构演进,形成可复用的解决方案。
任职要求
1.计算机/人工智能或相关专业博士研究生学历;
2.熟悉Python编程,熟悉异步编程、多进程/多线程处理,具备良好的工程规范意识;
3.熟悉Docker、Kubernetes、CI/CD流程,具备云原生应用开发经验;
4.熟悉主流AI/深度学习框架,至少精通以下一项:PyTorch、TensorFlow、Hugging Face Transformers,具备大模型或深度学习模型的实际部署经验;
5.深刻理解机器学习,深度学习等算法原理,有大模型训练(如LoRA、SFT、RLHF)经验;
6.熟悉向量数据库(如Milvus、Weaviate)及RAG架构实现,参与过AI平台、MLOps系统项目落地,有LangChain、LlamaIndex等AI应用开发框架使用经验与有AI Agent、智能工作流设计与开发经验;
7.具备良好的沟通能力和团队协作精神,能独立承担模块设计与开发任务。