岗位职责
1、 制定公司技术路线与系统整体架构规划,主导高并发、高可用、高扩展性系统的设计,确保技术方向与业务目标一致。
2、负责核心架构的搭建与优化,包括分布式系统、微服务架构、云平台(如AWS、阿里云)的设计与实施,负责公司基础平台的核心代码编写;
3、 提炼非功能性需求(如安全性、性能、可维护性),推动架构持续改进;
4、 负责技术管理与团队指导,指导开发人员落实架构设计,提升团队整体水平,衔接业务需求与技术实现,支持管理决策(如技术风险评估、成本估算);
5、 主导技术攻关,跟踪前沿技术趋势(如大数据、云计算、AI),推动新技术落地应用。
任职要求
1、 计算机科学、电子信息、软件工程等相关专业,硕士及以上学历,博士学历者优先考虑。
2、 需精通分布式系统、高性能计算(HPC),熟悉GPU/TPU等硬件加速技术。
3、 对算法与工程结合有深刻理解,能够将研究员的算法方案高效落地。
4、 具备扎实的计算机基础(如操作系统、编译原理),熟悉PyTorch、TensorFlow等框架。
5、 10 年以上系统架构或分布式系统研发经验,5 年以上 AI 领域架构设计经验,有领导超大规模 AI 平台开发的成功案例。
6、 掌握微服务架构设计,熟悉主力的服务化框架和分布式中间件技术,如Docker、K8S等;
7、 具备战略规划能力、技术架构选型实现能力、应用系统架构解决方案和落地能力,具备良好的沟通能力、抗压能力和团队协作精神。
8、有大模型训练平台(如 NVIDIA NeMo、Hugging Face Trainer)开发经验者优先