岗位职责:
设计或参与以下研究方向:
•机器学习系统
•存储架构
•云计算
•强化学习框架
1.与研究人员和其他实习生合作,共同参与前沿研究项目。
2.设计并实现创新系统,以解决实际问题,重点提高机器学习应用的可扩展性和性能。
3.对现有系统进行全面的性能剖析和基准测试,识别瓶颈并优化性能。
4.撰写高质量的科学论文、技术报告和文档,与学术界和工业界分享研究成果。
5.优化和维护代码库,聚焦性能优化和最先进技术的集成。
任职资格:
1.计算机科学、软件工程、统计与数据科学或其他相关领域的本科、硕士或博士学位。
2.精通C/C++编程,熟悉Python、Rust、Java或Golang。
3.具有操作系统、分布式系统、编程语言、存储系统、数据库及硬件的扎实基础。
4.具备并行计算、异构计算或人工智能的经验或知识,尤其是大规模生成模型的开发/微调/训练或强化学习相关经验。
5.熟悉Linux操作系统。
6.擅长系统性能剖析、基准测试和性能优化。
7.具有较强的沟通能力和团队协作精神。
具备以下背景优先::
1.在编程比赛(如ICPC、NOI或类似赛事)中有优异表现。
2.在超算竞赛(如ASC、SC、ISC或类似竞赛)中获奖或受到表彰。
3.具有AI框架(如PyTorch、JAX或TensorFlow)开发经验。
4.具有CUDA编程、RDMA网络编程以及分布式存储系统开发经验。
5.熟悉计算机体系结构,包括Intel/AMD CPU、I/O子系统架构以及PCIe协议。