职位详情
岗位职责:
1. 参与高效能分布式计算系统相关任务;
2. 基于新型算力中心及实验室大规模AI算力集群,投身高效能分布式计算系统的研发工作,围绕大模型训练过程中的系统级优化开展研究,涵盖数据缓存、GPU显存管理、断点续训等方向,提升人工智能计算平台的运行效率。同时针对大模型训练与推理中的性能瓶颈,探索机器学习系统领域的前沿技术,如训推加速、数据存储优化、算子与编译优化、任务调度机制等,并推动相关创新技术在之江实验室算力集群中的实际落地;
3. 协同实验室技术团队,将研发成果部署至大规模算力环境中,持续优化大模型训练效能。
任职要求:
1. 具备计算机、人工智能、电子信息、信息工程等相关专业博士学位;
2. 掌握计算机系统架构或模型训练与推理相关理论知识;
3. 熟练使用C/C++、Python等编程语言;
4. 具备大模型训练与推理实践经验者优先考虑;
5. 有计算机系统类科研项目经历者优先考虑;
6. 在计算机系统结构等相关领域发表过主流会议或期刊论文者优先考虑。
1. 参与高效能分布式计算系统相关任务;
2. 基于新型算力中心及实验室大规模AI算力集群,投身高效能分布式计算系统的研发工作,围绕大模型训练过程中的系统级优化开展研究,涵盖数据缓存、GPU显存管理、断点续训等方向,提升人工智能计算平台的运行效率。同时针对大模型训练与推理中的性能瓶颈,探索机器学习系统领域的前沿技术,如训推加速、数据存储优化、算子与编译优化、任务调度机制等,并推动相关创新技术在之江实验室算力集群中的实际落地;
3. 协同实验室技术团队,将研发成果部署至大规模算力环境中,持续优化大模型训练效能。
任职要求:
1. 具备计算机、人工智能、电子信息、信息工程等相关专业博士学位;
2. 掌握计算机系统架构或模型训练与推理相关理论知识;
3. 熟练使用C/C++、Python等编程语言;
4. 具备大模型训练与推理实践经验者优先考虑;
5. 有计算机系统类科研项目经历者优先考虑;
6. 在计算机系统结构等相关领域发表过主流会议或期刊论文者优先考虑。
2026-06-29 14:46
IP属地:浙江杭州
职位福利
博士经验不限计算机体系结构人工智能PythonPyTorch大规模异构集群

之江实验室
不需要融资 · 1000-9999人


鱼泡安全保障
如遇到办证收费、刷单、传销、诱导买车等违规行为,请立即向鱼泡直聘投诉举报投诉举报 >










