基础模型系统研究员

工作职责：

任职要求：

985院校全日制本科及以上学历，计算机、软件工程或相关专业。
编程与框架能力：熟练掌握C、C++、Python或Cuda至少一种。熟悉PyTorch FSDP、DeepSpeed或Megatron-LM等分布式训练框架。
技术方案把控：能够从机器性能、系统稳定性等多维度严格把控技术方案，确保方案的科学性、合理性和高效性。
对以下一个或多个领域具备实践经验和浓厚兴趣：
- 并行系统：在基础模型的分布式训练、高效微调、强化学习训练及推理引擎优化等方面有深入研究，包括并行策略制定、量化压缩技术、算子优化等。
- 高性能算子：熟悉并行计算(如Triton、Cuda)、通信技术(如NCCL、NVSHMEM)及AI编译器(如MLIR、TVM, Triton, LLVM)等领域。

如您对该职位感兴趣，请将简历与求职信发送至 shandahr@shanda.com。我们也欢迎来自招聘机构的推荐。