基础模型研究工程师
工作职责:
- 支撑模型规模化:为前沿探索成果规模化为业界领先的下一代模型提供关键支撑,包括大规模训练数据获取、强化学习环境构建、训练效率优化等。
- 构建评测系统:为下一代模型提供全面的自动化评测系统,推动对模型能力边界的理解,引导未来研究优先级。
- 推动产品应用:将理论突破应用于真实产品挑战,推动AI的实际应用和影响力。
任职要求:
- 985院校全日制本科及以上学历,计算机、软件工程或相关专业。
- 扎实的编程能力:熟练使用Linux环境下的Python和C/C++,熟悉PyTorch及主流大模型训练与微调框架,能独立实现复杂的深度学习模型与系统模块,具备高效调试与性能优化能力。
- 数据处理能力:具备大规模数据预处理、数据生成、数据增强能力,了解数据驱动的模型迭代工作流程。
- 熟悉大模型训练流程,包括分布式训练、模型并行、训练效率调优。
- 出色的问题分析能力,良好的合作心态与沟通技巧。
如您对该职位感兴趣,请将简历与求职信发送至 shandahr@shanda.com。我们也欢迎来自招聘机构的推荐。