职位要求
1、深入金融科技业务场景,使用大模型技术解决垂直场景中的问题并提升业务价值;
2、参与行业大模型的训练和调优,包括 Pre-train、微调、优化、部署、推理等;
3、参与行业大模型技术解决方案构建,包括数据处理、模型优化、数据评测等;
4、参与搭建符合公司需求的 AI 大模型训练框架;
5、跟进和探索大模型相关的前沿研究和实际问题解决。
1、计算机、数学或统计学相关专业的博士学历;
2、熟练掌握 pytorch 等深度学习框架,有较强的算法工程能力;
3、熟悉大模型 Pre-train、微调、优化、部署和推理等,有实战经验者优先;
4、具备优秀的分析和解决问题的能力,良好的沟通、学习及自驱能力;
5、对 GPT、LLaMA、GLM、Bloom 等有一定了解和使用经验者优先;
6、有过预训练、精调或强化学习数据处理经验者优先,有过大赛获奖经验者优先。