职位要求
职位描述
1. AI前沿技术在网络安全和云计算等领域的研究与落地;
2. 利用内外部海量数据进行多模态大模型的预训练得到通用大模型;
3. 借鉴GPT-3.5/4、开源大模型等技术,基于业务数据对大模型进行微调解决垂直领域问题;
4. 借助大型GPU集群,快速迭代形成多模态大模型落地业务的最佳实践。
职位要求:
1. 博士学历,计算机科学、人工智能、自然语言处理等相关专业;
2. 以第一作者发表至少1篇以上AI领域顶会论文;
3. 熟练掌握常用的数据挖掘、机器学习、深度学习、强化学习算法,并有项目或产品化经验,具备良好的算法选型能力;
4. 在NLP、CV、AIGC领域有深入的理解和实践;
5. 精通Python编程语言,熟悉PyTorch或TensorFlow等深度学习框架,有良好的工程化能力;
6. 专精深度学习自然语言模型的实践,有利用GPU集群训练和微调大模型的经验优先;
7. 优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情;
8. 具备良好的团队合作与沟通能力,能与其他研究人员和工程师紧密配合。
加分项:
1.对新技术和前沿研究有强烈的兴趣和追求,能够持续学习和探索NLP/AIGC/CV等领域的最新进展;
2.为开源社区贡献过大语言模型代码,主导过大型自然语言模型项目。