职位要求
方向一:大模型,有llm训练经验,有强化学习经验,有MCTS,RL,RLHF,PPO,DPO,Reward Model经验加分
方向二:文生图,Stable difussion模型,ComfyUI等框架使用经验丰富
方向三:训练过语音大模型,会transformer,有Encoder,Decoder,Encodec,Helium,RVQ经验加分
工作职责:
1、负责多模态大模型的微调
2、探索并实现多模态大模型的模态对齐、高效训练、指令微调及性能评估等关键技术
1、全球知名高校硕士、博士学历,有扎实的数据结构和算法基础,有较强的实践能力
2、熟练掌握pytorch,transformer等LLM 领域相关工具,有bert,vision-transformer,llm实践经验;有强化学习、MCTS、RL、RLHF等经验
3、熟悉和实践深度学习算法(vision-transformer,LLAMA,GPT系列等),发表过顶级期刊或会议论文优先,如ICML、NIPS、ICCV、ECCV、CVPR、ACL、EMNLP、COLING等;有竞赛经验者优先。
4、有强烈的求知欲、好奇心和进取心,有快速学习新技术的能力