职位要求
1.负责大语言模型方面的算法开发、优化、应用落地。负责相应AI解决方案设计,参与关键技术研发,攻关技术难点;
2.负责设计和实现大语言模型相关的算法和模型实现,研究并设计新是算法和模型,解决大语言模型应用问题;
3.负责开发和优化大语言模型的训练过程,设计并实现大语言模型的训练算法和策略,配置和优化训练的超参数和计算资源,保证模型的训练效果和效率;
4.负责构建和管理大规模医疗文本数据集,用于模型预训练和微调,完成不用场景下的下游任务;
5.负责进行大语言模型的评估和验证,设计评估指标和实验;设计和实施评估指标和实验,对训练好的大语言模型进行性能评估和分析。识别模型的弱点和改进空间,提出相应的改进策略和方法;
6.参与高校、科研、医疗机构科研合作,协助科研成果落地转化。
1.具有机器学习、自然语言处理、医学影像分析,或相关领域的学习和研究经验;
2.有预训练大语言模型或GPT模型等相关研究开发经验者优先;
3.在机器学习(ICML,NeurIPS、ICLR等)、计算机视觉(CVPR、ICCV、ECCV等)、自然语言处理(ACL,EMNLP等)和医疗影像分析(MICCAI、IPMI)等顶级会议,或者顶级期刊(IEEE T-PAMI, IEEE TMI、Medical Image Analysis)发表过相关论文;
4.具有人工智能相关专业(计算机视觉、机器学习、医疗图像分析等)硕士及以上学位;
5.能熟练使用英语。