职位要求
岗位职责
1针对大语言模型LLM的微调涵盖全参数微调以及LoRA/QLoRA等参数高效微调技术
2负责模型评估与测试并构建自动化测试流程优化训练流程利用DeepSpeedFSDP等分布式训练技术提高训练效率
3研究最新的对齐技术DPORLAIF以优化模型的交互体验和响应质量
4开展对比实验分析不同模型架构数据规模优化策略的影响并制定相应的优化方案
5参与MLOps工作支持模型部署推理优化如INT4/INT8量化服务化FastAPI/Triton
岗位要求
1计算机科学人工智能机器学习等相关专业硕士及以上学历应届生亦可
2熟练掌握深度学习框架PyTorchTensorFlow熟悉Transformers库Hugging Face
3具备大模型微调经验了解LoRA/QLoRAPrefix TuningP-Tuning等参数高效微调方法
4熟悉数据标注数据清洗等数据处理技术掌握NLP数据增强方法
5掌握常见的LLM 评测方法包括人工评测GPT-4评分自动评测BLEUROUGE等
6熟悉分布式训练了解DeepSpeedFSDPMegatron等技术
7具备工程思维能编写高效的数据处理训练测试代码并优化计算资源