大模型训练
职位描述:
1、利用NLP技术在大量文本中进行数据挖掘及文本处理,包括文本相关性模型、命名实体识别等
2、承担预训练模型的训练、开发和调优工作,包括但不限于:prompt设计、大模型finetuning、大模型训练
3、紧跟前沿NLP生成技术,解决实际应用场景中的内容生成问题
4、负责对话系统平台搭建和研发工作
职位要求:
1、计算机相关专业硕士、博士或者优秀本科
2、熟练掌握Python / C++ / Java中至少一门语言,熟练掌握tensorflow / pytorch / keras等深度学习框架
3、熟悉BERT系列以及GPT系列等预训练模型,熟悉Transformer等深度学习模型,熟悉主流文本生成的原理和方法,有结合业务的落地经验者优先
4、过往有参与过大型对话系统、大模型训练和部署经验者优先
5、有ACL、EMNLP、ICLR等会议论文发表者优先
6、良好的自驱力,较强的团队合作精神
拉勾安全提示