大模型数据研发25k-50k

杭州经验3-5年本科及以上大数据开发工程师
岗位所属职位类型
全职

  • 大数据开发经验
  • 大模型
  • 数据研发
  • 数据挖掘
蚂蚁集团
分享到微信
微信扫一扫,用小程序打开分享
职位诱惑:

大模型

职位描述:

岗位职责
为大模型应用和智能化业务提供高质量数据集
1. 在安全领域包含内容认知、流媒体、智能审标、智能凭证等场景,参与建设高质量、多样性的数据,通过数据采集、AIGC生成等技术手段不断提高数据规模

2. 深入了解数据内容,分析数据的特征,持续优化数据低质过滤、去重和增强等能力,提升数据的质量

3. 制定严格的数据质量标准,对数据进行分析和分类,评估数据质量,解决数据主题分布、内容合规、反毒性、反偏见等问题

4. 构建Data-Centric AI数据闭环,探索在固定模型和评测情况下提高数据质量的路径,包括持续优化数据质量,复现大模型数据相关论文,研究数据和模型的Scaling Law、研究数据配比、数据混入策略与混入时机

5. 围绕更具体细分类数据(如内容检测、图像理解、视频理解等)构建相应大模型的数据-训练-评测链条,并针对细分类数据建立质量评估与优化体系,促进细分类数据质量提升。

岗位要求
1. 本科学历及以上,3年及以上工作经验,人工智能、机器学习、模式识别、统计学相关专业优先

2. 较为丰富的大数据研发经验,有PB级别数据处理经验;熟悉Spark/ODPS/Ray等大数据分布式平台

3. 熟悉数据挖掘、人工智能、多模态领域的相关研究工作和实践经验,拥有发表顶会论文、大模型研究工作、知名竞赛获奖、研究机构或一线互联网工作经验者优先

4. 熟练使用Python、Pytorch和CUDA等语言及工具,具备快速阅读和复现论文的能力,能够系统性对比研究领域的相关成果,并制定改进计划

5. 具备优秀的数据分析和解决问题能力,良好的团队合作精神及沟通意识

6. 具备良好的学习能力和主动性,能够跟进领域内最新技术研究成果,并结合应用场景快速实验和调优

工作地址

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    问的比较深入有确实是自己没有准备好,有些问题明明知道回答不好
    (235)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    面试官很专业,也提了不少有益的意见。 不过就是等待的过程心慌,不知道结果如何
    (0)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    面试效率高
    [面试过程]
    面试体验很好,面试官针对我个人作品中的设计点提问精准,同时也给予了相应点评指导,整个过程很高效,体验很棒,期待后续。
    (0)
支付宝(杭州)信息技术有限公司

蚂蚁集团

相似职位