• 25k-50k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责大模型平台的基础设施搭建和持续集成; 2、负责大模型平台管控面和数据面的上线和日常运维; 3、从运维视角研发各类工具,命令行,脚本等,配合完成模型和数据的持续部署能力; 4、运维监控数据抓取,收集,运维大盘建设; 5、大模型平台的长期稳定性建设。 职位要求: 1、3年以上K8S云原生平台的相关系统运维开发和稳定性建设经验; 2、2年以上公有云的相关的运维开发,有丰富的云上基础设施运维和构建经验; 3、 熟练掌握Python/Golang/Shell中的一种语言; 4、有大中型互联网服务运维经验者优先; 5、有IaC(基础设施即代码)相关的terraform/pulumi/crossplane经验者优先。
  • 短视频 / 上市公司 / 2000人以上
    职位描述 1、负责快手一站式机器学习平台的设计研发与迭代改进,为业务提供稳定易用、高性能、高性价比的AI中台解决方案; 2、业内机器学习系统与平台前沿技术进展跟进与调研、落地; 3、参与模型训练,模型服务,模型管理,资源调度等机器学习相关问题的开发。 任职要求 1、计算机基础知识与编程基本功扎实,熟悉Go/Python/C++至少一种; 2、参与过大规模分布式系统的开发和维护; 3、良好的沟通能力和团队协作精神,严谨的工作态度与高质量意识 ; 4、善于学习新的知识,动手能力强,有进取心。 加分项: 1、了解行业内典型的调度系统架构、混部系统架构,了解优缺点; 2、了解分布式系统、调度、容器相关领域技术,熟悉Kubernetes/docker/Yarn等原理与实现,有Yarn/K8s二次研发经验优先; 3、熟悉计算机体系结构和Linux操作系统,了解 GPU 架构、Cuda编程; 4、优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情; 5、对机器学习系统(Tensorflow/Pytorch/Jax)和算法(transformer/bert)有认识/经验者优先。
  • 25k-50k·15薪 经验3-5年 / 本科
    信息安全,企业服务 / 上市公司 / 2000人以上
    岗位职责: 1.负责制定大模型产品的模型效果评测方案,对微调模型的训练/推理效果、RAG知识检索增强的生成效果设计评估方法和自动化工具,保障大模型的推理效果准确性 2.通过相关工具提高模型评测的效率和覆盖率,分析和评估模型测试结果,发现模型潜在的缺陷、漏洞和性问题 3.持续关注行业的最新测试技术和方法,不断优化测试流程和工具,提高测试效率和质量 任职要求: 1.本科及以上学历,有大模型算法测试经验 2.具备扎实的Pyhon/Shell等编程基础,熟练使用linux系统 3.深入理解机器学习、深度学习相关算法评估方法,熟悉自然语言大模型LLM 训练完模型推理效果测试方法和工具 4.熟悉k8s,有云原生相关项目测试工具开发经验者、大模型评测系统自动化和大模型性能测试经验者优先 5.拥有技术激情和创新意识,快速学习能力,表达能力优秀,乐观向上
  • 35k-60k·16薪 经验3-5年 / 硕士
    居住服务 / 上市公司 / 2000人以上
    工作职责: 1. 负责贝壳核心房产业务AI能力建设,利用AIGC相关能力推进业务智能化重塑; 2. 深入业务调研熟悉需求场景,参与和业务、产品、工程研发等横向交流学习; 3. 保持对业务的学习能力和持续热情,能探索调研业务实际场景痛点; 4. 结合业务需求,从Prompt优化,模型finetune等方面优化AI模型效果,解决面向业务场景的应用落地问题; 任职资格: 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2.熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架,掌握大语言模型SFT/LoRA/RLHF等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀;有NLP顶会论文或国际NLP比赛奖项者优先;
  • 16k-32k 经验5-10年 / 本科
    金融 / 不需要融资 / 2000人以上
    岗位职责: 1.针对大数据金融交易相关的to c业务,负责金融交易相关数据建设、数据分析和模型搭建工作; 2.推动数据、算法在客户经营各环节(如客户活跃、消费提升)的应用,为客户经营提供智能化基础; 3.通过数据、算法检测客户经营健康度,针对异常点开展专项深度分析,并为业务策略的制定和调整提供决策建议。 任职要求: 1.大学本科及以上学历,具备一定的数学基础,掌握基本的机器学习算法(如逻辑回归、svm、决策树); 2.熟悉使用python、pandas、sklearn等,能完成机器学习/深度学习的数据分析和建模,如会使用pyspark更佳; 3.具备数据分析落地或模型落地的相关经验; 4、具备较强的自我驱动力和专研精神,具备较好的团队协作能力。
  • 30k-60k·15薪 经验3-5年 / 硕士
    360
    信息安全 / 上市公司 / 2000人以上
    职责描述: 1. 优化大模型分布式训练速度; 2. 完善分布式训练框架,增加框架稳定性和扩展性 任职要求: 1. 学士及以上学历,计算机、电子、自动化等相关专业; 2. 熟悉Python,熟悉C/C++编程,编程能力优秀; 3. 熟练掌握TensorFlow/PyTorch等至少一种深度学习框架; 4. 熟练掌握TensorRT, XLA, TVM等深度学习编译器,能够基于这些编译器做二次开发或者加速应用; 5. 熟悉GPU等硬件架构,精通CUDA、cuDNN、NCCL,熟悉RDMA,Nvlink等互联技术; 6. 熟悉模型并行,数据并行,流水并行等分布式训练加速的基本原理; 7. 熟悉业界常见的分布式训练解决方案,例如Megatron, DeepSpeed等; 8. 有相关的项目背景优先。
  • 20k-35k·15薪 经验3-5年 / 本科
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    岗位职责: 1,负责大模型金融产品的需求调研,产品设计,规划和实际落地; 2,关注同行业竞品业务发展状况,挖掘核心需求; 3,与算法部门深度合作,进行算法与产品的联合优化; 4,结合公司战略,洞察行业生态、技术路线演进,思考和挖掘深层需求。 任职要求: 1,本科及以上学历,金融或计算机工程相关专业 2,3-5年金融业务分析师从业背景或金融软件产品背景优先; 3,充分理解金融软件产品设计细节,思路清晰,能够将需求提炼形成的可落地的产品文档; 4,较强的跨团队沟通协调能力; 5,热爱AI,愿意接受有挑战性的工作,有很强的owner意识,能主动推动项目向前。
  • 6k-8k 经验1年以下 / 博士
    消费生活 / 上市公司 / 2000人以上
    岗位职责: 1. 参与跨模态大模型在自动驾驶产业中的落地,如:自驾场景下的大模型领域微调、端到端自动驾驶建模,以及开放场景下的目标检测/识别技术等; 2. 参与模型的封装、加速推理和性能优化; 3. 参与论文发表或专利申请等相关工作。 岗位基本要求: 1. 计算机科学、人工智能领域的在读硕士/博士研究生,具有扎实的深度学习与计算机视觉基础; 2. 具有优秀的编程能力,熟悉PyTorch、Tensorflow等深度学习框架,能够利用或复现模型,进行模型训练和测试; 3. 熟悉主流大模型(如CLIP、GLIP、GPT-4V等)的原理、性能表现及其差异,具备大模型相关经验者优先; 4. 具备一定的科研能力,能够承担科研推进工作,发表过人工智能领域会议或期刊者优先; 5. 实习时间超过 6 个月。
  • 30k-60k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、调研、落地业界成熟容器安全解决方案,对机器学习平台、模型和数据进行安全增强; 2、云原生(微服务、Service Mesh、容器技术、容器编排技术)安全研究及转化落地。 职位要求: 1、本科/硕士及以上学历,计算机、信息安全等相关专业; 2、熟悉docker、kubernetes等云原生技术及其原理,熟悉相关主流的安全实践,有过容器安全产品开发/机密计算经验者优先; 3、乐于挑战没有明显答案的问题,快速理解业务场景,从具体问题中抽象出通用的解决方案; 4、对机器学习系统(Tensorflow/Pytorch)安全增强有经验者优先。
  • 30k-60k·16薪 经验不限 / 硕士
    社交 / 上市公司 / 2000人以上
    岗位职责: 1、构建金融领域的千亿规模预训练大语言模型,通过指令微调和RLHF提升模型效果; 2、针对业务场景进行模型设计和优化,提升场景应用效果,包括但不仅限于智能投顾、投研分析、内容审核等; 3、紧跟业界最新技术,攻克大语言模型关键技术难点; 岗位要求: 1、机器学习/自然语言处理/强化学习/人工智能/计算机等相关专业硕士及以上学历; 2、熟悉主流深度学习模型架构和算法,关注领域内的最新进展,有较强工程动手能力并能够跟进和实现新的算法(有transformers、LLM、NLP、强化学习方面经验者更佳); 3、有较强的学术比赛经验优先、有高质量论文发表者优先(如ACL、EMNLP、NeurIPS、ICML、ICLR、CVPR等); 4、具备激情、好学、良好的协作和沟通能力。
  • 移动互联网,文娱丨内容 / 上市公司 / 2000人以上
    工作职责: 负责B站机器学习平台相关的架构设计和研发工作,服务于B站个性化视频推荐&搜索、AIGC/大模型创新业务、内容理解、视频机审等核心业务场景。 1.负责大规模分布式训练,推理框架,业务逻辑的系统设计和实现; 2.负责AIGC/大模型等创新业务的设计&研发和创新迭代; 3.负责机器学习相关平台能力、服务调度、业务组件&功能开发&部署等; 4.负责CV/NLP/Speech/RL模型算法与系统实现的联合优化; 5.深入业务的流程,制定应用机器学习/深度学习技术的系统优化方案 工作要求: 任职要求 1.有丰富的python/C++/golang代码开发经验,具备扎实的数据结构和算法功底以及优秀的编码能力; 2.具备服务端大型分布式系统研发经验,对解决具有挑战性问题充满激情,快速定位分析系统异常和解决问题的能力; 3.较强的责任心、良好的沟通能力和团队合作精神。 具备以下一项或多项加分: a.了解机器学习,有过机器学习平台相关研发经验,有算法应用、特征工程或训练平台等方面的实践; b.大型分布式系统的演进、异常定位与发现、资源优化等有相关经验; c.大型互联网公司主持或参与过搜广推,内容理解等的核心系统研发工作; d.B站用户,熟悉B站内容与社区文化。
  • 软件服务|咨询,IT技术服务|咨询,网络通信 / 不需要融资 / 2000人以上
    工作职责: 1. 负责垂类大模型的训练和微调,推动大模型的业务落地。 2. 根据业务场景需求,输出包括数据标注、训练和微调、效果验证在内的技术方案,并参与算法优化。 3. 跟进NLP领域前沿进展,并应用到大模型融合智能客服、大模型挂载知识问答、大模型知识挖掘、ChatBI等方向的算法研发中。 任职资格: 1. 硕士及以上学位,三年及以上NLP经验。 2. 对大模型/深度学习/搜索推荐/智能客服/数据挖掘相关领域有深入的了解或从业经验。 3. 能积极探索技术前沿,熟悉大模型RAG、长文外推、Agent、信息抽取等相关技术并有落地经验。 4. 良好的编程技能,精通至少一种相关框架,如PyTorch/TensorFlow/DeepSpeed/Megatron等。 5. 有良好的沟通能力,强烈的责任心。
  • 30k-50k·13薪 经验5-10年 / 硕士
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    我们需要您: 1.从事大模型(LLM)研究、训练、应用,包括但不限于训练任务优化、知识融入更新、模型性能提升等 2.跟进业界前沿的相关SOTA模型技术,保持技术先进性,应用到产品工程中 我们需要您具备: 1. 计算机、数学或统计学相关专业硕士及以上学历,算法理论与工程技术扎实,具有3年以上计算机NLP/CV/ML相关工作经验 2. 熟练使用pytorch/tensorflow/deepspeed等至少一种框架,能独立实现前沿模型,有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)优先; 3. 在NLP/LLM/多模态有深入算法研究与研发实践,有FT、预训练、可控内容生成方向经验者优先 4.懂业务,有良好沟通、分析解决问题和团队协作的能力;自我学习能力,保持对事物的好奇心。 加分项 (满足其一即可): 1. 熟悉主流开源大模型(GPT2/LLAMA/GLM等) 2. 有过大模型prompt learning、FT相关优化工作 3. 有过预训练大模型的相关工作 4. 有过DAU过百万产品的算法研发经验
  • 35k-45k 经验5-10年 / 硕士
    IT技术服务|咨询,信息安全,软件服务|咨询 / 不需要融资 / 2000人以上
    职位描述: 1、负责大模型算法全周期研发及配套关键技术研究优化,包括多模态模型训练,模型微调(如LoRA、P-Tuning)以及量化和分布式部署等; 2、负责大模型在垂直领域应用的设计划与落地,包括制定创新性的产品研发战略和组合方案,实现模型研发和能力优化,完成年度新产品研发重点任务和阶段研发目标,支撑公司在大模型领域的演进和提升。 3、管理NLP团队,致力于各类人才的培养和技术方向的规划,组织内部技术交流培训,提升团队建模研究和模型工程落地的技术能力。 4、面向大模型重要行业会议、技术研究成果汇报等场合,完成交流演讲汇报。 5、持续关注大模型领域的最新研究与应用趋势,并据此为公司提供具有前瞻性的技术指导和解决方案,引领公司大模型技术进步。 职位要求: 1、国际知名院校硕士及以上学历,博士优先。人工智能、数学、通信工程、电子信息工程等相关专业,8年以上相关工作经验,3年以上技术团队管理经验。 2、在大型科技公司(如谷歌、微软、亚马逊、百度、腾讯等)的人工智能部门工作,主持或作为核心技术骨干完成大模型项目的实施、调优和部署,具备完整垂直领域大模型研发和配套产品开发经验。 3、具有良好的大模型研发与落地相关技术能力,包括: 1) 精通Python、C/C++、Go等编程语言,熟练掌握PyTorch或TensorFlow等主流深度学习框架; 2) 精通NLP、AIGC、多模态、CV和语音等AI算法,对开源大模型项目(如BERT、GPT、T5、GLM、LLaMA等)有深入研究和实践经验; 3) 精通大模型3D/4D并行技术以及训练、微调技术,如LoRA、p-tuning、SFT、RLHF等; 4) 熟悉大模型的分布式系统和多GPU优化,具有跟踪和探索分布式优化新技术的能力,熟悉包括Kubeflow在内的AI平台; 5) 熟悉大模型分布式训练技术和框架库,如Megatron、DeepSpeed、Deepspeed-Chat等,熟悉框架库源码,有千卡以上集群的大模型训练经验 6) 精通大模型推理优化技术、模型压缩技术,如量化、剪枝和蒸馏等。 4、具有良好的形象气质、逻辑思维能力、沟通交流能力、演示汇报能力,具有较为丰富的演示汇报(包括汇报工作成果、宣读论文、技术交流等)经验,擅长演示汇报材料制作,能够有针对性、清晰且有条理地面向不同层次的听众表达思想观点、展示工作成果。 5、有领导跨学科团队的经验,具备良好的团队组织管理能力,应变能力和工作目标的执行能力,统筹规划设计能力,以及跨团队协作能力。
  • 30k-50k·15薪 经验3-5年 / 本科
    移动互联网,文娱丨内容 / 上市公司 / 2000人以上
    工作职责: 1、大语言模型基础能力调研:包含不限于预训练,对齐(sft/rlhf),agent,多模态 2、大语言模型业务方向落地:包含不限于搜索对话,推荐内容理解,内容审查,社区治理,虚拟人 工作要求: 1、扎实的计算机科学基础,良好的代码能力 2、机器学习或相关领域科研背景和相关工作经历 3、良好的业务思维 加分项 a. acm/oi奖项 b.相关领域发表 c.了解b站,对于b站的视频、弹幕、评论等文化有一定理解