• 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责火山引擎-方舟大模型平台的研发,研究大模型在千行百业应用落地的系统化解决方案,大幅降低大模型应用的IT成本,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式; 2、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、模型训练、模型推理、数据管理、工作流编排等。 职位要求: 1、熟悉Linux平台下的分布式系统的开发及运维,有Golang/Python/C/C++/Java/Scala的开发经验,ACM/ICPC/Codeforces等获奖者优先; 2、能够从产品思维、机器性能和稳定性、团队协作等多种视角,高标准要求自己的技术方案和每一行代码; 3、对如下一个或多个领域有经验,或者无经验但有浓厚的兴趣(须额外付出自己的时间进行深入研究和探索): a. 机器学习应用:做过LLM/CV/NLP/语音/推荐/风控等机器学习领域的数据->训练->推理->应用的落地,或者相关支撑平台的研发; b. 大模型应用:数据集构造(对话、RLHF等)、高效微调(Lora/P-Tuning/RLHF)、推理部署、应用(Prompt工程、检索增强、LangChain等)、新模型探索(LLama/Falcon/miniGPT4); c. 云计算:Kubernetes应用开发(Operator等)、微服务网格和流量治理、云存储、技术商品化探索、Terraform等。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责火山引擎-方舟大模型平台的研发,研究大模型在千行百业应用落地的系统化解决方案,大幅降低大模型应用的IT成本,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式; 2、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、模型训练、模型推理、数据管理、工作流编排等。 职位要求: 1、熟悉Linux平台下的分布式系统的开发及运维,有Golang/Python/C/C++/Java/Scala的开发经验,ACM/ICPC/Codeforces等获奖者优先; 2、能够从产品思维、机器性能和稳定性、团队协作等多种视角,高标准要求自己的技术方案和每一行代码; 3、对如下一个或多个领域有经验,或者无经验但有浓厚的兴趣(须额外付出自己的时间进行深入研究和探索): a. 机器学习应用:做过LLM/CV/NLP/语音/推荐/风控等机器学习领域的数据->训练->推理->应用的落地,或者相关支撑平台的研发; b. 大模型应用:数据集构造(对话、RLHF等)、高效微调(Lora/P-Tuning/RLHF)、推理部署、应用(Prompt工程、检索增强、LangChain等)、新模型探索(LLama/Falcon/miniGPT4); c. 云计算:Kubernetes应用开发(Operator等)、微服务网格和流量治理、云存储、技术商品化探索、Terraform等。
  • 30k-60k 经验3-5年 / 硕士
    短视频 / 上市公司 / 2000人以上
    职位描述 1、从事语言大模型、多模态大模型等AI技术相关的技术研发; 2、从事相关AI技术的业务应用。 任职要求 1、在预训练、强化学习、LLM、多模态等至少其中一个领域有深厚的技术经验和洞察力; 2、对AI技术有强烈的兴趣,确信AI技术能够改变世界和造福人类; 3、在NLP、多模态、机器学习、深度学习等至少其中一个领域有**学术论文者优先。
  • 40k-70k·16薪 经验3-5年 / 本科
    科技金融 / 上市公司 / 2000人以上
    职位描述: 1.基于公司海量的保险销售对话数据,负责探索chatgpt相关算法研究; 2.负责公司在保险领域智能对话算法开发; 3. 跟踪与探索NLP业界前沿技术,具有快速复现及落地的能力。 职位要求: 1. 计算机、人工智能,自动化等相关专业本科及以上学历,985-211优先,NLP、大模型相关经验优先; 2. 熟悉机器学习/深度学习/自然语言处理/计算机视觉常用算法原理; 3.了解transformer,mask_attention机制,seq2seq相关模型,gpt,T5,unilm,beam_search解码算法 4. 熟悉Linux平台,熟悉Python语言及至少一种深度学习框架(如Tensorflow/Pytorch等,数据处理工具pandas,numpy,awk,sed)等。
  • 30k-50k·13薪 经验5-10年 / 硕士
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    我们需要您: 1.从事大模型(LLM)研究、训练、应用,包括但不限于训练任务优化、知识融入更新、模型性能提升等 2.跟进业界前沿的相关SOTA模型技术,保持技术先进性,应用到产品工程中 我们需要您具备: 1. 计算机、数学或统计学相关专业硕士及以上学历,算法理论与工程技术扎实,具有3年以上计算机NLP/CV/ML相关工作经验 2. 熟练使用pytorch/tensorflow/deepspeed等至少一种框架,能独立实现前沿模型,有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)优先; 3. 在NLP/LLM/多模态有深入算法研究与研发实践,有FT、预训练、可控内容生成方向经验者优先 4.懂业务,有良好沟通、分析解决问题和团队协作的能力;自我学习能力,保持对事物的好奇心。 加分项 (满足其一即可): 1. 熟悉主流开源大模型(GPT2/LLAMA/GLM等) 2. 有过大模型prompt learning、FT相关优化工作 3. 有过预训练大模型的相关工作 4. 有过DAU过百万产品的算法研发经验
  • 30k-50k·15薪 经验不限 / 硕士
    科技金融 / 上市公司 / 500-2000人
    职位描述: 1、深度参与金融大语言模型的模型训练、调优、系统评测和模型推理; 2、研发并落地金融领域的AI对话系统,帮助团队达成目标效果和应用落地 3、针对细分业务场景的数据处理、模型微调、prompt tuning等,以适应场景并达成业务目标; 4、参与设计金融大语言模型的应用方案设计。 职位要求: 1、硕士及以上学历,计算机、应用数学、统计学、通信、金融等相关专业;熟悉C++/Python,熟练使用Linux; 2、熟悉和实践过至少一种常用的深度学习框架,比如tensorflow, pytorch等; 3、理解CNN/Attention/Transformer等算法原理,了解LLaMA、GLM、GPT3等大规模模型,有实际动手经验; 4、拥有高性能计算或模型优化经验和兴趣 (CUDA/Triton/OpenMP); 5、有较强的动手能力和钻研精神,具备良好的沟通能力和团队协作能力。
  • 30k-50k 经验1-3年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 1.负责LLM强化学习链路整体优化,包括数据探索与增强、奖励模型优化、RL策略迭代及效果评估等,持续提升算法的效率与效果; 2.强化学习技术前瞻探索,包括但不限于离线强化学习、环境模型学习、约束强化学习等方向; 3.开展大语言模型在搜索、推荐、广告等业务场景中的应用并实现业务目标。 岗位基本需求 1.三年以上相关工作经验,具备搜索、推荐、广告等至少其一领域的算法优化和业务实践; 2.扎实的算法基础,熟悉强化学习、自然语言处理和机器学习技术,对技术开发及应用有热情; 3.具备RL算法优化和项目实践经验,熟悉DQN、TRPO、PPO、SAC、BCQ、MCQ、SUNRISE等强化学习算法,能够基于实际业务问题优化算法; 4.熟悉Python、Java等至少一种编程语言,具有良好的编程能力和扎实的数学理论基础; 5.熟悉Tensorflow、PyTorch等深度学习框架并有实际项目经验; 6.关注行业前沿进展,对技术开发及应用有热情,有自己的想法并乐于挑战自我; 7.良好的沟通能力和跨团队协作能力,能够梳理繁杂的工作并建立有效机制,推动上下游配合完成目标。 具备以下者优先 1.在ICML、KDD、SIGIR、WWW、ICLR等**会议或期刊上发表过论文者优先。获得过国际或国内赛事奖项者优先; 2.有大语言模型算法优化和大规模分布式RL框架优化经验优先。 岗位亮点 1. 能够接触到海量的用户数据,良好的技术氛围和技术牛人; 2. 能够触达丰富的业务,具备技术挑战,使用技术手段解决业务中的实际问题。
  • 30k-60k·16薪 经验不限 / 硕士
    社交 / 上市公司 / 2000人以上
    岗位职责: 1、构建金融领域的千亿规模预训练大语言模型,通过指令微调和RLHF提升模型效果; 2、针对业务场景进行模型设计和优化,提升场景应用效果,包括但不仅限于智能投顾、投研分析、内容审核等; 3、紧跟业界最新技术,攻克大语言模型关键技术难点; 岗位要求: 1、机器学习/自然语言处理/强化学习/人工智能/计算机等相关专业硕士及以上学历; 2、熟悉主流深度学习模型架构和算法,关注领域内的最新进展,有较强工程动手能力并能够跟进和实现新的算法(有transformers、LLM、NLP、强化学习方面经验者更佳); 3、有较强的学术比赛经验优先、有高质量论文发表者优先(如ACL、EMNLP、NeurIPS、ICML、ICLR、CVPR等); 4、具备激情、好学、良好的协作和沟通能力。
  • 30k-50k 经验1-3年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 负责AI大模型的评测与分析工作,与模型训练团队配合不断优化提升AI大模型效果。具体工作内容包括但不限于: 1. 深入理解大规模预训练语言模型,参与模型评测方案的制定与评测数据集的建设。 2. 通过对模型进行全方面细致的评测,明确模型能力边界,对模型能力进行深入分析,产出围绕大模型的客观认知,从而为模型训练迭代提供指导意见。 3. 追踪大模型方向前沿进展,积极主动地学习和探索新的评测及分析的方法和技术。 4. 与各相关部门保持良好沟通,深度参与大模型训练及应用,为各大模型相关方提供评测及相关的模型分析支持,共同推动大模型的训练与应用。 岗位基本需求 1. 硕士及以上学历,计算机、数学、统计学或相关专业; 2. 熟悉Java/Python/C++等编程语言,良好的编码习惯和一定的工程能力 3. 具有机器学习或深度学习算法的基础知识,熟练掌握自然语言处理或大模型相关算法和模型; 4. 良好的沟通能力、团队合作精神以及较强的问题解决能力。 5. 对每一行代码负责,对业务方负责,具备工匠精神。 具备以下者优先 1. 具备从事相关行业人工智能开发、算法研究等相关工作经验者优先; 2. 对ChatGPT等相关AI模型有深入了解或丰富的使用经验者优先; 岗位亮点 1. 紧跟人工智能行业进展,接触到前沿技术和行业趋势,磨练出对人工智能的独到见解; 2. 参与AI大模型的训练与评测的全流程,了解从理论到工程实践的全面技能; 3. 与一流的人工智能团队合作,快速成长,提升自身能力; 4. 有机会参与公司的创新项目,跨足不同领域,拓宽人工智能技术的应用范围;
  • 30k-60k·15薪 经验3-5年 / 硕士
    360
    信息安全 / 上市公司 / 2000人以上
    职责描述: 1. 优化大模型分布式训练速度; 2. 完善分布式训练框架,增加框架稳定性和扩展性 任职要求: 1. 学士及以上学历,计算机、电子、自动化等相关专业; 2. 熟悉Python,熟悉C/C++编程,编程能力优秀; 3. 熟练掌握TensorFlow/PyTorch等至少一种深度学习框架; 4. 熟练掌握TensorRT, XLA, TVM等深度学习编译器,能够基于这些编译器做二次开发或者加速应用; 5. 熟悉GPU等硬件架构,精通CUDA、cuDNN、NCCL,熟悉RDMA,Nvlink等互联技术; 6. 熟悉模型并行,数据并行,流水并行等分布式训练加速的基本原理; 7. 熟悉业界常见的分布式训练解决方案,例如Megatron, DeepSpeed等; 8. 有相关的项目背景优先。
  • 28k-45k·18薪 经验5-10年 / 不限
    科技金融 / 不需要融资 / 500-2000人
    职位描述: 负责落地并优化金融垂类基座大模型(智鹿),提升业务场景应用效果。结合金融行业特性和需求,提供精准、高效的语言处理的技术框架、解决方案,与团队紧密合作,支持业务的前端和后端需求,推动公司在金融领域大语言模型技术的创新与应用。 职位要求: 1、计算机科学/机器学习/人工智能/自然语言处理等相关专业,8年以上工作经验; 2、具备大语言模型实际落地经验,熟悉从模型开发到部署的全流程,能够快速将新技术应用到实际业务场景中,有金融垂类经验的优先; 3、熟悉LLM相关技术,精通主流深度学习模型架构和算法,对相关技术落地有自己的理解; 4、具有良好的沟通能力和团队协作精神,有较强的创新意识和能力,愿意推动大模型在金融垂直领域的技术迭代和业务发展。
  • 35k-45k 经验5-10年 / 硕士
    IT技术服务|咨询,信息安全,软件服务|咨询 / 不需要融资 / 2000人以上
    职位描述: 1、负责大模型算法全周期研发及配套关键技术研究优化,包括多模态模型训练,模型微调(如LoRA、P-Tuning)以及量化和分布式部署等; 2、负责大模型在垂直领域应用的设计划与落地,包括制定创新性的产品研发战略和组合方案,实现模型研发和能力优化,完成年度新产品研发重点任务和阶段研发目标,支撑公司在大模型领域的演进和提升。 3、管理NLP团队,致力于各类人才的培养和技术方向的规划,组织内部技术交流培训,提升团队建模研究和模型工程落地的技术能力。 4、面向大模型重要行业会议、技术研究成果汇报等场合,完成交流演讲汇报。 5、持续关注大模型领域的最新研究与应用趋势,并据此为公司提供具有前瞻性的技术指导和解决方案,引领公司大模型技术进步。 职位要求: 1、国际知名院校硕士及以上学历,博士优先。人工智能、数学、通信工程、电子信息工程等相关专业,8年以上相关工作经验,3年以上技术团队管理经验。 2、在大型科技公司(如谷歌、微软、亚马逊、百度、腾讯等)的人工智能部门工作,主持或作为核心技术骨干完成大模型项目的实施、调优和部署,具备完整垂直领域大模型研发和配套产品开发经验。 3、具有良好的大模型研发与落地相关技术能力,包括: 1) 精通Python、C/C++、Go等编程语言,熟练掌握PyTorch或TensorFlow等主流深度学习框架; 2) 精通NLP、AIGC、多模态、CV和语音等AI算法,对开源大模型项目(如BERT、GPT、T5、GLM、LLaMA等)有深入研究和实践经验; 3) 精通大模型3D/4D并行技术以及训练、微调技术,如LoRA、p-tuning、SFT、RLHF等; 4) 熟悉大模型的分布式系统和多GPU优化,具有跟踪和探索分布式优化新技术的能力,熟悉包括Kubeflow在内的AI平台; 5) 熟悉大模型分布式训练技术和框架库,如Megatron、DeepSpeed、Deepspeed-Chat等,熟悉框架库源码,有千卡以上集群的大模型训练经验 6) 精通大模型推理优化技术、模型压缩技术,如量化、剪枝和蒸馏等。 4、具有良好的形象气质、逻辑思维能力、沟通交流能力、演示汇报能力,具有较为丰富的演示汇报(包括汇报工作成果、宣读论文、技术交流等)经验,擅长演示汇报材料制作,能够有针对性、清晰且有条理地面向不同层次的听众表达思想观点、展示工作成果。 5、有领导跨学科团队的经验,具备良好的团队组织管理能力,应变能力和工作目标的执行能力,统筹规划设计能力,以及跨团队协作能力。
  • 25k-50k·15薪 经验5-10年 / 本科
    360
    信息安全 / 上市公司 / 2000人以上
    职位详情: 1、负责安全行业大模型应用工程技术落地,包括 Al Agent、Prompt 工程、RLHF研究和实现等; 2、负责制定相应的技术方案和规划,负责相关产品的服务设计/实现/运维,包括私有化和SaaS化实施部署; 3、负责核心技术问题的攻关,系统优化,解决产品线研发过程中的技术难题; 3、指导大模型产品研发工程师,参与项目、技术、代码评审。 职位要求 1、5年以上工作经验,有复杂系统的构建与整体维护能力,具备论文调研、开源项目快速搭建能力; 2、扎实的计算机基础知识,精通JAVA 、Go等语言编程,有复杂的微服务架构经验,具备良好的数据结构和算法基础; 3、熟悉云原生架构应用,需要有使用CNCF生态组件搭建多语言的系统架构经验。熟悉Linux系统、docker、容器隔离技术,有一定的系统定位能力; 4、有创业精神,抗压能力强,理解能力强。
  • 25k-50k 经验5-10年 / 本科
    电商,社交 / A轮 / 50-150人
    主要职责: 1、评估和研究使用大模型技术,例如GPT-4、BERT等来解决实际业务问题,提供解决方案并进行应用实现; 2、研发和优化大模型的训练并实施私有化部署,提升模型稳定性和性能; 3、分析模型的性能,识别改进点,针对特定场景进行调优,并编写技术文档,记录调优过程和结果,为团队成员提供指导; 4、参与开源大模型的开发和维护工作,提高模型的普遍性和适用性; 5、跟踪AI技术发展趋势,应用大模型领域的最新研究成果,进行技术的创新和优化; 6、与团队紧密合作,保证大模型技术的顺利实施和应用。 任职要求: 1、计算机科学、数学、统计学或相关领域的本科及以上学位。 2、至少3年的机器学习或深度学习模型调优工作经验。 3、熟练掌握至少一种深度学习框架,如TensorFlow, PyTorch, Keras等。 4、对模型微调、迁移学习和其他调优技术有实际操作经验。 5、有在私有化环境中部署AI模型的经验,熟悉Docker等容器化技术。 6、熟练使用Python等至少一种编程语言,并具备良好的算法和数据结构基础。 7、具备出色的分析能力和问题解决能力。 8、良好的沟通能力和团队合作精神。 9、能够独立管理项目,并在快节奏环境下优先处理多个任务。
  • 15k-30k 经验1-3年 / 硕士
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    岗位职责: 1. 负责通信网络与大语言模型结合的研发设计与管理; 2. 负责面向通信网络的大语言模型Prompt Engineering提示工程,大语言模型微调和基于langchain的通信网络认知增强工具研发; 3. 负责面向通信网络的AI算法研发框架设计与开发; 4. 负责面向通信网络的AI算法模块开发管理,根据行业需求指导算法模型的技术选型和性能优化,算法模型包括结构化数据的预测分析和异常检测、因果关系分析、自然语言处理、深度学习、强化学习等。 岗位要求: 1. 计算机科学、机器学习、人工智能相关专业硕士及以上学历,具有AI产品研发和应用工作经验优先; 2. 熟悉LLM大模型基本原理及应用、langchain框架及应用,有GPT大模型研发经验者优先。 3. 深入掌握机器学习和深度学习,了解TensorFlow/pytorch/keras等深度学习框架; 4. 熟练掌握至少2种语言:Python, R, Matlab, SQL, Scala, Spark, PHP, SAS,Weka等; 5. 有良好的沟通表达能力,积极向上,细致认真。