• 25k-35k·14薪 经验1-3年 / 硕士
    移动互联网,广告营销 / 上市公司 / 2000人以上
    岗位职责: 1、参与媒体专业领域大语言模型的研究、构建与迭代,负责预训练和对齐阶段特定算法模块的建设工作; 2、逐步加深和丰富基座大模型的智能体能力,为智能体应用建设沉淀技术与经验; 3、负责RAG、Agent等通用应用流程框架设计实现和策略制定; 4、探索大模型能力在业务流程中的提效应用和面向C端用户的产品能力输出。 岗位要求: 1、硕士及以上学历,计算机、智能科学、数学专业方向出身; 2、具备非常扎实的算法功底,熟练掌握NLP的常用技术手段,有工业界内容理解和生成成熟实战经验; 3、拥有大规模语言模型的预训练和微调经验,熟练掌握常见开源模型的底层设计原理; 4、对于Dense架构和MoE架构大模型的设计实现细节有充分掌握,并有一定的实际操作经验; 5、良好的逻辑思维能力和数据敏感度,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
  • 20k-40k 经验1-3年 / 本科
    智能硬件,电商平台 / 上市公司 / 2000人以上
    职位描述: 1. 负责以大语言模型 (LLM)、视觉语言模型 (VLM) 为核心的复杂场景理解和泛化技术。 2. 负责研究和设计以语言-动作大模型 (VLA) 在自动驾驶领域的落地,包括但不限于模型的结构、训练技术探索; 3. 负责研究基于自监督技术的自驾大模型,有效利用海量数据。 职位要求: 1. 对大模型算法研究和应用经验丰富,包括但不限于大模型的训练数据构造、模型训练、性能调优等; 2. 对大模型在自动驾驶领域有应用经验优先,包括但不限于利用大模型进行行为场景理解和规划的落地实施; 加分项 1、有计算机视觉或机器学习相关研究经验,有高水平论文发表; 2、参加kaggle或知名会议上举办的相关比赛取得优异成绩; 3、ACM/ICPC、CCPC、NOI、IOI等计算机/信息学竞赛获奖经历。
  • 25k-50k 经验1年以下 / 硕士
    消费生活 / 上市公司 / 2000人以上
    美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 负责围绕AI大模型算法的认知分析的研究工作,具体工作内容包括但不限于: 1. 深入理解大规模语言模型的模型结构、训练过程以及评测方式,根据模型的训练过程以及评测结果,对大语言模型存在的问题进行研究。 2. 深入分析模型评测结果中不符合认知的异常,根据具体的异常制定完善的研究策略,通过对比、归纳等方法,产出研究分析结论,指导模型训练优化。 3. 构建Data-Centric的数据-训练-评测闭环,探索研究包括但不限于下列方向:大模型数据、模型的Scaling Law,研究数据配比、加入方式与时机等对模型效果的影响。 4. 追踪大模型方向的前沿进展,积极主动地学习和探索新数据分析、模型训练以及模型评测方法。 5. 与各相关部门保持良好沟通,深度参与大模型预训练、SFT、RLHF和评测等阶段,共同推动大模型持续优化。 岗位基本需求 1. 硕士及以上学历,计算机、数学、统计学或相关专业; 2. 熟悉Java/Python/C++等编程语言,良好的编码习惯和一定的工程能力 3. 具有机器学习或深度学习算法的基础知识,熟练掌握自然语言处理、多模态或大模型相关算法和模型; 4. 良好的沟通能力、团队合作精神以及较强的问题解决能力。 5. 对每一行代码负责,对业务方负责,具备工匠精神。 具备以下者优先 1. 在计算机领域顶会(如ACL、EMNLP、NeurIPS、AAAI等)上以一作发表过论文者优先; 2. 具备从事相关行业人工智能开发、算法研究等相关工作经验者优先; 3. 对ChatGPT等相关大模型有深入了解或丰富的使用经验者优先; 岗位亮点 1. 紧跟人工智能行业进展,接触到前沿技术和行业趋势,磨练出对人工智能的独到见解; 2. 参与AI大模型的训练与评测的全流程,了解从理论到工程实践的全面技能; 3. 与一流的人工智能团队合作,快速成长,提升自身能力; 4. 有机会参与公司的创新项目,跨足不同领域,拓宽人工智能技术的应用范围;
  • 25k-50k 经验1-3年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 1、负责参与 Scaling law、MoE、RLHF 、Long context 、RAG 等方向的研究。 2、负责参与训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 岗位基本需求 1、3+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 1、有训练过多模态 generat ive models 的经验。 2、在设计、训练机器学习模型(尤其是LLM)方面有深刻的理解。 3、具备数学或者物理背景。 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源
  • 20k-40k 经验3-5年 / 硕士
    其他 / 不需要融资 / 50-150人
    为加强中心的技术研发能力,现诚邀有志于人工智能、大模型算法研究的优秀人才加入我们的团队。 一、工作内容 1.负责中心AI平台建设与维护,设计和开发,提供模型训练、评估、部署和管理的全流程服务。 2.负责大规模语言模型的数据工程、预训练等算法研究,提升模型在业务场景下的各项效率和质量。 3.负责数据清洗、标准化、增强等预处理,以提高模型训练的效果。 4.负责分布式训练,利用多GPU、多节点进行模型训练,提高训练效率。 5.负责大模型微调,包括prompt设计、SFT、RW、RLHF、可控内容生成等大模型优化策略。 6.负责开发和维护支持AI开发的工具和框架,提高开发效率和质量。 7.负责开发和维护AI系统与其他业务系统的接口,实现数据和功能的无缝集成。 8.跟踪国内外大模型算法的最新进展,撰写技术文档和研究报告。 9.与产品团队合作,将算法成果应用于实际产品,解决实际问题。 10.领导交办的其他工作。 二、岗位基本要求 1.硕士研究生及以上学历,计算机科学、模式识别、人工智能、数据科学或相关专业背景。 2.5年以上工作经验,且在人工智能、机器学习或大数据处理相关领域有3年以上的工作经验。 3.专业能力 1) 熟练掌握Python,Go等编程语言,能够编写高效、可维护的代码。 2) 熟悉常见的深度学习框架,如TensorFlow、PVTorch、Keras等,有独立训练与优化开源大模型的经验。 3) 深入理解各类机器学习算法,包括监督学习、无监督学习和强化学习等,能够应用于实际问题中。 4) 熟悉数据处理工具和技术,如Pandas、NumPy、SQL等,能够进行数据清洗、特征工程和数据分析。 5)熟悉大数据处理框架(如Hadoop、Spark)和分布式存储系统,有效管理和处理大规模数据集。 具备以下者优先: 1.在CCF-A会议(如NeurIPS、ICML、CVPR等)有发表论文者优先。 2.对技术充满热情且具有钻研精神,具有极强的快速学习能力,研究过优秀开源软件的源码并掌握原理者优先。 3.有较强的逻辑思维能力,善于分析、归纳、解决问题,持续学习和总结者优先。 4.良好的沟通和表达能力,善于与他人合作,良好的团队合作意识。 5.具备较强的开拓创新能力,工作积极主动、敢于担当、勤奋好学。 7.具备解决实际问题的能力,能够将研究成果应用于实际项目中。 附加信息: 1.用工形式:劳务派遣,由中心用工(用工稳定)。 2.候选人加分项:具备政府采购相关经验者、了解过政府采购及国家法律法规者。 工资水平: 20k-40k,以面谈为准。
  • 9k-15k 经验1年以下 / 硕士
    金融 / 上市公司 / 2000人以上
    工作职责 1. 负责图像识别相关算法的研发、测试、训练、模型转换,以及相关的数据清洗、标注方案的确定等工作; 2. 与开发人员配合确定算法工程化方案; 3. 对算法的精度、速度、普适性等进行优化; 4. 追踪学术前沿,引进最新算法模型及训练方法等; 5. 基于工作成果发表论文,提交专利; 6. 上级交与的其他工作任务。 任职要求 1. 计算机、数学或相关专业研究生以上学历; 2. 1年以上图像识别及深度学习相关算法研发经验,有学术论文发表经验优先,有图像领域比赛获奖经历优先; 3. 熟悉Python或C++语言; 4. 熟悉PyTorch、Tensorflow、MXNet等深度学习平台,有实际的模型训练经验; 5. 对人工智能有强烈的兴趣,对算法有自己的理解; 6. 能够承受较大的工作压力; 7. 有较好的沟通能力。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、开发自然科学的基础大模型,用于蛋白质结构预测、分子构象生成和蛋白质设计; 2、利用公共基准和数据库评估新的AI/ML方法; 3、与多学科团队密切合作,将创新算法应用于解决前沿挑战。 职位要求: 1、具有计算机科学、电气计算机工程或相关领域的博士或者硕士学位; 2、在AI和机器学习方面拥有很强的研究经验,在国际顶会(例如ICML,NeurIPS,ICLR)和期刊上发表过论文,涵盖大语言模型,扩散模型,几何深度学习,自然语言处理,蛋白质设计,蛋白质结构和构象预测等领域; 3、精通Python和Pytorch。
  • 28k-38k 经验3-5年 / 硕士
    金融 / 不需要融资 / 50-150人
    岗位职责: 负责设计⼤语⾔模型的技术⽅案并落地到⾏业客户的垂直场景中。典型场景包括但不限于多轮对话、 Document QA、结构化信息抽取、私有函数调⽤、AIAgent等等; 负责⼤语⾔模型技术⽅案的端到端研发,包括但不限于⽅案设计、数据准备及处理、⾏业模型训练、指令精 调、模型性能提升、模型效果评测等; 跟踪并分析业内最新研究成果和技术动态,持续优化和改进现有模型和技术⽅案;基于NLP⼤模型探索下⼀ 代语义技术,构建⾏业领先的多模态语义核⼼能⼒; 根据业务需求,与外部团队开展技术交流与沟通; 岗位要求: 计算机相关专业硕⼟及以上学历,有论⽂复现能⼒和算法⼯程交付经验; 精熟练掌握C++、Python等编程语⾔的⼀种或多种,具备良好的编码能⼒,有⼤型⼯程项⽬经验; 熟悉多种⾃然语⾔处理任务,如问答系统,序列标注,情感分析,摘要⽣成及抽取,知识图谱等。有从0到1 构建的⾃然语⾔处理任务的⼯程经验; 了解NLP主流预训练语⾔模型2(GPT/LLaMA/GLM/Bloom/BERT/Qwen),熟练掌握主流深度学习框架 Pytorch; 有团队意识,有良好的⽂档习惯和合作意识; 加分项: 有⼤模型训练框架Deepspeed/ColossalAl/LLaMA Factory使⽤经验者优先; 有垂直领域⼤模型PT、Continue PT、SFT、RLHF经验者优先;
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:产品覆盖今日头条、头条极速版等各类产品,为上亿用户持续提供优质的资讯、视频等服务。我们通过建立良好的内容生态,鼓励优质的原创内容,为创作者提供优质的服务和创作体验,促进创作和交流,同时我们致力于通过尽可能丰富的内容体裁和尽可能多的分发方式,连接人与信息,丰富大家的精神生活,让人们看到更大的世界。 1、参与基础大语言模型应用研发; 2、推进大模型AI能力在头条热点、AIGC等业务场景的快速落地,结合SFT/RLHF方向的前沿算法持续提升业务效果天花板; 3、关注和推进相关大模型技术在业务场景的落地,包括摘要、智能创作等。 职位要求: 1、自然语言处理、机器学习、人工智能等相关专业的硕士/博士生; 2、熟练使用Tensorflow、Pytorch等深度学习框架,扎实的编程基础,具备独立的算法实现能力; 3、有过大模型预训练、SFT、RLHF等大模型实操经验,From Scratch训练过百亿/千亿基座模型的优先; 4、有大模型领域**会议文章(NerulPS、ICLR、KDD、ICML等)者优先。
  • 30k-50k·13薪 经验5-10年 / 硕士
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    我们需要您: 1.从事大模型(LLM)研究、训练、应用,包括但不限于训练任务优化、知识融入更新、模型性能提升等 2.跟进业界前沿的相关SOTA模型技术,保持技术先进性,应用到产品工程中 我们需要您具备: 1. 计算机、数学或统计学相关专业硕士及以上学历,算法理论与工程技术扎实,具有3年以上计算机NLP/CV/ML相关工作经验 2. 熟练使用pytorch/tensorflow/deepspeed等至少一种框架,能独立实现前沿模型,有NLP/CV/ML顶会发表经验者(ACL/EMNLP/CVPR/ICCV/NeurIPS等)优先; 3. 在NLP/LLM/多模态有深入算法研究与研发实践,有FT、预训练、可控内容生成方向经验者优先 4.懂业务,有良好沟通、分析解决问题和团队协作的能力;自我学习能力,保持对事物的好奇心。 加分项 (满足其一即可): 1. 熟悉主流开源大模型(GPT2/LLAMA/GLM等) 2. 有过大模型prompt learning、FT相关优化工作 3. 有过预训练大模型的相关工作 4. 有过DAU过百万产品的算法研发经验
  • 35k-60k·16薪 经验3-5年 / 硕士
    居住服务 / 上市公司 / 2000人以上
    工作职责: 1. 负责贝壳核心房产业务AI能力建设,利用AIGC相关能力推进业务智能化重塑; 2. 深入业务调研熟悉需求场景,参与和业务、产品、工程研发等横向交流学习; 3. 保持对业务的学习能力和持续热情,能探索调研业务实际场景痛点; 4. 结合业务需求,从Prompt优化,模型finetune等方面优化AI模型效果,解决面向业务场景的应用落地问题; 任职资格: 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2.熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架,掌握大语言模型SFT/LoRA/RLHF等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀;有NLP顶会论文或国际NLP比赛奖项者优先;
  • 20k-40k·13薪 经验1-3年 / 硕士
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    岗位职责: 1. 负责通信网络与大语言模型结合的研发设计与管理; 2. 负责面向通信网络的大语言模型Prompt Engineering提示工程,大语言模型微调和基于langchain的通信网络认知增强工具研发; 3. 负责面向通信网络的AI算法研发框架设计与开发; 4. 负责面向通信网络的AI算法模块开发管理,根据行业需求指导算法模型的技术选型和性能优化,算法模型包括结构化数据的预测分析和异常检测、因果关系分析、自然语言处理、深度学习、强化学习等。 岗位要求: 1. 计算机科学、机器学习、人工智能相关专业硕士及以上学历,具有AI产品研发和应用工作经验优先; 2. 熟悉LLM大模型基本原理及应用、langchain框架及应用,有GPT大模型研发经验者优先。 3. 深入掌握机器学习和深度学习,了解TensorFlow/pytorch/keras等深度学习框架; 4. 熟练掌握至少2种语言:Python, R, Matlab, SQL, Scala, Spark, PHP, SAS,Weka等; 5. 有良好的沟通表达能力,积极向上,细致认真。
  • 30k-60k 经验3-5年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    职位描述 1. 负责大模型技术在微博搜索场景的应用,提升用户满意度,包括但不局限于基于微博结果的内容生成、内容分析、搜索规划、搜索增强等。 2. 负责大模型技术在在文本生成、知识库建设、记忆能力、对话、推理能力增强等方面前沿技的跟进、创新,探索适合微博场景的应用解决方案; 任职要求 1. 计算机、人工智能等相关专业***硕士研究生及以上学历,2-5年NLP算法模型实践经验; 2. 熟练掌握NLP和深度学习模型算法,熟悉Pytorch/Tensorflow等算法框架 3. 熟悉RAG相关原理,熟悉大语言模型 SFT/RLHF 等技术; 4. 沟通表达能力强,逻辑思维和抽象思维能力优秀; 5. 有NLP顶会论文或国际NLP比赛奖项者优先;
  • 旅游|出行 / D轮及以上 / 500-2000人
    我们正在寻找一名具有丰富自然语言处理(NLP)经验的算法工程师,同时需具备大模型相关的经验和知识。如果您还具备Chatbot相关的经验,那将是一个巨大的加分项。此岗位将负责开发和优化我们的AI解决方案,推动NLP和大模型技术在各类应用场景中的落地。 主要职责: 设计和优化NLP算法,提升系统的理解和生成能力。 研究和应用最新的NLP技术,解决复杂的自然语言处理问题。 开发和优化大规模机器学习和深度学习模型,提升系统性能。 与产品团队和数据科学团队紧密合作,了解业务需求并转化为技术方案。 参与大模型相关项目,推动大模型在各类应用场景中的应用。 进行数据分析和挖掘,提供数据驱动的优化建议。 编写高质量的技术文档和报告,分享研究成果和项目进展。 职位要求: 计算机科学、电子工程、数学或相关领域的本科及以上学历。 至少3年在NLP领域的工作经验。 熟悉常见的NLP技术(如分词、命名实体识别、文本分类、情感分析等)。 具有大模型相关的经验(如GPT、BERT、Transformers等)。 精通Python,熟悉TensorFlow、PyTorch等深度学习框架。 具备数据分析和处理能力,能够理解和处理大规模数据集。 良好的团队协作能力和沟通能力,能够与跨部门团队有效合作。 加分项: 有Chatbot开发和优化的实际经验。 拥有电商、金融、医疗等领域的NLP应用经验。 在学术会议或期刊发表过NLP或大模型相关论文者优先。 具有推荐系统或其他AI应用开发经验者优先。 如果你对NLP和大模型充满热情,并希望在快速发展和充满挑战的环境中成长,我们诚邀你的加入!
  • 内容资讯,社交媒体 / 不需要融资 / 2000人以上
    1、参与开发长文本理解和生成的相关任务,通过改进文本分析策略和提高信息理解精度,加强模型在处理长文本序列场景中的应用效果。 2、开发和优化轻量化模型部署策略,利用最新的模型加速压缩技术,提升线上部署的效能,包括但不限于模型压缩、知识蒸馏。 3、持续追踪学术界和工业界的研究成果,探索在微博场景内的应用场景 岗位要求: 1. 学历背景:计算机、人工智能、数学等相关专业,本科、硕士学历。1-3年工作经验 2. 理论与实践能力:具备扎实的自然语言处理、机器学习和深度学习的理论基础与算法经验,在相关领域有顶会论文发表者优先考虑。 3. 框架与工具:熟练掌握PyTorch、transformers、vllm等主流深度学习框架,具备解决复杂业务问题并显著提升业务成果的实际经验者优先。 4. 创新与执行力:具备强大的创新思维和问题解决能力,能够应对高难度挑战,具备自我驱动与独立完成任务的能力,同时拥有优秀的沟通技巧与抗压能力。 5. 大模型相关经历:有大模型相关的项目经历,主导过大影响力项目或论文者优先