• 13k-25k·13薪 经验3-5年 / 本科
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    岗位描述: 1.负责不同行业的大模型项目交付,提升业务自动化、智能化程度,助力各业务团队降本提效,赋能内外部合作伙伴; 2.深入理解大语言模型的架构、原理和应用,熟悉大模型的训练、调优和部署流程。熟悉提示词工程,至少精通一种大语言模型应用开发框架; 3.根据业务规划及团队目标,规划及实施后端服务架构的优化及改进,提升软件复用性、扩展性、维护性,实现高效高质量开发。 岗位要求: 1.熟悉常用的大模型开发交付技术,包括RAG、智能体等优先; 2.熟悉阿里百炼、百度千帆、Dify等开发平台,有实际项目经验者优先; 3. 本科以上学历,计算机相关专业,在校生、应届生均可; 4.熟练掌握关系型数据优先。
  • 15k-30k·13薪 经验3-5年 / 本科
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    岗位职责 负责自然语言处理(NLP)相关算法的研究、设计与实现,包括但不限于文本分类、情感分析、实体识别、语义理解、机器翻译、问答系统等。 参与大规模语料库的预处理、特征提取、模型训练与优化,提升算法性能与效果。 跟踪学术界与工业界最新NLP技术动态,探索并落地前沿算法,解决实际业务问题。 与产品、数据团队紧密合作,理解业务需求,设计并开发高效的NLP解决方案。 负责NLP模型的部署与性能优化,确保算法在高并发、低延迟场景下的稳定性。 编写技术文档,分享技术经验,推动团队技术能力的提升。 任职资格 计算机科学、人工智能、数学、统计学或相关专业本科及以上学历,硕士或博士优先。 熟悉自然语言处理基础理论,掌握常见的NLP算法与模型,如BERT、Transformer、LSTM、CRF等。 具备扎实的编程能力,熟练掌握Python,熟悉常用深度学习框架(如TensorFlow、PyTorch)。 熟悉NLP相关工具库(如NLTK、spaCy、Hugging Face Transformers等),并具备实际项目经验。 具备良好的数学基础,熟悉概率论、线性代数、优化算法等知识。 有大规模数据处理经验,熟悉Hadoop、Spark等分布式计算框架者优先。 具备较强的学习能力与问题解决能力,能够独立完成算法研究与开发任务。 良好的团队合作精神与沟通能力,能够与跨部门团队高效协作。
  • 25k-50k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:字节跳动直播推荐架构团队,负责抖音全场景直播体裁推荐系统的设计和开发,工作内容覆盖离在线推荐链路全流程,包括策略架构、模型架构、数据架构等子方向,支撑算法团队的高效迭代,解决海量吞吐带来的系统性能/成本/稳定性挑战,在业务中抽象/沉淀基础服务/框架、服务组件以及效率工具等核心基建。 1、策略架构,负责推荐在线链路的服务建设和迭代,串联请求处理全流程,解决链路延迟、吞吐瓶颈、数据的高效传递等核心问题,支持业务策略的快速和可持续迭代,不断优化系统的性能/成本/稳定性,动态逼近优化上界,提升策略ROI; 2、模型架构,负责精粗召等推荐模型的在线推理、离线训练以及部分平台化工作,支持模型的持续复杂化演进,解决计算和存储瓶颈,突破模型复杂度X海量离在线样本X模型数量带来的巨大工程挑战,紧贴前沿框架、算法和加速硬件,支撑推荐算法的持续突破。 职位要求: 1、扎实的编程能力,有优秀的设计和代码能力,对解决具有挑战性问题充满激情; 2、理解GPU硬件架构、GPU软件栈(CUDA/CUTLASS、Triton Lang),具备GPU性能分析经验; 3、深入研究过至少一种机器学习框架(Tensorflow/PyTorch或其他自研框架)的底层架构和机制。 【加分项】 1、熟悉各类深度学习网络和算子底层实现细节; 2、训练方向,有大规模分布式训练经验; 3、熟悉MLIR、XLA、TVM等深度神经网络编译/优化器; 4、能使用数学工具分析深度学习训推的优化算法。
  • 25k-50k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:字节跳动电商推荐架构团队,负责抖音全场景电商体裁推荐系统的设计和开发,工作内容覆盖离在线推荐链路全流程,包括策略架构、模型架构、数据架构等子方向,支撑算法团队的高效迭代,解决海量吞吐带来的系统性能/成本/稳定性挑战,在业务中抽象/沉淀基础服务/框架、服务组件以及效率工具等核心基建。 1、参与大规模机器学习在线预估和离线训练系统的研发与优化,支撑今日头条、抖音等字节跳动旗下电商场景高效模型推理; 2、紧贴前沿框架和社区工作,支持模型的持续复杂化演进,解决计算和存储瓶颈,突破模型复杂度X海量离在线样本X模型数量带来的巨大工程挑战; 3、参与大规模特征及样本的处理与流转、模型训练与调度等相关问题的研究与突破; 4、与推荐算法同学紧密合作,分析并解决上述问题及任务,并应用到实际业务中。 职位要求: 1、熟练掌握Linux环境下的C/C++编程; 2、理解GPU硬件架构、GPU软件栈(CUDA/CUTLASS、Triton Lang),具备GPU性能分析经验; 3、深入研究过至少一种机器学习框架(Tensorflow/PyTorch或其他自研框架)的底层架构和机制; 4、熟悉模型剪枝、量化及压缩、算子融合等方法; 5、有以下经验者优先:熟悉各类深度学习网络和算子底层实现细节;有大规模分布式训练经验;熟悉MLIR、XLA、TVM等深度神经网络编译/优化器。
  • 25k-40k 经验5-10年 / 本科
    金融 / 不需要融资 / 2000人以上
    参与AI技术场景应用的设计、研发,包括AI中台服务的设计、开发与维护;为周边系统提供AI应用能力对接支持,例如包括大模型能力应用、知识图谱、知识库、智能体的相关设计开发工作等。 任职要求: 1、计算机科学、人工智能、数学等相关专业,本科优先。 2、3年以上AI领域开发经验,主导或参加过至少1个大模型(LLM)项目成功落地经验。 3、熟练掌握Yolo、PyTorch、TensorFlow等主流深度学习框架。 4、具备模型微调、部署、优化及LangChain、向量数据库等工程化工具的实战经验。 5、软件开发能力,掌握包括不限于操作系统、软件工程、面向对象、设计模式、数据结构与算法等软件开发基础知识,至少精通Java或python开发技术体系之一,对多线程、分布式微服务系统、云计算平台(阿里云/腾讯云/AWS)及容器化技术(Docker/K8s)等主流技术有深入的理解; 6、乐于尝试与接受新技术,具有优秀的学习能力和逻辑分析与业务抽象能力,能独立解决复杂技术问题。 7、认真、严谨、敬业,优秀的口头、书面表达沟通能力,有良好的团队合作精神。
  • 30k-60k 经验不限 / 不限
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:团队负责抖音集团内容审核、内容理解等方向的架构支持工作,业务范围覆盖抖音、今日头条、剪映等多个重要业务线,工作内容涵盖特征计算编排、大模型推理/训练框架、RAG等大模型应用、GPU/CPU资源治理、数据平台等系统建设及优化,与算法团队一起推进大模型在业务场景的应用落地,解决大模型应用过程中的各种工程挑战。 1、负责大模型推理系统架构设计及优化,密切配合算法部门,持续优化大模型研发和部署效率; 2、负责跟踪探索多种大模型推理技术,包括量化、蒸馏、TRT-LLM&vLLM、Kernel优化等理论研究和实践开发,极致提升推理性能; 3、负责GPU资源管理和治理,提升GPU资源使用效率。 职位要求: 1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先; 2、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI等比赛获奖者优先; 3、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护; 4、熟悉至少一种主流的机器学习框架(TensorFlow/PyTorch),熟悉CUDA编程和算法的并行化改造,对GPU加速卡有基本了解;熟悉主流大模型结构,具有大模型训练和推理优化经验者优先; 5、熟悉模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、TRT-LLM&vLLM推理优化等,有相关实践经验优化; 6、有强烈的工作责任心,良好的沟通协作能力,对解决具有挑战性问题充满激情,能和团队一起探索新技术,推进技术进步。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责音乐相关业务的大语言模型的研发和应用,相关研发技术和解决方案在抖音、汽水音乐等产品中应用,满足音乐相关业务场景中的用户不断增长的智能交互需求,全面提升用户在音乐相关的创作和消费场景的体验; 2、参与音乐相关大模型的研发,如音乐预训练、音乐多模态模型等; 3、参与大模型技术在音乐场景中的探索和相关应用落地,如音乐搜推、音乐助手、视频配乐等; 4、在音乐人工智能领域开展前沿研究,在未来生活中的更多音乐相关的使用场景的深入研究和探索。 职位要求: 1、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 2、熟悉NLP、Music相关的算法和技术,熟悉大模型训练、RL算法者优先; 3、在大模型领域,主导过大影响力的项目或论文者优先; 4、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题; 5、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。
  • 15k-25k 经验3-5年 / 本科
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    岗位职责: 1. 研发人工智能领域的相关算法实现, 可以选择NLP、语音、图像领域其中之一。 2. 结合行内业务需求,设计实现方案,并基于大模型进行场景开发和模型的微调优化。 3. 跟踪和关注大模型推理训练领域的前沿技术和趋势,进行技术调研和应用。 岗位要求 1.计算机、电子通信、数学等相关专业,硕士及以上学历或优秀本科生; 2.具备优秀的编程能力,熟练使用Python/C/C++的其中一种; 3.对机器学习、深度学习等人工智能领域有兴趣,有相关领域课题研究或项目经验者优先;; 4.有期刊论文发表或计算机相关竞赛经验者优先; 5. 出色的问题分析及解决能力,能自我驱动,持续面对挑战,积极主动、踏实勤奋。
  • 18k-30k·13薪 经验3-5年 / 本科
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    岗位职责: 1. 负责通信网络与大语言模型结合的研发设计与管理; 2. 负责面向通信网络的大语言模型Prompt Engineering提示工程,大语言模型微调和基于langchain的通信网络认知增强工具研发; 3. 负责面向通信网络的AI算法研发框架设计与开发; 4. 负责面向通信网络的AI算法模块开发管理,根据行业需求指导算法模型的技术选型和性能优化,算法模型包括结构化数据的预测分析和异常检测、因果关系分析、自然语言处理、深度学习、强化学习等。 岗位要求: 1. 计算机科学、机器学习、人工智能相关专业本科及以上学历,具备AI产品研发和应用工作经验; 2. 熟悉LLM大模型基本原理及应用、langchain框架及应用,有GPT大模型研发经验者优先。 3. 深入掌握机器学习和深度学习,了解TensorFlow/pytorch/keras等深度学习框架; 4. 熟练掌握至少2种语言:Python, R, Matlab, SQL, Scala, Spark, PHP, SAS,Weka等; 5. 有良好的沟通表达能力,积极向上,细致认真。
  • 15k-25k·13薪 经验3-5年 / 硕士
    软件服务|咨询,IT技术服务|咨询 / 上市公司 / 2000人以上
    工作职责 1、负责大模型场景的的需求理解,进行技术调研和验证,输出大模型技术方案完成产品需求; 2、负责大模型数据处理工作,包括数据清洗、预处理和数据构建;制定相关数据标准。 3、负责大模型训练相关工作,包括预训练、SFT训练和RL训练,并针对训练后的模型评估。 4、对接产品、研发和运营,主导大模型相关产品和技术进展。 5、深入理解大模型能力和行业发展趋势,规划未来大模型技术方向和业务架构。 任职要求: 1、3年及以上算法或大模型应用工作经验。 2、熟悉大模型相关的知识理论,熟悉业界常见大模型如讯飞星火,具有部署,训练和调优经验更佳。 3、具备数据治理,数据分析,数据加工的相关经验。 4、熟练掌握python,pytorch等相关开发语言和学习框架的使用,具备较强的编程实现能力。 5、在算法的垂类应用上,从方案设计、模型训练以及部署上线具备实际项目经验。 6、良好的团队合作和沟通能力,并能够独立承担大模型相关任务。
  • 28k-38k 经验3-5年 / 硕士
    金融 / 不需要融资 / 50-150人
    岗位职责: 负责设计⼤语⾔模型的技术⽅案并落地到⾏业客户的垂直场景中。典型场景包括但不限于多轮对话、 Document QA、结构化信息抽取、私有函数调⽤、AIAgent等等; 负责⼤语⾔模型技术⽅案的端到端研发,包括但不限于⽅案设计、数据准备及处理、⾏业模型训练、指令精 调、模型性能提升、模型效果评测等; 跟踪并分析业内最新研究成果和技术动态,持续优化和改进现有模型和技术⽅案;基于NLP⼤模型探索下⼀ 代语义技术,构建⾏业领先的多模态语义核⼼能⼒; 根据业务需求,与外部团队开展技术交流与沟通; 岗位要求: 计算机相关专业硕⼟及以上学历,有论⽂复现能⼒和算法⼯程交付经验; 精熟练掌握C++、Python等编程语⾔的⼀种或多种,具备良好的编码能⼒,有⼤型⼯程项⽬经验; 熟悉多种⾃然语⾔处理任务,如问答系统,序列标注,情感分析,摘要⽣成及抽取,知识图谱等。有从0到1 构建的⾃然语⾔处理任务的⼯程经验; 了解NLP主流预训练语⾔模型2(GPT/LLaMA/GLM/Bloom/BERT/Qwen),熟练掌握主流深度学习框架 Pytorch; 有团队意识,有良好的⽂档习惯和合作意识; 加分项: 有⼤模型训练框架Deepspeed/ColossalAl/LLaMA Factory使⽤经验者优先; 有垂直领域⼤模型PT、Continue PT、SFT、RLHF经验者优先;
  • 15k-22k 经验3-5年 / 本科
    数据服务 / 上市公司 / 500-2000人
    工作职责: 1、负责大模型昇腾算子适配、开发、调优、验证、评测; 2、负责响应客户AI大模型平台优化评测需求,参与大模型方案调优验证、联调适配工作; 3、负责昇思mindspore推理性能评测、评测与优化方案编写; 4、负责以Ascend C语言进行算子融合功能开发、要求性能达到或超过GPU方案; 5、领导安排的相关工作。 任职要求: 1、计算机科学、网络工程、信息安全等相关专业。本科学历以上,有相关工作经验优先。 2、熟练C++,Python编程,具备良好的代码风格; 3、掌握常用的算法和数据结构、了解常见的机器学习算法,熟练使用C++标准模板库; 4、熟悉 Linux 系统和基于 git 的版本管理; 5、熟悉MLIR/LLVM/vLLM,了解CUDA、CANN技术; 6、熟悉 TensorFlow /Pytorch等深度学习框架; 7、具有编译器开发经验或者异构编程开发经验。
  • 30k-50k·14薪 经验不限 / 本科
    生活服务,旅游|出行 / 上市公司 / 150-500人
    岗位职责 1. 负责大语言模型(LLM)在行程规划、智能客服等场景的应用研发,包括算法设计、模型优化及工程化落地; 2. 深入探索LLM与检索增强生成(RAG)、多智能体(Multi-Agent)系统,提升复杂场景下的推理与交互能力; 3. 构建高效的Multi-Agent协作框架,设计任务分配、知识共享与动态决策机制; 4. 针对垂直场景进行LLM微调(Fine-tuning)、领域适配与性能优化,解决实际业务中的长尾问题; 5. 跟踪大模型领域前沿技术,推动技术在实际业务中的创新应用。 任职要求: 1. 本科及以上学历,计算机、人工智能、数学等相关专业,有NLP/深度学习/LLM算法经验; 2. 熟练掌握PyTorch/TensorFlow等框架,理解Transformer、BERT、GPT等模型原理,有LLM项目经验; 3. 熟悉RAG技术栈(如向量数据库、检索排序、上下文增强生成),具备多轮对话系统开发经验; 4. 熟悉多智能体(Multi-Agent)协同架构设计,有任务分解、知识共享、动态规划等开发经验; 5. 具备LLM微调经验,熟悉PEFT、LoRA、RL等微调方法,具备大模型微调经验者优先。 6. 具备工程化落地能力,至少拥有一种后端技术栈(如Python Flask, Django, Fastapi等)和实际的工程经验。 场景经验: 1. 在智能客服、行程规划、AI Agent等领域有LLM项目经验者优先; 2. 了解主流Agent、RAG开发框架,如LangChain、AutoGen、Swarm、dify等; 3. 参与过开源LLM相关项目或贡献代码者优先。
  • 50k-100k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责研发提效场景所需要的大模型能力的研发和应用,研究高质量数据的挖掘和合成、大模型的对齐效率、Agent的设计&端到端训练等等,不断思考和跟进AI的最新进展对我们的价值,探索下一代的研发模式; 2、高质量数据挖掘清洗使用,数据自动、半自动合成方案研究探索,设计针对代码场景的原子任务、全链路任务的评测方法; 3、研究LLM/VLM训练与优化技术,包括微调、强化学习(RLHF)、知识蒸馏等,提高大模型在代码场景下的能力; 4、尝试落地到各种应用场景,比如:IDE代码补全、代码能力QA、场景化Agent、代码自动修复、漏洞检测等等; 5、持续跟踪LLM/VLM领域的最新技术动态,并将其应用于实际业务场景中,推动技术落地。 职位要求: 1、优秀的代码能力、数据结构和基础算法功底,熟练掌握至少一门语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 2、熟悉NLP、CV、ML等相关的技术,深入理解大模型或图片视频生成等相关技术栈(如RLHF、SFT、Dit/Vit/Transformer、Stable Diffusion等); 3、在大模型领域,主导过有影响力的项目或论文者优先;在ACL/EMNLP/ECCV/CVPR等顶会发表论文者优先; 4、有代码基座经验,有强化学习结合大模型落地经验,有Multi-Agent、Tool-Use等相关经验优先; 5、出色的问题分析和解决能力,有自主探索解决方案的能力; 6、良好的沟通协作能力,能和团队一起探索新技术,推动技术进步。
  • 50k-100k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责研发提效场景所需要的大模型能力的研发和应用,研究高质量数据的挖掘和合成、大模型的对齐效率、Agent的设计&端到端训练等等,不断思考和跟进AI的最新进展对我们的价值,探索下一代的研发模式; 2、高质量数据挖掘清洗使用,数据自动、半自动合成方案研究探索,设计针对代码场景的原子任务、全链路任务的评测方法; 3、研究LLM/VLM训练与优化技术,包括微调、强化学习(RLHF)、知识蒸馏等,提高大模型在代码场景下的能力; 4、尝试落地到各种应用场景,比如:IDE代码补全、代码能力QA、场景化Agent、代码自动修复、漏洞检测等等; 5、持续跟踪LLM/VLM领域的最新技术动态,并将其应用于实际业务场景中,推动技术落地。 职位要求: 1、优秀的代码能力、数据结构和基础算法功底,熟练掌握至少一门语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 2、熟悉NLP、CV、ML等相关的技术,深入理解大模型或图片视频生成等相关技术栈(如RLHF、SFT、Dit/Vit/Transformer、Stable Diffusion等); 3、在大模型领域,主导过有影响力的项目或论文者优先;在ACL/EMNLP/ECCV/CVPR等顶会发表论文者优先; 4、有代码基座经验,有强化学习结合大模型落地经验,有Multi-Agent、Tool-Use等相关经验优先; 5、出色的问题分析和解决能力,有自主探索解决方案的能力; 6、良好的沟通协作能力,能和团队一起探索新技术,推动技术进步。
展开