• 10k-15k 经验1-3年 / 本科
    企业服务,人工智能,工具 / 未融资 / 15-50人
    1. 面向不同的应用场景开发高性能 CUDA 程序 2. 和编译器团队紧密配合,针对硬件体系结构对算法进行分析,设 计,和优化 3. 对现有 CUDA 程序进行改写和适配 岗位要求: 1. 计算机/电子工程/数学/物理,本科及以上学历 2. 精通数据级并行程序设计和 GPGPU 编程,例如 CUDA、OpenCL 3. 精通 C/C++代码的编译、调试、分析和性能优化流程 4. 熟悉计算机体系结构,具有并行算法编程,调试,与优化经验
  • 40k-70k·16薪 经验不限 / 本科
    消费生活 / D轮及以上 / 500-2000人
    职位描述: 1. 分布式深度学习训练、推理系统核心技术研发; 2. 分布式系统优化,底层性能(GPU计算、存储、通信)优化; 4. 深度学习框架、超大规模分布式训练、推理等前沿问题的探索与研究,实现技术创新与突破。 职位要求: 推理优化或者分布式训练相关人选,精通CUDA的优先
  • 40k-70k·16薪 经验不限 / 本科
    消费生活 / D轮及以上 / 500-2000人
    职位描述: 1. 分布式深度学习训练、推理系统核心技术研发; 2. 分布式系统优化,底层性能(GPU计算、存储、通信)优化; 4. 深度学习框架、超大规模分布式训练、推理等前沿问题的探索与研究,实现技术创新与突破。 职位要求: 推理优化或者分布式训练相关人选,精通CUDA开发
  • 30k-60k·15薪 经验不限 / 不限
    信息安全,企业服务 / 上市公司 / 2000人以上
    岗位名称:AI平台开发专家/架构师 岗位职责: 1、负责大模型AI推理平台的开发和维护,使用各种高性能计算库进行推理加速 2、围绕推理框架开发Serverless推理平台,建设具有高吞吐低延迟的平台 3、负责开发异构芯片下的AI资源调度平台,减少用户使用成本,开箱即用 4、围绕行业大模型和国产GPU的优化和适配(Kernel 优化,编译优化,显存优化 等) 岗位要求: 1、至少熟悉Go/C++/Java语言等开发语言其中之一,有相关的开发经验 2、了解主流的推理框架TGI、vllm、triton、FasterTransformer,有实际的使用经验 3、有AI大模型技术及相关平台开发经验,包括但不限于训练平台、推理平台以及大模型优化等相关经验 4、熟悉主流的芯片NPU、TPU、GPU、XPU等使用方式,具有异构卡的虚拟化和及算力调度开发经验大大优先 5、熟悉各类深度学习网络和算子底层实现细节训练和推理模型调试,有调优经验优先 6、具备CUDA层调优能力、昇腾CANN编程能力,能根据不同的神经网络结构进行算子开发/调优优先考虑。 7、熟悉RDMA网络通信技术并有高性能网络设计及开发经验者优先;
  • 短视频 / 上市公司 / 2000人以上
    职位描述 1、负责快手一站式机器学习平台的设计研发与迭代改进,为业务提供稳定易用、高性能、高性价比的AI中台解决方案; 2、业内机器学习系统与平台前沿技术进展跟进与调研、落地; 3、参与模型训练,模型服务,模型管理,资源调度等机器学习相关问题的开发。 任职要求 1、计算机基础知识与编程基本功扎实,熟悉Go/Python/C++至少一种; 2、参与过大规模分布式系统的开发和维护; 3、良好的沟通能力和团队协作精神,严谨的工作态度与高质量意识 ; 4、善于学习新的知识,动手能力强,有进取心。 加分项: 1、了解行业内典型的调度系统架构、混部系统架构,了解优缺点; 2、了解分布式系统、调度、容器相关领域技术,熟悉Kubernetes/docker/Yarn等原理与实现,有Yarn/K8s二次研发经验优先; 3、熟悉计算机体系结构和Linux操作系统,了解 GPU 架构、Cuda编程; 4、优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情; 5、对机器学习系统(Tensorflow/Pytorch/Jax)和算法(transformer/bert)有认识/经验者优先。
  • 30k-50k·14薪 经验3-5年 / 硕士
    移动互联网,广告营销 / 上市公司 / 2000人以上
    岗位职责: 1、负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。 2、负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。 3、负责LLM/多模态模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。 4、负责扩散模型的端到端部署和AI绘图的高并发服务流程设计,包括但不限于核心算子/采样器优化、模型优化和压缩、服务流程优化。 5、负责设计和研发AI端到端任务编排体系,提升AI大模型在业务中的应用效率。 6、负责优化计算集群的资源调度和弹性计算策略,提升集群的资源利用率。 岗位要求: 1、硕士及以上学历,计算机专业出身。 2、熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程并有相关开发经验。 3、具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。 4、 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。 5、熟悉常见的深度学习框架,如PyTorch、TensorFlow等,并能够根据业务需求进行算法实现和调试。 6、熟悉LLM/多模态相关的算法技术以及推理加速方法。 7、有团队管理经验者优先。 8、具备较强的团队合作和沟通能力,优秀的分析和解决问题能力,对挑战性问题充满激情,自驱有追求,具备较强的攻坚能力。
  • 23k-35k 经验3-5年 / 硕士
    软件服务|咨询 / 上市公司 / 2000人以上
    一、公司简介 彩讯股份(创业板股票代码:300634)是一家软件互联网上市公司,是协同办公、 智慧渠道、云和大数据领域的龙头企业。拥有五地研发中心和遍布全国的运营网络,员工超过 3000 人。 公司坚持“以大场景运营效果为导向,全面数字化、智能化”的发展战略,持续加大在人工智能等领域的投入,将成为中国领先的智能数字化企业。 二、项目介绍: AI信创中心介绍: 彩讯股份“AI信创中心”是公司为抢占人工智能技术先机而成立的核心研发机构,是直接向CEO汇报的一级部门。中心汇集公司在人工智能、机器学习、知识图谱、自然语言处理等方面的人才,致力于将人工智能技术应用于公司各业务领域,实现产品、服务的智能化升级。 中心遵循“技术引领,应用驱动,市场导向”的发展策略,通过技术研究来挖掘人工智能的应用潜力,并在公司主营业务中进行示范与落地。 中心重点开展的技术和应用研究包括: 1)基于Transformer与BERT的对话系统与推荐系统。运用预训练语言模型与迁移学习技术,快速实现对话与推荐能力。 2)基于RL的智能决策与智能优化。研发强化学习技术在复杂决策环境中的应用,实现自动化智能决策。 3) 基于CVAE与StyleGAN等技术的智能创意与个性化推荐。生成图像、音乐、文本等创意素材,为个性化推荐提供丰富素材。 4)基于GAN与变分自编码器的客户画像与精准营销。利用生成对抗网络等算法,构建真实全面的数据与客户画像。 中心的研发重点在于企业级AI中间件与行业应用的研发,而非特定的机器学习模型。 中心的职责还包括: 1) 与高校、行业合作伙伴共建AI创新联合实验室,拓展产学研合作。 2) 发展与人工智能产业链上下游的合作伙伴关系,拓展公司的产业影响力。 3) 引领全公司各业务部门的产品与业务智能化转型升级。 4) 人工智能核心技术与产品的研发,不断提高公司的AI能力与实力。 中心将持续投入人工智能前沿技术与产品创新,以人工智能驱动公司各业务向智能化、个性化转型,实现产品服务的差异化和融合创新,为客户提供增强的体验与价值。中心必将成为公司实现产业升级与转型的核心动力之 三、岗位介绍: 【岗位职责】: 1、开源LLM的能力接入与部署; 2、负责LLM训练,模型微调; 3、SFT、RM、PPO等算法研究与优化; 4、负责前沿技术探索和落地。 【岗位要求】: 1.人工智能、计算机、数学/统计学等相关专业硕士及以上学历; 2.熟悉AI领域的前沿研究,具有丰富的研究经验,具备百亿级以上LLM 训练经验优先; 3.了解并行计算、CUDA、网络通信、系统优化、集群硬件架构等 HPC 相关的知识; 4.具有Prompt设计与微调经验优先; 5.熟悉SFT、RM、PPO原理,有实际实践经验者优先; 6.熟悉主流深度学习工具Pytorch,TensorFlow等; 7.具备良好的编程能力,熟练掌握 Python,数据结构和算法设计,熟悉 Linux / Unix 系统和 Shell 编程,熟练使用 Git; 8.在AI开源社区有贡献者优先; 9.在AI领域的核心期刊发表过论文优先; 10.有 TVM、TensorRT 等推理平台优化经验者优先; 11.了解并行推理技术的优先。 四、薪酬福利与职业发展: 我们提供竞争力的薪资待遇和福利待遇,包括期权激励、五险一金、带薪年假、节假日福利、健康体检、培训及晋升机会等。 同时,我们还为员工提供广阔的职业发展空间,鼓励员工在工作中不断成长和进步。 我们的团队充满活力、激情和创新精神,致力于打造一个开放包容、信任互助的工作环境,并定期举行各种团队建设活动,增强彼此之间的沟通和理解。 期待您的加入,一起探索未来无限可能!想更多了解彩讯股份,欢迎进入:https://www.richinfo.cn
  • 17k-29k·20薪 经验5-10年 / 不限
    汽车丨出行 / 未融资 / 2000人以上
    岗位职责: 1.负责自动驾驶数据平台、仿真平台、标注平台、训练平台及相关工具链的架构设计和研发工作,打造符合前瞻、量产智驾技术研发需要的数据闭环 2.负责大规模、可伸缩计算集群系统的解决方案的设计和搭建,以及核心技术的研究、开发和优化,负责平台长期运维支持和架构优化 3.负责自动驾驶软件系统框架架构设计和开发,与硬件、算法和测试团队合作,持续集成并优化自动驾驶系统 4.负责量产车型的数据驱动影子模式、数据记录等车端功能设计、系统架构和开发 任职要求: 1.学历要求:**本科及以上学历,英语CET-4及以上, 2.工作经验:具有6年及以上相关工作经验,特别优秀者可适当放宽 3.其他: ① 计算机科学与技术、软件工程专业、自动化控制专业、人工智能等相关专业优先 ② 满足以下条件之一: 1)熟悉软件开发流程、具备扎实的算法和数据结构、算法、操作系统、网络、数据库等知识 2)熟悉几何、计算机图形学、动态系统建模等理论和方法 3)精通C/C++/Go/Python/nodejs一种或多种编程语言,熟悉HTML/CSS/React/REST 4)熟悉Linux/RTOS环境下开发与调试,有嵌入式操作系统和实时操作系统的内核或驱动开发经验,有多进程多线程、中间件、计算机视觉应用(OpenCV)、CUDA、TensorRT等开发经验优先 5)有丰富的Gin/Pylons/Django Web框架开发经验 6)熟悉PyTorch,TensorFlow,TensorRT等深度学习框架,有模型训练、调优相关经验 7)熟悉Spark/K8S相关技术,有相关开发经验,有过海量数据系统开发经验优先,有过集群系统开发、部署和优化经验优先 8)熟悉软件开发流程以及DevOps完整流程,熟悉DevOps相关系统原理,有相关工具和使用经验、如Jenkins,Argo, K8S,Docker,Kubernetes等 ③ 工作认真负责,具有良好的团队合作能力、沟通协调能力和学习能力 ④ 有Tier 1或主机厂相关工作经验优先
  • 30k-60k·15薪 经验3-5年 / 硕士
    360
    信息安全 / 上市公司 / 2000人以上
    职责描述: 1. 优化大模型分布式训练速度; 2. 完善分布式训练框架,增加框架稳定性和扩展性 任职要求: 1. 学士及以上学历,计算机、电子、自动化等相关专业; 2. 熟悉Python,熟悉C/C++编程,编程能力优秀; 3. 熟练掌握TensorFlow/PyTorch等至少一种深度学习框架; 4. 熟练掌握TensorRT, XLA, TVM等深度学习编译器,能够基于这些编译器做二次开发或者加速应用; 5. 熟悉GPU等硬件架构,精通CUDA、cuDNN、NCCL,熟悉RDMA,Nvlink等互联技术; 6. 熟悉模型并行,数据并行,流水并行等分布式训练加速的基本原理; 7. 熟悉业界常见的分布式训练解决方案,例如Megatron, DeepSpeed等; 8. 有相关的项目背景优先。
  • 25k-50k 经验1-3年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 1、参与端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 岗位基本需求 1、3+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 之一即可 1、有训练过 generative models 的经验。 2、在设计、训练、评估和部署机器学习模型(尤其是LLM)方面有深刻的理解。 3、具有使用 CUDA 或 Triton 编写 GPU 内核的经验。 4、有使用现代类型化语言(如Golang)编写高性能服务的经验。 5、具备数学或者物理背景。 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源。
  • 25k-50k 经验3-5年 / 硕士
    消费生活 / 上市公司 / 2000人以上
    美团平台汇聚美食、外卖、酒店旅游、电影、打车、共享单车、休闲玩乐、美容美发等200多个品类和900万活跃商家,是具有全国影响力的零售科技平台。 我们团队不仅负责美团App的用户增长、大前端技术基础设施建设、公司语音和智能交互技术及产品研发,还承担了多条业务线的产品设计及品牌营销职责,同时整合地图服务部、客户服务和体验部等部门,致力于用科技提升美团数亿消费者、数百万商家、骑手、司机和团长的服务体验。美团平台拥有高并发、多业务的复杂场景,为技术深度优化提供了最佳实践可能。这里有简单、讲逻辑、有爱的团队,更是一块理想的实战场地,舞台广阔,欢迎你来尽情施展。 岗位职责 1、负责端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、负责训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 岗位基本需求 1、5+ 年使用深度学习框架(如 Pytorch、Tensorflow、Jax)的经验。 2、Python 能力优秀 具备以下者优先 之一即可 1、有训练过 generative models 的经验。 2、在设计、训练、评估和部署机器学习模型(尤其是LLM)方面有深刻的理解。 3、具有使用 CUDA 或 Triton 编写 GPU 内核的经验。 4、有使用现代类型化语言(如Golang)编写高性能服务的经验。 5、具备数学或者物理背景 岗位亮点 1、获得在业内最前沿的大模型认知和技术积累,包括且不限于对 Scaling law、MoE、RLHF 、Long context 、CharacterAI 等技术方向的全新理解。 2、丰富的数据和GPU资源。
  • 15k-25k 经验5-10年 / 硕士
    专业服务|咨询 / 不需要融资 / 2000人以上
    岗位职责 1.参与制定公司科技创新方案,规划管理公司整体AI技术发展方向,负责技术层面的整体推进,包括软件研发、项目实施、技术管理等; 2.规划公司的技术发展路线与新产品开发,实现公司的技术创新目标,及时了解和监督技术发展战略规划的执行情况; 3.负责客户公司AI相关项目建设规划,跟进项目实施,保证平台上线、版本迭代等工作按时正常推进; 4.参与重大技术项目的决策,指导、审核项目总体技术方案,对各项目进行质量评估; 5.开展人工智能在工业互联网相关领域算法应用研究及行业示范; 6.对接企业数字化需求,凝练产业关键共性技术问题,申请或参与相关纵向、横向科研项目。 任职要求 1.8年以上后端开发经验,熟悉Go/C/Python中至少两种开发语言,5年以上企业客户AI相关解决方案经验;或在知名高校、科研机构、企业研发机构有人工智能相关正式职位工作3年; 2.具有AI平台建设经验,熟知国内外AI平台功能及属性,了解市场主流的人工智能企业; 3.熟悉常用的机器学习/深度学习/图像处理算法和框架,如:CNN、RNN,Tensorflow、PyTorch等,并有较强的工程实现能力; 4.有CUDA, OPENCL, OpenMP, MPI 编程经验; 5.熟悉物联网或区块链技术; 6.有以下人工智能领域中的几个:计算机视觉、人工智能模式识别、深度学习、大数据分析、电子信息边缘智能、IOT硬件开发等的经验; 7.硕士研究生及以上学历,计算机、通信、互联网、IT、数学相关专业;
  • 11k-15k·14薪 经验3-5年 / 本科
    人工智能服务,IT技术服务|咨询,数据服务|咨询 / 不需要融资 / 50-150人
    工作职责: 1.分析已有人工智能算法与应用; 2.并按要求用类C/C++/CUDA语言完成算法的重写; 3.常驻无锡工作。 任职资格: 1.***本科及以上学历,具有1年及以上工作经验,计算机科学与技术、数学等相关专业。 2.从事过C/C++/CUDA编程工作; 3.有CUDA编程经验优先; 4.有申威国产CPU平台编程经验的优先。
  • 30k-60k·15薪 经验3-5年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    1、职位描述  负责公司机器学习平台计算引擎开发,为平台提供稳定易用、高性能的计算引擎。  业内机器学习系统与平台前沿技术进展跟进调研、落地。  参与模型训练、模型服务等机器学习相关项目的开发。  2、职位要求  1、计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力。熟悉计算机体系结构以及并行计算基本技术。  2、熟悉GPU硬件架构,熟悉GPU  软件栈(CUDA,cutlass),具备 GPU 性能分析的经验。  2、至少熟悉一种主流深度学习编程框架(TensorFlow/PyTorch/Paddle)并了解底层原理;熟悉Megatron/DeepSpeed/ColossalAI等开源框架和系统优先。  3、在机器学习、深度学习、大规模分布式机器学习以及在搜索、广告、推荐、机器翻译等领域有经验者优先。  4、有大型预训练大模型落地项目,包括大语言(Large Language  Modeling, LLM),视频大模型或者多模态大模型相关经验优先。
  • 30k-60k·15薪 经验3-5年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    1、职位描述  负责公司机器学习平台计算引擎开发,为平台提供稳定易用、高性能的计算引擎。  业内机器学习系统与平台前沿技术进展跟进调研、落地。  参与模型训练、模型服务等机器学习相关项目的开发。  2、职位要求  1、计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力。熟悉计算机体系结构以及并行计算基本技术。  2、熟悉GPU硬件架构,熟悉GPU  软件栈(CUDA,cutlass),具备 GPU 性能分析的经验。  2、至少熟悉一种主流深度学习编程框架(TensorFlow/PyTorch/Paddle)并了解底层原理;熟悉Megatron/DeepSpeed/ColossalAI等开源框架和系统优先。  3、在机器学习、深度学习、大规模分布式机器学习以及在搜索、广告、推荐、机器翻译等领域有经验者优先。  4、有大型预训练大模型落地项目,包括大语言(Large Language  Modeling, LLM),视频大模型或者多模态大模型相关经验优先。