• 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责端侧模型推理框架开发,包括模型压缩、优化技术,在端侧的接入、适配、算子开发工作,使之符合业务要求,提高性能收益; 2、负责探索和落地 AI 模型工程部署前沿技术,包括但不限于稀疏计算、编译优化。 职位要求: 1、具备扎实的计算机科学功底和编程能力,了解常见并行计算算法,具有良好的编程习惯; 2、熟悉transformers、stable diffusion等主流模型原理; 3、良好的团队协作能力; 4、创新性强,有良好的动手实现能力,对技术有热情; 5、加分项:了解模型剪枝、量化等优化方法原理,具备相关模型优化经验。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、GPU/异构计算(FPGA/ASIC)部件的选型路标计划的制定、评测、引入和交付落地; 2、负责GPU/异构计算机型在与机器学习/AI等业务的适配与性能调优; 3、负责GPU/异构计算服务器的性能评测和稳定性调优,分析和优化系统性能瓶颈; 4、跟进GPU/异构计算故障在数据中心的监控、诊断与处理; 5、与行业联盟和开放标准委员会合作,参与新兴技术研究和新标准的定制。 职位要求: 1、电气工程、计算机工程、计算机科学或相关专业硕士研究生及以上学历; 2、5年以上GPU/AI平台架构和/或应用性能优化设计或平台评测经验; 3、熟悉GPU/AI平台系统评测、性能分析、性能调优的技术与方法; 4、对计算机系统架构,尤其是GPU/AI SoC或平台架构、互连结构、内存子系统、GPU Direct RDMA中一项有专长者,优先考虑; 5、对GPU/AI虚拟化技术、深度学习架构、分布式系统等业务应用中一项有专长者,优先考虑。
  • 20k-40k·14薪 经验3-5年 / 本科
    人工智能服务 / 上市公司 / 150-500人
    岗位职责: 1. 负责将基于深度学习的视觉算法部署在从端到边到云的各种硬件上,并从多角度优化以发挥具体平台的性能; 2. 设计并实现跨平台的调度框架,在多种平台上的高性能基础组件,兼顾各层次的并行和异构调度,及具体算子的汇编级优化,为公司各产品线提供支撑; 3. AutoML 及 模型的自动发布系统研发。 任职要求: 1. 计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力; 2. 熟悉计算机体系结构以及并行计算基本技术; 3. 熟悉任意一种深度学习框架者优先; 4. 对以下一种或多种技术有深入研究和实践经验的优先:有CPU或GPU体系结构调优经验;熟悉相关平台汇编指令,熟悉多核并行编程;有嵌入式多协处理器结构性能调优经验; 5. 有矩阵运算,计算机视觉和图像处理算法在各种硬件设备移植经验的优先; 6. 对高性能计算,异构计算和性能优化工作有强烈的兴趣。
  • 18k-25k 经验1-3年 / 本科
    人工智能服务 / 上市公司 / 150-500人
    岗位职责: 1. 负责将基于深度学习的视觉算法部署在从端到边到云的各种硬件上,并从多角度优化以发挥具体平台的性能; 2. 设计并实现跨平台的调度框架,在多种平台上的高性能基础组件,兼顾各层次的并行和异构调度,及具体算子的汇编级优化,为公司各产品线提供支撑; 3. AutoML 及 模型的自动发布系统研发。 任职要求: 1. 计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力; 2. 熟悉计算机体系结构以及并行计算基本技术; 3. 熟悉任意一种深度学习框架者优先; 4. 对以下一种或多种技术有深入研究和实践经验的优先:有CPU或GPU体系结构调优经验;熟悉相关平台汇编指令,熟悉多核并行编程;有嵌入式多协处理器结构性能调优经验; 5. 有矩阵运算,计算机视觉和图像处理算法在各种硬件设备移植经验的优先; 6. 对高性能计算,异构计算和性能优化工作有强烈的兴趣。
  • 20k-35k 经验3-5年 / 本科
    硬件 / 上市公司 / 500-2000人
    工作职责: 2. 熟练掌握C/C++/Fortran/Python及常用数据结构算法,动手能力强,有较强的算法分析及编程能力 3. 具备扎实的算法和数据结构基础,熟悉程序的编译、调试和优化流程 4. 具备算法优化能力,具有数学库优化开发经验优先 5. 具有CUDA/HIP/OpenCL/MPI等并行计算程序开发与优化经验优先 6. 熟悉Caffe/Tensorflow/MXNet等任意一种深度学习开源框架,有深度学习框架开发和优化经验优先 7. 练阅读相关领域英文论文并能实现 8. 具备良好的逻辑沟通能力和解决实际问题的能力 任职资格: 岗位职责: 1. 基于异构计算平台的算法优化和移植工作 2. 人工智能领域框架移植和性能优化任职资格 3. 参与处理器编译器开发; 4 .参与处理器编译工具链开发与维护; 5. 分析处理器性能,进行性能测试、分析与优化;
  • 20k-35k 经验3-5年 / 硕士
    硬件 / 上市公司 / 500-2000人
    工作职责: 2. 熟练掌握C/C++/Fortran/Python及常用数据结构算法,动手能力强,有较强的算法分析及编程能力 3. 具备扎实的算法和数据结构基础,熟悉程序的编译、调试和优化流程 4. 具备算法优化能力,具有数学库优化开发经验优先 5. 具有CUDA/HIP/OpenCL/MPI等并行计算程序开发与优化经验优先 6. 熟悉Caffe/Tensorflow/MXNet等任意一种深度学习开源框架,有深度学习框架开发和优化经验优先 7. 练阅读相关领域英文论文并能实现 8. 具备良好的逻辑沟通能力和解决实际问题的能力 任职资格: 岗位职责: 1. 基于异构计算平台的算法优化和移植工作 2. 人工智能领域框架移植和性能优化任职资格 3. 参与处理器编译器开发; 4 .参与处理器编译工具链开发与维护; 5. 分析处理器性能,进行性能测试、分析与优化;
  • 智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 岗位职责: 1.跟踪研究高性能异构计算前沿技术; 2.研究FPGA算法实现与性能优化方法; 3.研究FPGA、MCU、自毁等硬件保护方案; 4.研究高性能矩阵计算在FPGA、GPU上的硬件实现。 职责要求: 1.电子、通信、自动化等相关专业,硕士及以上学历; 2.精通Verilog/VHDL编程语言,精通时序约束、时序分析方法; 3.熟练使用仿真调试工具和掌握FPGA集成套件开发流程,如Vivado、ISE、QuestaSim; 4.参与过大型FPGA项目开发,具有PCIe,DDR3,SRIO,JESD204等高速接口逻辑设计经验; 5.具备MCU安全芯片相关开发经验者优先; 6. 极强的工作责任心,良好的团队协作精神,优秀的表达和沟通能力,乐于挑战,抗压力强。
  • 智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 岗位职责: 1.高性能计算、大数据、人工智能方向融合研究 2. 针对特定的计算平台(CPU/GPU/intel PMEM/RDMA)进行高性能计算加速,编译优化 3. 对机器学习(深度学习)中的计算问题进行研究,实现模型训练&推理的性能最大化。 4. 研究高性能计算中并行编程的使用和实现的挑战,完成关键应用&算法在分布式异构计算平台的高性能交付; 任职要求: [1] 计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力; [2] 熟悉计算机体系结构以及并行计算基本技术。 [3] 对下面至少一种技术有研发经验: a. 具有arm,x86,risc-v或者mips等至少一种CPU性能调优经验,熟悉相关平台体系结构和汇编指令,熟悉多核并行编程。 b. 对Ti6678,Hexagon HVX,Cadence Tensilica或者CEVA等至少一种DSP有算法开发移植和调优经验。 c. 对Graphcore,Habana,华为昇腾,寒武纪,燧原,比特大陆等任一款深度学习加速器有模型适配,调优,训练平台或推理引擎开发经验。 [4] 有代数矩阵运算、信号处理、计算机视觉和图像处理算法在不同处理器上移植和调优经验的优先。 [5] 对云和服务器集群有调优经验的优先;有开发运营过开源软件或者为知名开源软件贡献过代码的优先。 [6] 对高性能计算,异构计算,体系结构和性能优化工作有强烈的兴趣的优先。
  • 30k-40k·15薪 经验3-5年 / 本科
    岗位职责: 1.参与自动驾驶数据闭环解决方案的设计与落地,搭建可支撑 PB 级自动驾驶数据(涵盖传感器数据、标注数据、仿真场景等)的分布式存储与计算架构,构建从数据采集、清洗、标注到训练、仿真的全链路自动化流水线,为自动驾驶算法迭代提供高效数据支撑。 2.参与云边端协同架构方案的设计与实现,构建云 - 边 - 端三级算力体系,建立科学的算力 - 功耗 - 成本评估模型,针对性优化车端推理延迟;设计并优化边缘节点(车载计算单元)与云端的数据同步策略,有效降低带宽成本;开发大规模资源调度系统,实现云端 GPU 资源的动态、智能调度,显著提升资源利用率。 3.深耕系统性能调优与高可用保障,攻克点云与视觉任务等异构计算瓶颈,持续优化系统吞吐与延迟关键指标;构建跨地域容灾体系,深入研究并解决多副本一致性、容错机制、弹性扩缩容等核心技术难题,有效规避海量数据场景下的热点、雪崩等系统风险,保障系统稳定运行。 4.推动云原生、微服务及 DevOps 技术在基础架构层的深度落地与实践,提升架构的灵活性、可扩展性与交付效率,支撑业务快速迭代。 5.探索并推动 Blackwell 架构、NvLink/NvSwitch、RDMA/ZNS SSD 等新型硬件技术在分布式系统中的应用与落地,挖掘硬件潜力,提升系统整体性能。 任职要求‌: 1、精通Python,会Java是加分项,熟悉MQTT协议栈(如EMQX、HiveMQ)及Linux网络编程; 2、掌握云端开发技术栈(如Kubernetes、Docker、redis、kafka和ceph等),有云原生或微服务架构经验者优先; 3、3年以上云通信开发经验,有车联网或自动驾驶项目背景,熟悉车载网络架构(如Veins)或OTA升级系统开发者优先; 4、加分项:了解ISO 26262功能安全或车载网络架构(如Veins),有高并发分布式系统设计经验或性能优化案例。
  • 25k-50k·15薪 经验3-5年 / 硕士
    人工智能服务 / 不需要融资 / 150-500人
    一、岗位职责: 1. 参与智能计算平台的整体硬件架构设计,牵头完成系统级模块划分、处理器/加速器选型、IO与互联方案设计等工作; 2. 分析典型应用场景下对计算、感知、通信等能力的系统需求,制定可支撑多场景、多任务运行的硬件平台架构; 3. 跟踪国内外主流嵌入式计算平台、异构算力芯片及系统集成技术的发展动态,提出硬件平台的升级演进建议; 4. 协同算法、操作系统、驱动与中间件团队,推动硬件架构与系统软件的协同优化; 5. 参与系统级仿真与验证方案设计,提供硬件层面的支撑与技术评估; 6. 参与项目方案论证、技术方案编写及阶段性技术成果汇报,为平台建设提供专业技术支撑; 7. 支持设备选型、外设兼容性评估、集成测试与调试等工作,确保平台具备稳定性、扩展性与工程化能力。 二、任职要求: 1. 硕士及以上学历,电子工程、计算机工程、自动化、通信工程等相关专业; 2. 五年以上嵌入式系统、智能硬件、计算平台等领域研发经验,有平台级架构设计经验者优先; 3. 熟悉主流嵌入式处理器架构(如ARM、RISC-V、国产CPU等)及其在计算平台中的集成方式; 4. 对CPU/GPU/NPU等异构计算架构具备一定了解,具备硬件/系统协同设计实践经验; 5. 熟悉SPI、I2C、CAN、PCIe、以太网等接口协议,具备实际的系统集成与调试能力; 6. 具备良好的技术文档撰写能力、沟通能力与团队协作意识; 7. 有参与科研项目、关键技术攻关经验者优先,具备从系统需求分析到方案落地的完整工作经历者优先。
  • 50k-80k 经验5-10年 / 本科
    移动互联网,医疗丨健康 / C轮 / 150-500人
    1、负责首云硬件服务器(计算、存储、推理、训练)的统一选型 2、负责服务器硬件的测试和评估以及硬件相关技术的研究推广工作 3、能够参与制订硬件评估方案,并完成硬件评估、调试工作,构筑相关产品硬件平台,规划硬件平台及发展 4、研究并开发硬件相关新型技术在应用层的整合与实现、解决硬件与操作系统相关联的疑难问题。 5、主导和供应商的沟通交流 6、负责GPU部件和技术趋势追踪、选型、定制、引入验证、产品化上线等工作; 7、负责GPU/异构计算服务器单机与集群的性能评测及调优,分析和优化性能瓶颈; 8、参与分布式计算通信组件MPI/NCCL/UCX等的研究与实现; 9、参与GPU/异构计算故障在数据中心的监控、诊断与处理。 岗位要求: 1、本科以上学历,熟悉X86平台架构,有良好、全面的计算机软硬件知识,对CPU、GPU、网卡、内存、RAID、盘阵、SSD、储存等相关技术有较深入的研究,深入了解整机柜服务器 2、熟悉互联网领域主流硬件厂商的主要产品、对服务器硬件的以及周边配置有浓厚的兴趣; 3、良好的沟通能力,团队协作能力,责任心强,具备一定的抗压能力 4、掌握GPU测试方法及原理,掌握了解P2P、GDR、NCCL等技术原理及测试评估方法 5、精通英伟达GPU芯片原理,精通GPU软硬件协同调优经验,有国产GPU经验者优先。 6、有5人左右团队管理经验
  • 20k-40k·14薪 经验5-10年 / 本科
    IT技术服务|咨询,人工智能服务 / 天使轮 / 50-150人
    职位描述: 1、负责基于ZYNQ MPSoC的嵌入式系统架构设计、软件开发、驱动开发及系统级调试; 2、与上位机软件团队协作,定义通信协议(如TCP/IP、UART、自定义协议等),确保软硬件接口高效稳定; 3、协同FPGA团队完成硬件加速模块(如存储交互、模块驱动等)的软硬件协同设计与优化; 4、参与硬件设计评审,对原理图设计提出方案或修改建议,解决软硬件协同问题; 5、主导系统性能调优,包括实时性、资源占用、低功耗设计等; 6、编写技术文档,包括需求分析、设计方案、测试报告等; 7、跟踪行业前沿技术(如边缘计算、异构计算),推动技术迭代与创新。 职位要求: 1、计算机、电子工程、自动化等相关专业,5年以上嵌入式开发经验; 2、精通ZYNQ MPSoC平台开发,熟悉Xilinx工具链(Vivado、Vitis、Petalinux等); 3、扎实的C/C++编程能力,具备Linux驱动开发及实时操作系统(FreeRTOS/Zephyr等)经验; 4、熟悉常用通信协议(UART/SPI/I2C/Ethernet/USB)及外设驱动开发; 5、具备跨团队协作能力,能高效对接上位机、FPGA及硬件工程师; 6、熟悉嵌入式系统调试工具(示波器、逻辑分析仪、JTAG等)。 加分项: 1、有智能硬件产品(如工业控制、机器人、智能家居)量产经验; 2、了解FPGA开发流程,具有PL外设模块驱动经验; 3、熟悉嵌入式AI框架(TensorFlow Lite、PyTorch Edge)或异构计算优化; 4、有高速数据采集、图像处理、无线通信(Wi-Fi/蓝牙)开发经验。
  • 10k-20k 经验1-3年 / 本科
    企业服务,人工智能,工具 / 天使轮 / 少于15人
    岗位职责: 1、优化模型前后处理性能,重点提升嵌入式设备端侧推理效率客户技术支持:算法移植对接、问题诊断及产品改进建议 2、负责具身智能视觉相关2D、3D的算法研发、性能优化以及后端实现等 任职资格: 1、具有机器人、计算机、人工智能、自动化等相关专业本科及以上学历; 2、 深度学习算法开发经验 3、精通C++/Python开发,具备高质量代码交付能力; 4、熟练使用Python,熟悉如Tensorflow、Pytorch等至少一种深度学习框架; 5、掌握机器学习相关基础知识,熟悉强化学习、模仿学习、示教学习、自监督学习等方向者优先; 6、具有一定的任务规划基础,对PDDL,POMDP,决策树,知识图谱等相关知识有了解者优先; 7、具有优秀的英文文献阅读能力,对探索前沿领域有着极大的热情,有国际期刊、会议论文发表者或相关竞赛获奖者优先; 【发展优势】参与国产AI芯片全栈技术研发 -- 深度对接半导体大厂技术生态--前沿技术:模型压缩/异构计算/端侧推理优化
  • 15k-30k 经验5-10年 / 本科
    移动互联网,数据服务 / 未融资 / 500-2000人
    产品用户体验专家 工作职责: 1、负责家庭AI终端的用户体验顶层设计,构建基于用户体验模型和测评体系,深入洞察全用户生命周期中存在的问题,设计产品方案解决问题,保障产品体验前瞻性,提升产品体验和质量 2、根据业务问题,能独立完成用研项目的需求分析,方案设计、项目执行,并输出有较强落地性的研究报告 3、前瞻性梳理、判断家庭AI终端产品及相关行业市场环境以及动态,结合业务进展进行专题调研分析 4、定义家庭AI终端系统的人机交互架构,包括多模态交互(语音+手势+表情)融合方案、适老化/儿童模式自动化切换逻辑 5、通过数据驱动、用户洞察等方式,深入用户使用场景,挖掘用户需求和痛点,持续推动产品持续创新及优化,实现业务目标。 任职要求 1、本科及以上学历,人机交互、认知科学、计算机科学相关专业; 2、5年以上家庭AI终端(家庭网关/智能摄像头/NAS产品/智能音箱/家庭机器人/车载系统等)用户体验设计经验; 3、精通边缘计算技术栈:NPU算力调度(如TensorRT部署)、模型轻量化(知识蒸馏/量化)、多模态数据融合; 4、深度理解家庭AI终端技术趋势:异构计算架构、低功耗唤醒、隐私计算; 5、有智能家居多设备联动体验设计经验(如Matter协议场景优化); 6、具备一定管理经验,能够管理多个任务目标并确保按时交付; 7、英语听说读写能力,能够阅读和撰写技术文档、主题演讲。
  • 30k-60k·16薪 经验不限 / 本科
    电商 / D轮及以上 / 2000人以上
    岗位职责: 1. 负责广告物料流水系统的架构设计与性能优化,支持上亿级别物料的实时处理与下发,确保数据的实时性和可靠性 2. 负责大型分布式广告检索引擎的架构设计和优化,支持毫秒级别实时索引系统的研发,研究和设计针对不同场景的最优索引架构 3. 负责广告在线系统的性能调优、架构设计与优化,支撑数百亿请求压力的高可靠系统的研发,通过合理运用算力和系统容量以提高系统性能和进行广告收益最大化探索 4. 负责广告在线系统的业务能力建设,包括广告产品的业务需求落地、广告效果优化、在线系统的迭代效率提升等 5. 持续关注广告科技领域的最新进展和技术趋势,参与技术研究和创新,不断优化系统架构,提升广告在线系统的效果和性能 岗位要求:  1. ***大学硕士及以上学历,计算机相关专业 2.  熟练Java/scala高级语言,掌握SQL/Shell/Python脚本语言,熟悉常用的数据结构和算法,熟悉网络编程、多线程编程,有良好的编程习惯 3. 有分布式系统开发、大数据处理开发经验者优先;有Spark/Flink/Kafka分布式框架的实践并掌握原理,对源代码有一定研究者优先; 熟悉ElasticSearch、Lucene等开源项目,熟悉搜索引擎原理和代码实现者优先 4. 具备优秀的逻辑思维能力,对解决挑战性问题充满热情,善于解决问题和分析问题 5. 有强烈的上进心和求知欲,善于学习新事物 6. 良好的团队合作精神,较强的沟通能力和学习能力 7. 有广告在线系统经验者优先 地址:北京市亦庄京东总部 部门简介:               广告系统技术部作为京东平台运营与营销中心的核心团队,承接京东站内外流量商业化的系统建设工作,负责广告系统的整体架构设计和技术选型、高性能异构计算的设计和优化以及离线海量数据的存储与高时效计算。涵盖广告数据/物料流、 广告在线模型服务、广告在线播放、广告实时检索、广告数据系统等核心模块,涉及百亿吞吐高并发处理、海量数据的分布式存储、高效索引检索、在线高性能计算、离线大规模机器学习训练等技术,是京东技术栈最全面的团队之一。       我们拥有互联网广告业内一流的技术团队,有着丰富的行业经验和技术培养体系,作为我们技术团队的一员,你将有机会参与到各种创新性和有挑战性的项目中。你可以与各个领域的专业人员和同事合作,共同探索前沿的技术,有机会利用你的技术能力和个人兴趣来解决业务问题,创建出更丰富和更个性化的技术解决方案。       如果你具备创新意识和技术能力,渴望实现自己的人生价值和职业目标,我们诚挚地邀请你加入我们的技术团队,共同致力于技术创新和社会进步的使命!