• 30k-60k·16薪 经验5-10年 / 本科
    居住服务 / 上市公司 / 2000人以上
    工作职责: 1.打造贝壳自己的异构计算平台, 应对大模型训练、推理对基础设施的挑战,帮助贝壳实现智能化的目标. 工作内容: 1.深入理解业务需求, 帮助业务快速有效的使用深度学习; 2.负责深度优化核心计算库,包括服务器的异构计算框架以及常用计算库优化; 3.负责模型结构在不同硬件上压缩,量化,稀疏化,裁剪方面的加速落地实现; 4.负责算法性能评估和分析,制定技术规划和性能标准,关键竞争力补齐 5.异构计算平台的产品化和服务化. 任职资格: 1.熟悉主流的并行编程以及性能优化技术,如Nvidia GPU,华为昇腾NPU等; 2.对XLA,TVM,自动化编译方面熟悉的优先; 3.熟悉大模型训练和推理加速等经验优先; 4.有很强的分析问题和解决问题的能力,有强烈的责任心;
  • 18k-25k 经验1-3年 / 本科
    人工智能服务 / 上市公司 / 150-500人
    岗位职责: 1. 负责将基于深度学习的视觉算法部署在从端到边到云的各种硬件上,并从多角度优化以发挥具体平台的性能; 2. 设计并实现跨平台的调度框架,在多种平台上的高性能基础组件,兼顾各层次的并行和异构调度,及具体算子的汇编级优化,为公司各产品线提供支撑; 3. AutoML 及 模型的自动发布系统研发。 任职要求: 1. 计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力; 2. 熟悉计算机体系结构以及并行计算基本技术; 3. 熟悉任意一种深度学习框架者优先; 4. 对以下一种或多种技术有深入研究和实践经验的优先:有CPU或GPU体系结构调优经验;熟悉相关平台汇编指令,熟悉多核并行编程;有嵌入式多协处理器结构性能调优经验; 5. 有矩阵运算,计算机视觉和图像处理算法在各种硬件设备移植经验的优先; 6. 对高性能计算,异构计算和性能优化工作有强烈的兴趣。
  • 20k-40k·14薪 经验3-5年 / 本科
    人工智能服务 / 上市公司 / 150-500人
    岗位职责: 1. 负责将基于深度学习的视觉算法部署在从端到边到云的各种硬件上,并从多角度优化以发挥具体平台的性能; 2. 设计并实现跨平台的调度框架,在多种平台上的高性能基础组件,兼顾各层次的并行和异构调度,及具体算子的汇编级优化,为公司各产品线提供支撑; 3. AutoML 及 模型的自动发布系统研发。 任职要求: 1. 计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力; 2. 熟悉计算机体系结构以及并行计算基本技术; 3. 熟悉任意一种深度学习框架者优先; 4. 对以下一种或多种技术有深入研究和实践经验的优先:有CPU或GPU体系结构调优经验;熟悉相关平台汇编指令,熟悉多核并行编程;有嵌入式多协处理器结构性能调优经验; 5. 有矩阵运算,计算机视觉和图像处理算法在各种硬件设备移植经验的优先; 6. 对高性能计算,异构计算和性能优化工作有强烈的兴趣。
  • 20k-35k 经验3-5年 / 本科
    硬件 / 上市公司 / 500-2000人
    工作职责: 2. 熟练掌握C/C++/Fortran/Python及常用数据结构算法,动手能力强,有较强的算法分析及编程能力 3. 具备扎实的算法和数据结构基础,熟悉程序的编译、调试和优化流程 4. 具备算法优化能力,具有数学库优化开发经验优先 5. 具有CUDA/HIP/OpenCL/MPI等并行计算程序开发与优化经验优先 6. 熟悉Caffe/Tensorflow/MXNet等任意一种深度学习开源框架,有深度学习框架开发和优化经验优先 7. 练阅读相关领域英文论文并能实现 8. 具备良好的逻辑沟通能力和解决实际问题的能力 任职资格: 岗位职责: 1. 基于异构计算平台的算法优化和移植工作 2. 人工智能领域框架移植和性能优化任职资格 3. 参与处理器编译器开发; 4 .参与处理器编译工具链开发与维护; 5. 分析处理器性能,进行性能测试、分析与优化;
  • 20k-35k 经验3-5年 / 硕士
    硬件 / 上市公司 / 500-2000人
    工作职责: 2. 熟练掌握C/C++/Fortran/Python及常用数据结构算法,动手能力强,有较强的算法分析及编程能力 3. 具备扎实的算法和数据结构基础,熟悉程序的编译、调试和优化流程 4. 具备算法优化能力,具有数学库优化开发经验优先 5. 具有CUDA/HIP/OpenCL/MPI等并行计算程序开发与优化经验优先 6. 熟悉Caffe/Tensorflow/MXNet等任意一种深度学习开源框架,有深度学习框架开发和优化经验优先 7. 练阅读相关领域英文论文并能实现 8. 具备良好的逻辑沟通能力和解决实际问题的能力 任职资格: 岗位职责: 1. 基于异构计算平台的算法优化和移植工作 2. 人工智能领域框架移植和性能优化任职资格 3. 参与处理器编译器开发; 4 .参与处理器编译工具链开发与维护; 5. 分析处理器性能,进行性能测试、分析与优化;
  • 智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 岗位职责: 1.跟踪研究高性能异构计算前沿技术; 2.研究FPGA算法实现与性能优化方法; 3.研究FPGA、MCU、自毁等硬件保护方案; 4.研究高性能矩阵计算在FPGA、GPU上的硬件实现。 职责要求: 1.电子、通信、自动化等相关专业,硕士及以上学历; 2.精通Verilog/VHDL编程语言,精通时序约束、时序分析方法; 3.熟练使用仿真调试工具和掌握FPGA集成套件开发流程,如Vivado、ISE、QuestaSim; 4.参与过大型FPGA项目开发,具有PCIe,DDR3,SRIO,JESD204等高速接口逻辑设计经验; 5.具备MCU安全芯片相关开发经验者优先; 6. 极强的工作责任心,良好的团队协作精神,优秀的表达和沟通能力,乐于挑战,抗压力强。
  • 智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 岗位职责: 1.高性能计算、大数据、人工智能方向融合研究 2. 针对特定的计算平台(CPU/GPU/intel PMEM/RDMA)进行高性能计算加速,编译优化 3. 对机器学习(深度学习)中的计算问题进行研究,实现模型训练&推理的性能最大化。 4. 研究高性能计算中并行编程的使用和实现的挑战,完成关键应用&算法在分布式异构计算平台的高性能交付; 任职要求: [1] 计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力; [2] 熟悉计算机体系结构以及并行计算基本技术。 [3] 对下面至少一种技术有研发经验: a. 具有arm,x86,risc-v或者mips等至少一种CPU性能调优经验,熟悉相关平台体系结构和汇编指令,熟悉多核并行编程。 b. 对Ti6678,Hexagon HVX,Cadence Tensilica或者CEVA等至少一种DSP有算法开发移植和调优经验。 c. 对Graphcore,Habana,华为昇腾,寒武纪,燧原,比特大陆等任一款深度学习加速器有模型适配,调优,训练平台或推理引擎开发经验。 [4] 有代数矩阵运算、信号处理、计算机视觉和图像处理算法在不同处理器上移植和调优经验的优先。 [5] 对云和服务器集群有调优经验的优先;有开发运营过开源软件或者为知名开源软件贡献过代码的优先。 [6] 对高性能计算,异构计算,体系结构和性能优化工作有强烈的兴趣的优先。
  • 25k-50k·16薪 经验3-5年 / 本科
    新能源汽车制造 / 未融资 / 2000人以上
    一、岗位职责: 1. 协同软件架构师针对特定计算平台设计智能驾驶软件架构 ; 2. 根据智能驾驶业务需求负责系统异构计算平台功能数据流业务实现 ; 3. 基于目标计算平台及软件业务需求实现高效数据吞吐,优化系统时延及计算资源开销; 4. 实现传感器抽象,硬件抽象,系统及软件模块业务和调度 ; 5. 实现基于SOA的智驾相关服务应用开发; 6. 针对智驾异构传感器,实现相关的高效数据流模块,支持上层应用业务。 二、岗位需求: 1. 本科或以上学历,计算机或相关专业本科及以上学位; 2. 精通至少一门编程语言(C++优先),注重编码规范; 3. 有异构计算平台研发经验优先,有智能驾驶功能研发方面经验优先; 4. 熟悉Linux操作系统;具有DDS,ROS,IPC, SHM等开发经验 ; 5. 良好的沟通表达能力,团队合作能力 。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责火山引擎-机器学习平台的研发,聚焦AI算法工程师的体验,从机器学习系统、云原生、云计算架构等多个层面进行技术探索和攻坚,帮助客户实现高性能、高资源利用率的高性能计算平台; 2、设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。 职位要求: 1、熟悉Linux平台下的分布式系统的开发及运维,三年及以上Golang/Python/C/C++/Java/Scala的开发经验,ACM/ICPC/Codeforces等获奖者优先; 2、能够从产品思维、机器性能和稳定性、团队协作等多种视角,高标准要求自己的技术方案和每一行代码; 3、对如下一个或多个领域有经验,或者无经验但有浓厚的兴趣(须额外付出时间进行深入研究和探索): a. 云原生:Kubernetes(调度器/CSI)、容器系统、大规模训练任务和推理服务的编排、在离线混部及资源调度、微服务网格和流量治理、Terraform等; b. 云计算:云存储、网络虚拟化、云安全、混合云、技术商品化探索等; c. 机器学习:Pytorch/Tensorflow/JAX/PaddlePaddle/Mindspore等机器学习框架、GPU/NPU/ARM等最新异构计算系统与架构、RDMA高性能网络。
  • 15k-30k·13薪 经验不限 / 本科
    移动互联网,企业服务 / B轮 / 15-50人
    团队介绍: 构建基于 Kubernetes 的机器学习平台 OpenBayes 提供从数据标注到模型部署的全流程服务。致力于不断降低机器学习体系的使用门槛,加速从原始数据到最终应用的转化。 职位介绍: 针对机器学习场景,围绕 Kubernetes 生态构建支撑组件,应用场景包括线上 JupyterLab 的编排 CRD、线上服务 CRD、跨节点机器学习任务 CRD 等。 职位职责: 1.平台已有的 CRD / Controller / Operator 的维护; 2.对 Kubernetes 的组件做扩展,实现特定的调度策略,支持不同硬件的调度流程; 3.按照业务需求构建 extended resource 实现异构计算资源的调度; 4.其他组件构建与维护。 职位要求: 1.本科及以上学历; 2.熟练应用 Go/Python/Java 等编程语言之一或多个,Go 语言最佳; 3.有一定的 Kubernetes 开发经验,了解其底层原理; 4.计算机基础扎实,有基本的算法和数据结构基础知识; 5.自主学习能力强,有意愿接受新技术并进入新领域,有良好的沟通能力和团队协作能力。 加分项: 1.了解并使用过基于 k8s 的机器学习训练框架 kubeflow 或其他; 2.对分布式系统管理有实践经验,对该领域有很大的热情; 3.了解云原生体系,对其生态有所了解。
  • 20k-40k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、参与字节跳动数据中心硬件加速项目的落地实施,负责异构计算基础软件栈的开发与调试; 2、与硬件研发团队高度协同,进行软硬一体化开发,包括但不限于功能开发、驱动开发、性能调优; 3、探索FPGA/ASIC/GPU/RISC-V、CXL等领域技术趋势及业界实践,论证新技术在字节跳动业务场景的价值及落地可行性。 职位要求: 1、熟悉计算机体系架构,对X86、ARM、RISC-V、GPU四种体系结构至少深入理解一种,理解其微架构、主要指令集等; 2、精通 C / C++ 等开发语言; 3、熟悉 Linux KMD / UMD 开发框架,有实际的高性能驱动开发经验,熟悉 SMMU / IOMMU,DMA,Interrupt,VFIO 等相关模块; 4、深入理解Linux内核,至少阅读过一个主要子系统(调度,网络,I/O,内存,存储,网络等)的源代码,熟悉PCIe协议和设备驱动; 5、具备较强的Linux内核和用户态程序故障定位及Profiling能力。 加分项: 1、熟悉主流硬件虚拟化技术,深入理解CPU虚拟化、内存虚拟化、IO虚拟化(VirtIO、设备直通技术)、DPDK、SPDK中的至少一种; 2、熟悉 AI 加速器 Runtime,Inference / Training Framework,有实际开发和性能优化经验; 3、对CXL等内存一致性协议及应用场景有一定了解,有相关异构内存架构设计经验者; 4、对OpenCL、CUDA等异构计算平台、机器学习、大数据技术、K8S技术之一或以上有一定理解者; 5、熟悉 NIC / RDMA 等内核网络协议栈和驱动设计实现, 熟悉计算机网络, 了解集合通信库(ex: NCCL)和相关算法(ex: Allreduce)的设计实现与性能分析优化。
  • 20k-30k 经验3-5年 / 硕士
    软件服务|咨询,物联网,人工智能服务 / 天使轮 / 15-50人
    1. AI模型的端侧部署和加速; 2. 优化边缘计算平台, 打造在边缘计算行业的核心竞争力; 3. 边缘计算芯片性能优化,包括高通,瑞星微等AI芯片的性能优化; 4. 底层AI框架通用性封装和优化,保障底层框架的稳定性及高效; 任职要求: 1. 计算机或电子相关专业本科或以上,3年以上相关工作经验; 2. 精通C/C++开发,熟悉多线程编程,掌握常用数据结构和算法; 3. 熟悉Linux系统,至少精通C/C++/Python中的一种。编码能力突出,热爱编程, 具有扎实的工程实现能力; 4. 对计算机架构有深入理解,特别是CPU、GPU、NPU; 5. 有扎实的异构计算、并行计算基础 (CUDA, OpenCL, GLSL, or NEON/AVX/SSE等),对某子领域有较深入研究者优先; 6. 有深度学习算法(计算机视觉,NLP,语音等)、深度学习模型量化与压缩、深度学习框架开发等方向的相关经验者优先; 7. 熟悉如下至少一种AI推理框架: MACE, Tensorflow Lite, PaddlePaddle Mobile, SNPE, TNN, ncnn等; 8.有下列相关经验者优先考虑: 有人工智能相关的系统架构、核心模块设计经验,参与过至少一个中大型的人工智能相关的框架研究与开发; 熟悉TensorFlow/PyTorch/ONNX/Caffe等主流深度学习框架; 有GPU/NPU/DSP或者相关异构计算平台开发和调优经验; 9. 拥有良好的团队协作和抗压能力,有技术热情。
  • 25k-50k·15薪 经验3-5年 / 本科
    智能硬件 / 上市公司 / 2000人以上
    一、 岗位职责 承担FPGA相关的技术研发工作,具体工作内容包括项目需求分析、系统方案论证、技术调研、设计、开发、仿真、验证、产品测试等; 承担编写技术资料、申请专利、参与技术交流等工作; .负责fpga/asic的逻辑设计与实现; 编写testbench,完成fpga/ASIC模块级逻辑仿真及验证; 配合硬件和软件团队进行系统的调试与测试; 负责完成上级领导指派的临时性任务。 二、 岗位要求 电子工程、微电子、集成电路设计、通信工程或计算机等相关专业,本科生6年以上,研究生3年以上fpga设计经验; 熟练掌握verilog/VHDL,有中等规模fpga/asic项目经验; 熟悉Altera/XILINX FPGA芯片或ASIC流程; 熟练掌握quartus, vivado, modelsim, ncsim等工具; 熟悉多种接口规范及设计(pcie,ddr3/4,MIPI),有pcie和ddr3/4设计与验证经验者优先; 熟悉PCIe协议、MIPI协议、以太网MAC/TCP/IP者优先; 具有基于FPGA处理大规模网络流量查找、转发、异构计算开发经验者优先; 具有基于FPGA的虚拟化、网络和存储硬件加速开发经验者优先; 善于学习和钻研,有较强的分析问题和解决问题能力; 富有团队合作精神,具有较强的沟通能力,能与硬件工程师和软件工程师共同完成项目的开发。
  • 50k-80k 经验5-10年 / 本科
    金融 / 未融资 / 500-2000人
    岗位描述: 1. 理解太初AI芯片基础软件的架构,负责根据研发需求,和技术骨干、架构师等相关人员共同制定软件研发计划。 2. 负责软件开发进度的把控,及时询问开发人员开发过程中遇到的问题,指导或者召开技术专题讨论会解决问题,保证软件研发的正常执行;分析软件研发的风险,并进行预案。 3. 负责软件开发流程的把控,负责日常code review,doc review,code merge工作的进行,监督保证部门代码风格、代码质量,负责技术文档整理,整理收集必要的技术文档和验收文档,并将其有组织的整理在公司知识库里。 4. 负责软件开发的对内对外对接工作,确保外包项目、部门间协作的正常运行。 5. 负责软件产品的知识产权保护,包括设计方案的专利风险分析与创新设计的专利保护。 职位要求: 1、计算机、软件工程等相关专业,本科及以上学历,硕士以上学历者优先; 2、熟练掌握C和C++语言,有大型软件的开发经验,具有5年以上开发经验; 3、熟悉运行时库、内核驱动者优先; 4、熟悉异构计算体系结构,了解CUDA、HIP、HSA、OpenCL、Vulkan、Sycl、oneAPI者优先; 5、热爱技术,学习能力强,敢于吃苦,责任心强;
  • 4k-8k 经验在校/应届 / 本科
    移动互联网,企业服务 / B轮 / 15-50人
    职位职责: 1. 平台已有的 CRD / Controller / Operator 的维护; 2. 对 Kubernetes 的组件做扩展,实现特定的调度策略,支持不同硬件的调度流程; 3. 按照业务需求构建 extended resource 实现异构计算资源的调度; 4. 其他组件构建与维护。 职位要求: 1. 本科及以上学历; 2. 熟练应用 Go/Python/Java 等编程语言之一或多个,Go 语言最佳; 3. 有一定的 Kubernetes 开发经验,了解其底层原理; 4. 计算机基础扎实,有基本的算法和数据结构基础知识; 5. 自主学习能力强,有意愿接受新技术并进入新领域,有良好的沟通能力和团队协作能力; 6. 实习时间至少三个月,每周至少三天。 加分项: 1. 了解并使用过基于 k8s 的机器学习训练框架 kubeflow 或其他; 2. 对分布式系统管理有实践经验,对该领域有很大的热情; 3. 了解云原生体系,对其生态有所了解。 实习期间表现良好有正式入职机会。