• 20k-40k·15薪 经验1-3年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    岗位职责: 1、负责大规模稀疏模型的训练与推理过程的性能与效率优化,支持CPU/GPU 异构高性能模型工程大规模落地 2、设计与开发机器学习系统,包括数据读取,模型训练,参数存储,模型服务等,搭建上层应用与工作流等 3、协同算法业务团队优化模型效果与训练推理性能 岗位要求: 1、计算机,电子工程,通信等相关专业 2、熟悉C/C++/Python 或java编程语言,有扎实的计算机工程基础,有cuda编程实践经验,熟悉相关编译,调试,性能分析工具 3、学习能力强,有求知欲与自我驱动能力,良好的沟通能力与团队协作能力 4、有以下经验者优先: (1)了解搜索,广告,推荐系统,有相关领域算法与工程经验者优先 (2)有高并发服务设计与实践经验,有分布式系统/K8S调度/RPC框架等实践者优先 (3)熟悉GPU/cuDNN/Trition等,有GPU加速优化者经验者优先 (4)熟悉Tensorflow/HugeCtr/PadddlePaddle/Pytorch等深度学习框架,有框架二次开发经验者优先 (5)有编译优化相关(tensorRT/XLA/TVM等)相关实践者优先
  • 20k-40k 经验5-10年 / 硕士
    人工智能服务,物联网,制造业 / 不需要融资 / 150-500人
    岗位职责: 1)设计和建立深度学习框架测试架构,包括测试环境的搭建、自动化测试框架的选择和定制、测试工具的集成等。 2)分析业务需求和深度学习框架的特性,制定测试策略和规划,确保测试覆盖全面、自动化程度高。 3)编写和维护深度学习框架的自动化测试脚本,覆盖主要功能和常见场景,保证测试用例的全面性和有效性。 4)设计和实施测试数据管理和环境配置,确保测试环境的稳定性和一致性。 5)与开发团队协作,确保测试和开发过程的无缝集成,参与持续集成和持续部署流程。 6)领导和指导测试团队成员,确保团队掌握并熟练运用深度学习框架的测试技术和工具。 7)分析和评估测试结果,及时发现和解决问题,并提出优化建议,持续提升测试效率和质量。 8)跟踪和评估新的深度学习框架测试技术和工具,不断优化测试架构,保持技术领先地位。 任职要求: 1) 硕士及以上学历,计算机科学、软件工程或相关专业。 2) 具有深度学习框架测试经验,对TensorFlow、PyTorch等常见深度学习框架有深入了解。 3) 熟悉Python测试框架,如unittest、pytest等,并能够利用其进行测试用例的执行和管理,并能根据需求进行定制和扩展。 4) 熟练使用Python语言编写测试用例和自动化测试脚本,具有丰富的Python编程经验。 5) 能够利用Python编写高效、稳定的测试脚本,覆盖深度学习框架的主要功能和常见场景,确保测试用例的全面性和有效性。 6) 具备良好的团队合作精神和沟通能力,能够与团队成员和其他部门合作,推动项目进展。 7) 对新技术和新方法有敏锐的洞察力,能够及时跟踪和评估新的测试技术和工具,保持技术领先地位。 工作地点: 北京中关村,上海张江,杭州五常,嘉兴湘家荡
  • 20k-40k 经验3-5年 / 硕士
    人工智能服务,物联网,制造业 / 不需要融资 / 150-500人
    岗位职责: 1) 进行下深度学习框架算法的测试,包括功能测试、性能测试和兼容性测试,确保新框架的可用性。 2) 对主流算法模型进行全面测试,验证其在不同场景下的准确性、鲁棒性和效率,同时关注模型的集成和互操作性。 3) 测试用例开发: 制定并开发详细的测试用例,覆盖不同神经网络框架、算法和模型的各个方面,以确保测试的全面性和深度。 4) 自动化测试脚本编写: 编写自动化测试脚本,提高测试效率,确保测试的可重复性和持续性。 5) 分析测试结果,及时发现和报告问题,并协助开发团队解决问题。 6) 与产品经理和开发团队密切合作,了解产品需求和设计,确保测试工作符合业务需求。 7) 持续学习和探索新的测试方法和技术,不断提升测试水平和质量。 任职要求: 1) 设计并开发用于测试深度学习框架底层算子的详细测试用例,包括对各种算子的功能、性能、兼容性和边界条件进行全面测试。 2) 编写自动化测试脚本,提高测试效率,确保测试的可重复性和持续性。 3) 对不同底层算子的性能进行深入分析,识别潜在瓶颈,提出性能优化的建议。 4) 熟悉Python测试框架,如unittest、pytest等,并能够利用其进行测试用例的执行和管理,并能根据需求进行定制和扩展。 5) 对新技术和新方法有敏锐的洞察力,能够及时跟踪和评估新的测试技术和工具,保持技术领先地位。 工作地点: 北京中关村,上海张江,杭州五常,嘉兴湘家荡
  • 25k-50k 经验5-10年 / 本科
    音频|视频媒体,短视频 / 上市公司 / 500-2000人
    岗位职责: 1.负责酷狗音乐基础框架产品设计,对产品的基础体验负责; 2.不断清晰产品的核心用户价值,围绕核心体验持续打磨,形成行业内的口碑和竞争力; 3.关注同行业产品及数据情况,深入用户使用场景,挖掘新的用户需求痛点,推动产品持续创新及优化。 岗位要求: 1.本科及以上学历,5年及以上产品策划工作经验,计算机相关专业背景优先; 2.具有较强的逻辑思维,对于数据、用户需求具有敏感度; 3.具有优秀的沟通协调能力及较强责任心; 4.对互联网、音娱产品、内容产品熟悉优先。
  • 30k-60k·15薪 经验3-5年 / 硕士
    360
    信息安全 / 上市公司 / 2000人以上
    职责描述: 1. 优化大模型分布式训练速度; 2. 完善分布式训练框架,增加框架稳定性和扩展性 任职要求: 1. 学士及以上学历,计算机、电子、自动化等相关专业; 2. 熟悉Python,熟悉C/C++编程,编程能力优秀; 3. 熟练掌握TensorFlow/PyTorch等至少一种深度学习框架; 4. 熟练掌握TensorRT, XLA, TVM等深度学习编译器,能够基于这些编译器做二次开发或者加速应用; 5. 熟悉GPU等硬件架构,精通CUDA、cuDNN、NCCL,熟悉RDMA,Nvlink等互联技术; 6. 熟悉模型并行,数据并行,流水并行等分布式训练加速的基本原理; 7. 熟悉业界常见的分布式训练解决方案,例如Megatron, DeepSpeed等; 8. 有相关的项目背景优先。
  • 20k-35k·15薪 经验3-5年 / 本科
    金融 / 上市公司 / 2000人以上
    一、岗位描述 1. 框架产品及基础技术平台的研发、交付、运营,重点方向为容器云平台、ServiceMesh平台、同城双活、API网关等; 2. 调研行业趋势及解决方案,协同团队交付落地、攻克技术难题、推广运营; 二、任职要求 1. 本科及以上学历,计算机、信息技术或相关专业,3年以上互联网行业框架、中间件相关工作经验; 2. 精通Core JAVA,熟悉JAVA应用调优及排障,同时精通JAVA语言和GO语言者优先; 3. 精通操作系统、网络通信原理; 4. 精通容器技术、中间件,对分布式系统的原理有较为深刻的理解; 5. 有成功建设并运营框架产品和技术平台产品的经验优先; 6. 良好的团队合作和沟通能力,责任心强,对技术有追求;
  • 20k-30k 经验3-5年 / 硕士
    软件服务|咨询,物联网,人工智能服务 / 天使轮 / 15-50人
    1. AI模型的端侧部署和加速; 2. 优化边缘计算平台, 打造在边缘计算行业的核心竞争力; 3. 边缘计算芯片性能优化,包括高通,瑞星微等AI芯片的性能优化; 4. 底层AI框架通用性封装和优化,保障底层框架的稳定性及高效; 任职要求: 1. 计算机或电子相关专业本科或以上,3年以上相关工作经验; 2. 精通C/C++开发,熟悉多线程编程,掌握常用数据结构和算法; 3. 熟悉Linux系统,至少精通C/C++/Python中的一种。编码能力突出,热爱编程, 具有扎实的工程实现能力; 4. 对计算机架构有深入理解,特别是CPU、GPU、NPU; 5. 有扎实的异构计算、并行计算基础 (CUDA, OpenCL, GLSL, or NEON/AVX/SSE等),对某子领域有较深入研究者优先; 6. 有深度学习算法(计算机视觉,NLP,语音等)、深度学习模型量化与压缩、深度学习框架开发等方向的相关经验者优先; 7. 熟悉如下至少一种AI推理框架: MACE, Tensorflow Lite, PaddlePaddle Mobile, SNPE, TNN, ncnn等; 8.有下列相关经验者优先考虑: 有人工智能相关的系统架构、核心模块设计经验,参与过至少一个中大型的人工智能相关的框架研究与开发; 熟悉TensorFlow/PyTorch/ONNX/Caffe等主流深度学习框架; 有GPU/NPU/DSP或者相关异构计算平台开发和调优经验; 9. 拥有良好的团队协作和抗压能力,有技术热情。
  • 7k-14k·13薪 经验1-3年 / 本科
    人工智能,通讯电子 / 未融资 / 15-50人
    岗位职责: 1.负责Android内核裁剪、驱动程序开发维护工作; 2.为硬件平台移植优化Bootloader和Firmware; 3.为硬件设备设计、开发和测试底层驱动,并撰写文档 任职要求: 1.两年以上Android系统开发工作经验,JAVA技术基础扎实和良好的C++基础; 2. 熟悉Android系统的工作原理,了解音频(TinyAlsa)、显示(SurfaceFlinger、DMS)等底层架构 3.具有Bootloader(U-boot等)开发经验; 4.具有Linux设备(Nand Flash、CAN、Video4Linux、USB等)驱动开发经验; 5.熟悉ARM处理器,具备相关硬件知识;熟悉Android系统框架(系统启动、后台进程、Framework等); 6.良好的沟通及团队合作能力;
  • 6k-10k 经验在校/应届 / 硕士
    人工智能,工具 / 天使轮 / 15-50人
    岗位职责: 1.负责开源湖仓一体框架 LakeSoul 的研发工作; 2.负责框架、平台的功能或性能优化,参与到从方案设计、原型验证、调优测试的全过程中来; 3.支撑公司产品线、业务线的项目推进; 任职要求: 1.对开源计算框架或分析引擎的实现原理,如 Spark、Presto、Clickhouse 等有了解,或者有兴趣深入研究; 2.对流批一体、湖仓一体等概念和实现有研究,了解过 LakeSoul、 Iceberg、Hudi 等代码实现; 3.对系统底层,包括网络、存储等有浓厚兴趣;对性能分析和调优有经验;对分布式系统、并行计算有浓厚兴趣; 4.熟悉 Linux 开发环境,有良好的至少一门系统语言 (C/C++、Java、Scala、Golang、Rust 等) 开发调试经验; 5.思维敏捷,有较强的钻研学习能力和自我驱动力,较好的沟通和团队合作能力。 公司简介:数元灵科技专注于一站式湖仓智能平台新基建,在研项目包括云原生湖仓一体框架LakeSoul,一站式机器学习框架MetaSpore, 以及云原生一站式AI开发生产平台AlphaIDE。 致力于帮助企业充分释放业务价值,服务新基建,让数据智能触手可及。 实习薪资:300-500元/天,按照实际出勤天数发放 实习时间:不低于三个月,每周至少出勤4天(优秀者可转正) 上班时间:9:30 -下班时间:18:30
  • 15k-30k 经验3-5年 / 本科
    医疗|健康 / 天使轮 / 500-2000人
    *面议 职位描述: 一、岗位名称:系统架构师 二、职责描述: 1.负责技术系统总架构(平台、数据库、接口、应用架构、客户端等)设计与实现; 2.解决系统中的关键架构问题和技术难题,对系统进行性能调优,负责项目中关键技术难点的攻关和研发; 3.负责医保业务平台的应用系统架构设计,负责平台的核心架构设计,进行技术研究和公关工作; 4.构建高可用、高并发、可伸缩的分布式系统,满足业务需求和用户规模,带领团队设计并持续改进产品的整体架构、功能模块、开发需求,提高用户体验; 5.负责医保业务线的核心系统的总体架构设计与重要模块的详细设计,控制设计的质量; 三、任职要求: 1.10年以上开发工作经验,5年以上架构设计经验; 2.具备5年以上医疗行业应用系统架构设计及开发经验; 3.至少负责过一款中大型系统的架构设计和重构工作; 4.精通JavaC等编程语言、常用数据结构及算法,精通JVM原理,能对JVM进行性能调优; 5.精通设计模式及多线程并发设计,有丰富的Linux平台开发及网络编程经验; 6.精通Java生态系统,精通Spring、Zookeeper、RabbitMQ、Redis、Kafka、Nginx等开源基础设施,熟悉分布式开发框架; 7.熟悉redis、kafka、dubbo、cloud、springcloud等常用框架或中间件的使用和优化及基于此的架构设计; 8.精通MySQL、Oracle、PostgreSQL等常用数据库,具有较强的数据库编写、优化能力,能独立分析并设计高并发分布式数据库; 9.熟悉领域驱动设计思想,逻辑清晰,分析问题解决问题能力强,能分析和把握问题的本质复杂性; 10.思路清晰,有良好的沟通表达能力和跨团队协调能力,乐于寻求挑战和突破自我。
  • 30k-50k 经验不限 / 本科
    人工智能服务 / B轮 / 150-500人
    职位描述 负责对推理引擎框架进行优化,推进AI编译代码生成,运行时调度策略, GPU设备显存优化,计算图优化等全栈式工作。 职位要求 1、对主流的AI框架后端(TVM/JAX/XLA/TORCH JIT)等有比较深入的理解使用, 熟悉相关的代码生成, schedule,编译器模型; 2、熟悉MLIR相关的内容,工具链使用开发; 3、有计算机体系结构背景,熟悉芯片架构/微架构(包括CPU/GPU/SoC/FPGA等),有软硬件协同设计经验优先。
  • 30k-50k 经验不限 / 本科
    人工智能服务 / B轮 / 150-500人
    职位描述 负责对推理引擎框架进行优化,推进AI编译代码生成,运行时调度策略, GPU设备显存优化,计算图优化等全栈式工作。 职位要求 1、对主流的AI框架后端(TVM/JAX/XLA/TORCH JIT)等有比较深入的理解使用, 熟悉相关的代码生成, schedule,编译器模型; 2、熟悉MLIR相关的内容,工具链使用开发; 3、有计算机体系结构背景,熟悉芯片架构/微架构(包括CPU/GPU/SoC/FPGA等),有软硬件协同设计经验优先。
  • 10k-18k 经验3-5年 / 不限
    游戏 移动互联网 / 不需要融资 / 50-150人
    1、熟悉node.js服务端编写(棋牌游戏) ,能在现在有的源码上修改,进行二次开发。 2,有网络游戏/棋牌游戏等经验 2、精通cocos,c++熟悉TCP/IP,socket,数据库等方面编程; 3、具有良好的编程习惯、独立承担工作的能力、快速学习能力、分析解决问题能力优先考虑; 4、参与游戏服务端框架的设计开发,负责游戏服务端协议的设计开发 5、对游戏开发有浓厚兴趣,有游戏行业(棋牌类游戏)开发搭建)的工作经验者优先;
  • 硬件 / A轮 / 500-2000人
    工作职责 1.参与主流机器学习框架与摩尔线程软硬件栈的对接,模型优化和部署; 2.参与机器学习单GPU以及分布式训练技术的研究与实现,如各种并行与异构计算技术的设计、开发以及与性能优化; 3.参与研究并实现适合摩尔线程自研GPU的模型优化和压缩方法。 任职资格 1.熟悉Linux开发环境,精通C++和Python,具备良好扎实的算法基础、良好的编程风格和系统设计能力; 2.深入理解典型的深度学习算法(如CV和NLP模型),主流深度框架(如TensorFlow、PyTorch、MxNet、Caffe、PaddlePaddle等)开发或优化经验; 3.或有深度学习编译器(如XLA、TVM、Glow、NGraph)等软件栈的开发经验; 4.精通分布式训练技术,有参数服务器、多维并行、显存交换等技术的深入研究与开发者可优先考虑; 5.有机器学习模型性能调优和模型压缩(量化、剪枝、蒸馏、NAS等)经验者可优先考虑; 6.精通并行计算通信库(如MPI),有丰富的CUDA并行编程和典型机器学习算子开发经验者可优先考虑; 7.有强烈的工作责任心,较好的学习能力、沟通能力和自驱力。
  • 硬件 / A轮 / 500-2000人
    工作职责 1.参与主流机器学习框架与摩尔线程软硬件栈的对接,模型优化和部署; 2.参与机器学习单GPU以及分布式训练技术的研究与实现,如各种并行与异构计算技术的设计、开发以及与性能优化; 3.参与研究并实现适合摩尔线程自研GPU的模型优化和压缩方法。 任职资格 1.熟悉Linux开发环境,精通C++和Python,具备良好扎实的算法基础、良好的编程风格和系统设计能力; 2.深入理解典型的深度学习算法(如CV和NLP模型),主流深度框架(如TensorFlow、PyTorch、MxNet、Caffe、PaddlePaddle等)开发或优化经验; 3.或有深度学习编译器(如XLA、TVM、Glow、NGraph)等软件栈的开发经验; 4.精通分布式训练技术,有参数服务器、多维并行、显存交换等技术的深入研究与开发者可优先考虑; 5.有机器学习模型性能调优和模型压缩(量化、剪枝、蒸馏、NAS等)经验者可优先考虑; 6.精通并行计算通信库(如MPI),有丰富的CUDA并行编程和典型机器学习算子开发经验者可优先考虑; 7.有强烈的工作责任心,较好的学习能力、沟通能力和自驱力。