• 30k-60k·15薪 经验3-5年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    1、职位描述  负责公司机器学习平台计算引擎开发,为平台提供稳定易用、高性能的计算引擎。  业内机器学习系统与平台前沿技术进展跟进调研、落地。  参与模型训练、模型服务等机器学习相关项目的开发。  2、职位要求  1、计算机基础扎实,熟悉C/C++,具备系统软件开发架构能力。熟悉计算机体系结构以及并行计算基本技术。  2、熟悉GPU硬件架构,熟悉GPU  软件栈(CUDA,cutlass),具备 GPU 性能分析的经验。  2、至少熟悉一种主流深度学习编程框架(TensorFlow/PyTorch/Paddle)并了解底层原理;熟悉Megatron/DeepSpeed/ColossalAI等开源框架和系统优先。  3、在机器学习、深度学习、大规模分布式机器学习以及在搜索、广告、推荐、机器翻译等领域有经验者优先。  4、有大型预训练大模型落地项目,包括大语言(Large Language  Modeling, LLM),视频大模型或者多模态大模型相关经验优先。
  • 18k-23k·14薪 经验3-5年 / 硕士
    人工智能服务,IT技术服务|咨询,数据服务|咨询 / 不需要融资 / 50-150人
    工作职责: 1.大规模分布式深度学习系统的设计和开发; 2.模型算法与智能计算软硬件系统协同优化; 3.深度学习平台前沿技术跟研和技术发展路线规划; 4.常驻无锡工作。 任职资格: 1.***硕士及以上学历,具有3年及以上工作经验,计算机科学与技术、软件工程等相关专业。 2.良好的软件开发素养,熟练使用Linux操作系统,掌握shell、C/C++、Python等编程语言,熟悉设计模式、网络通信、多线程编程、计算机体系结构等技术者优先; 3.熟练使用一种以上深度学习框架(tensorflow/pytorch/caffe/mxnet等); 4.掌握分布式机器学习架构及优化算法,有华为、百度或其它国产AI芯片上进行算法移植和优化经验者优先; 5.在国内外高水平刊物或会议上发表过人工智能相关学术论文者优先。
  • 15k-26k 经验3-5年 / 本科
    人工智能服务,科技金融 / 不需要融资 / 500-2000人
    岗位职责: (1)负责兴业银行分布式应用开发平台的设计、研发、维护工作,参与兴业银行研发规范制定、故障排查、平台安全加固等工作; (2)参与兴业银行重要系统、关键技术能力的建设。 岗位要求: (1)3年以上丰富的工程实践经验;深入理解常见系统架构模型,具备大规模分布式系统建设经验; (2)熟悉SpringCloud、SOFA、ServiceComb、Dubbo等分布式开发框架,具备源码项目实践经验; (3)深入研究过Netty、JVM内部运行机制,具备丰富的故障定位能力; (4)具备应用网关、分布式事务、批量作业、分布式锁、分库分表、分布式id、服务编排等分布式关键技术解决方案设计和实现能力; (5)了解大规模分布式系统关键技术能力,如系统单元化、双活/多活、全链路灰度发布等; (6)在复杂系统架构和功能实现场景中,具备技术抽象能力,能够提取通用技术组件并不断持续优化。 符合以下一项或多项条件者优先: (1)曾负责或深度参与大中型金融或互联网企业的开发平台建设者; (2)曾负责或深度参与大中型金融核心系统相关建设者; (3)对ServiceMesh落地、云原生相关技术、Go语言熟练使用相关经验者; (4)具有大型互联网技术及中台的研发和架构经验优先; (5)对技术有追求,对知名开源组件有重要贡献或在开源社区有相关优秀作品者。 工作地点:上海、福州、成都
  • 18k-28k 经验3-5年 / 本科
    人工智能服务,科技金融 / 不需要融资 / 500-2000人
    岗位职责: (1)负责兴业银行分布式应用开发平台的设计、研发、维护工作,参与兴业银行研发规范制定、故障排查、平台安全加固等工作; (2)参与兴业银行重要系统、关键技术能力的建设。 岗位要求: (1)3年以上丰富的工程实践经验;深入理解常见系统架构模型,具备大规模分布式系统建设经验; (2)熟悉SpringCloud、SOFA、ServiceComb、Dubbo等分布式开发框架,具备源码项目实践经验; (3)深入研究过Netty、JVM内部运行机制,具备丰富的故障定位能力; (4)具备应用网关、分布式事务、批量作业、分布式锁、分库分表、分布式id、服务编排等分布式关键技术解决方案设计和实现能力; (5)了解大规模分布式系统关键技术能力,如系统单元化、双活/多活、全链路灰度发布等; (6)在复杂系统架构和功能实现场景中,具备技术抽象能力,能够提取通用技术组件并不断持续优化。 符合以下一项或多项条件者优先: (1)曾负责或深度参与大中型金融或互联网企业的开发平台建设者; (2)曾负责或深度参与大中型金融核心系统相关建设者; (3)对ServiceMesh落地、云原生相关技术、Go语言熟练使用相关经验者; (4)具有大型互联网技术及中台的研发和架构经验优先; (5)对技术有追求,对知名开源组件有重要贡献或在开源社区有相关优秀作品者。 工作地点:上海、福州、成都
  • 16k-32k 经验3-5年 / 硕士
    工具类产品 / 上市公司 / 2000人以上
    岗位名称:搜索、推荐算法工程师 岗位职能:算法工程师 工作年限:3-5年 学历要求:硕士及以上 工作职责: 负责如下场景的模型训练以及落地 1、自然语言处理场景;任务举例:文本分类、实体识别、query 分析、分词、情感分析等; 2、搜索、推荐召回场景;任务举例:基于 Query 的召回、基于 item 的召回等; 3、搜索、推荐精排场景; 岗位需求: 1、对数据敏感,具有优秀的逻辑思维能力,善于分析问题,解决问题; 2、精通主流深度学习框架:Tensorflow、PyTorch 等; 3、深刻理解机器学习和深度学习算法原理;对 query 分析、相关性、召回模型、机器学习 排序有深刻的理解和应用经验; 4、深刻理解深度学习算法的训练,可根据不同业务场景对模型本身进行调优,精通训练数 据的构造、训练超参的调整; 5、熟悉主流 NLP 算法及推荐算法,比如:BERT 模型、DSSM、ESMM、CRF、GNN 等; 6、有复现论文模型的相关经验; 7、有深度学习部署框架(Triton、Onnx、TFServing 之一)相关业务应用的落地经验; 8、了解大数据(Spark、Hive)技术; 9、熟悉 Java,有工程落地经验者优先;
  • 30k-60k·15薪 经验3-5年 / 硕士
    360
    信息安全 / 上市公司 / 2000人以上
    职责描述: 1. 优化大模型分布式训练速度; 2. 完善分布式训练框架,增加框架稳定性和扩展性 任职要求: 1. 学士及以上学历,计算机、电子、自动化等相关专业; 2. 熟悉Python,熟悉C/C++编程,编程能力优秀; 3. 熟练掌握TensorFlow/PyTorch等至少一种深度学习框架; 4. 熟练掌握TensorRT, XLA, TVM等深度学习编译器,能够基于这些编译器做二次开发或者加速应用; 5. 熟悉GPU等硬件架构,精通CUDA、cuDNN、NCCL,熟悉RDMA,Nvlink等互联技术; 6. 熟悉模型并行,数据并行,流水并行等分布式训练加速的基本原理; 7. 熟悉业界常见的分布式训练解决方案,例如Megatron, DeepSpeed等; 8. 有相关的项目背景优先。
  • 20k-40k·14薪 经验3-5年 / 本科
    移动互联网,广告营销 / 上市公司 / 2000人以上
    工作职责: 1.参与研发分布式存储平台的建设工作,包括对象存储/块存储/文件存储等系统具体模快的设计、开发及优化; 2.主导存储平台的架构设计以及优化,保障存储系统在高并发场景下的可靠、低延迟、高可用等特性; 3.持续学习业界成熟方案,主导公司存储技术栈的优化和演进,以产品为驱动,支撑搜狐内部各个业务线在存储端的各类需求。 任职资格: 1.*****本科及以上学历,计算机相关专业; 2.3年及以上分布式存储相关工作经验; 3.熟练掌握Golang/Java/C++等语言进行开发(至少熟练掌握一种); 4.有扎实的算法基础,能灵活应用各种常见的数据结构; 5.有实际分布式项目开发经验,有实现高性能高可用服务的经验; 6.熟悉IO栈、多线程、RPC、Zookeeper、Etcd等基础框架,有一定架构设计经验,熟悉分布式系统的设计和应用,了解分布式常用技术原理 ; 7.熟悉业界主流分布式存储产品者优先,如AWS-S3、CEPH,HDFS,HBASE等; 8.对云原生的监控和报警解决方案有比较深入理解; 9.有对象存储,块存储,NOSQL存储或其他大规模数据存储系统开发运维经验者优先考虑。
  • 15k-30k 经验5-10年 / 本科
    金融 / 上市公司 / 2000人以上
    工作职责 1、参与平安云分布式存储建设工作,保证生产系统稳定运行; 2、熟悉常见的云存储产品功能、特点,参与云存储产品规划,思考并提出建议; 3、参与云存储系统核心功能的设计、开发工作; 4、保证云存储生产运行中的系统稳定运行,了解其运行情况,对问题及时进行诊断及解决; 5、与关联系统团队保持良好沟通及协作,保证各项工作稳定开展。 任职要求 1、熟悉Linux环境编程, 具有3年以上的后台开发经验 ; 2、掌握基础网络协议(TCP、HTTP等)知识,熟悉网络编程和网络服务框架等; 3、具有扎实的编程基础,熟练掌握至少一门语言c/c++/python/go/java,如无go语言经验,愿意转go; 4、追求高品质代码,对工程质量有深刻认识, 注重模块化、单元测试、异常测试; 5、熟练掌握常用数据结构和算法,熟悉多线程编程技术,熟悉分布式协议(如Paxos/Raft/Zab等) ; 6、有较强的学习能力,有强烈的求知欲和进取心,能及时关注和学习业界最新技术。 满足以下条件者优先: 1、有大规模对象、文件、块存储或数据库等项目相关经验; 2、有Ceph开发运维经验; 3、熟悉以下任一开源存储系统源码:beegfs、ZFS、HDFS、Hbase,LevelDB,RocksDB,Mysql、MongoDB,TiKV,Redis等; 4、熟悉Linux下 I/O协议栈; 5、具有内核,操作系统相关开发经验。
  • 15k-25k 经验3-5年 / 本科
    金融 / 上市公司 / 2000人以上
    工作职责 1、参与平安云分布式存储建设工作,保证生产系统稳定运行; 2、熟悉常见的云存储产品功能、特点,参与云存储产品规划,思考并提出建议; 3、参与云存储系统核心功能的设计、开发工作; 4、保证云存储生产运行中的系统稳定运行,了解其运行情况,对问题及时进行诊断及解决; 5、与关联系统团队保持良好沟通及协作,保证各项工作稳定开展。 任职要求 1、熟悉Linux环境编程, 具有3年以上的后台开发经验 ; 2、掌握基础网络协议(TCP、HTTP等)知识,熟悉网络编程和网络服务框架等; 3、具有扎实的编程基础,熟练掌握至少一门语言c/c++/python/go/java,如无go语言经验,愿意转go; 4、追求高品质代码,对工程质量有深刻认识, 注重模块化、单元测试、异常测试; 5、熟练掌握常用数据结构和算法,熟悉多线程编程技术,熟悉分布式协议(如Paxos/Raft/Zab等) ; 6、有较强的学习能力,有强烈的求知欲和进取心,能及时关注和学习业界最新技术。 满足以下条件者优先: 1、有大规模对象、文件、块存储或数据库等项目相关经验; 2、有Ceph开发运维经验; 3、熟悉以下任一开源存储系统源码:beegfs、ZFS、TiKV,Redis、HDFS、LevelDB、RocksDB、Mysql、MongoDB等; 4、熟悉Linux下 I/O协议栈; 5、具有内核,操作系统相关开发经验。
  • 20k-40k·15薪 经验1-3年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    岗位职责: 1、负责大规模稀疏模型的训练与推理过程的性能与效率优化,支持CPU/GPU 异构高性能模型工程大规模落地 2、设计与开发机器学习系统,包括数据读取,模型训练,参数存储,模型服务等,搭建上层应用与工作流等 3、协同算法业务团队优化模型效果与训练推理性能 岗位要求: 1、计算机,电子工程,通信等相关专业 2、熟悉C/C++/Python 或java编程语言,有扎实的计算机工程基础,有cuda编程实践经验,熟悉相关编译,调试,性能分析工具 3、学习能力强,有求知欲与自我驱动能力,良好的沟通能力与团队协作能力 4、有以下经验者优先: (1)了解搜索,广告,推荐系统,有相关领域算法与工程经验者优先 (2)有高并发服务设计与实践经验,有分布式系统/K8S调度/RPC框架等实践者优先 (3)熟悉GPU/cuDNN/Trition等,有GPU加速优化者经验者优先 (4)熟悉Tensorflow/HugeCtr/PadddlePaddle/Pytorch等深度学习框架,有框架二次开发经验者优先 (5)有编译优化相关(tensorRT/XLA/TVM等)相关实践者优先
  • 20k-35k·14薪 经验1-3年 / 本科
    移动互联网,广告营销 / 上市公司 / 2000人以上
    工作职责: 1.负责分布式存储平台的研发建设工作,包括对象存储/块存储/文件存储等系统的开发、优化; 2.持续推动公司存储技术栈的优化和演进、支撑业务在存储端的各类需求; 3.负责部分运维任务,高效定位,分析和解决线上问题。 任职资格: 1.*****本科及以上学历,计算机相关专业; 2.2年及以上云存储相关工作经验; 3.熟练掌握GO/JAVA等语言进行开发(至少熟练掌握一种); 4.有扎实的算法基础,能灵活应用各种常见的数据结构; 5.熟悉操作系统原理、Linux IO性能调优方法; 6.熟悉分布式系统的设计和应用,了解分布式常用技术原理 ; 7.熟悉一业界主流分布式存储产品,如AWS-S3、CEPH,HDFS,HBASE等; 8.有对象存储,块存储,NOSQL存储或其他大规模数据存储系统开发运维经验者优先考虑。
  • 20k-40k 经验3-5年 / 硕士
    人工智能服务,物联网,制造业 / 不需要融资 / 150-500人
    岗位职责: 1) 进行下深度学习框架算法的测试,包括功能测试、性能测试和兼容性测试,确保新框架的可用性。 2) 对主流算法模型进行全面测试,验证其在不同场景下的准确性、鲁棒性和效率,同时关注模型的集成和互操作性。 3) 测试用例开发: 制定并开发详细的测试用例,覆盖不同神经网络框架、算法和模型的各个方面,以确保测试的全面性和深度。 4) 自动化测试脚本编写: 编写自动化测试脚本,提高测试效率,确保测试的可重复性和持续性。 5) 分析测试结果,及时发现和报告问题,并协助开发团队解决问题。 6) 与产品经理和开发团队密切合作,了解产品需求和设计,确保测试工作符合业务需求。 7) 持续学习和探索新的测试方法和技术,不断提升测试水平和质量。 任职要求: 1) 设计并开发用于测试深度学习框架底层算子的详细测试用例,包括对各种算子的功能、性能、兼容性和边界条件进行全面测试。 2) 编写自动化测试脚本,提高测试效率,确保测试的可重复性和持续性。 3) 对不同底层算子的性能进行深入分析,识别潜在瓶颈,提出性能优化的建议。 4) 熟悉Python测试框架,如unittest、pytest等,并能够利用其进行测试用例的执行和管理,并能根据需求进行定制和扩展。 5) 对新技术和新方法有敏锐的洞察力,能够及时跟踪和评估新的测试技术和工具,保持技术领先地位。 工作地点: 北京中关村,上海张江,杭州五常,嘉兴湘家荡
  • 20k-40k 经验5-10年 / 硕士
    人工智能服务,物联网,制造业 / 不需要融资 / 150-500人
    岗位职责: 1) 硕士及以上学历,计算机科学、软件工程或相关专业。 2) 具有深度学习框架测试经验,对TensorFlow、PyTorch等常见深度学习框架有深入了解。 3) 熟悉Python测试框架,如unittest、pytest等,并能够利用其进行测试用例的执行和管理,并能根据需求进行定制和扩展。 4) 熟练使用Python语言编写测试用例和自动化测试脚本,具有丰富的Python编程经验。 5) 能够利用Python编写高效、稳定的测试脚本,覆盖深度学习框架的主要功能和常见场景,确保测试用例的全面性和有效性。 6) 具备良好的团队合作精神和沟通能力,能够与团队成员和其他部门合作,推动项目进展。 7) 对新技术和新方法有敏锐的洞察力,能够及时跟踪和评估新的测试技术和工具,保持技术领先地位。 任职要求: 1)硕士及以上学历,计算机科学、人工智能或相关专业。 2)具有五年以上软件测试经验,其中至少两年以上担任测试组组长或相关管理职务。 3)熟悉深度学习框架如TensorFlow、PyTorch等,具备相关测试经验和实践经验。 4)具备较强的团队领导能力和沟通能力,能够有效地协调和管理团队成员。 5)熟悉软件测试流程和方法,具备扎实的测试理论和实践经验。 6) 熟悉Python测试框架,如unittest、pytest等,并能够利用其进行测试用例的执行和管理,并能根据需求进行定制和扩展。 7)熟练使用Python语言编写测试用例和自动化测试脚本,具有丰富的Python编程经验。 8) 对新技术和新方法有敏锐的洞察力,能够及时跟踪和评估新的测试技术和工具,保持技术领先地位。 工作地点: 北京中关村,上海张江,杭州五常,嘉兴湘家荡
  • 20k-30k·13薪 经验不限 / 本科
    移动互联网,企业服务 / B轮 / 15-50人
    工作内容: 1. 分布式存储 ceph(或其他)的部署、运维、突发故障排查、性能优化; 2. 在私有机房环境部署新集群,需要偶尔出差; 3. 输出运维技术文档。 任职要求: 1. 本科及以上学历; 2. 对 Linux 系统熟悉,能编写 Shell 脚本,至少熟悉一门脚本语言(Python/其他); 3. 有构件并维护生产环境 ceph 的工作经验; 4. 对操作系统、硬件有一定的理解,有能力发现和处理集群在运行过程中遇到的问题; 5. 优秀的学习能力,愿意接触新知识、新技术。 ## 加分项: 1. 有 Kubernetes 生产环境维护管理经验,熟练使用 Kubernetes,熟知 Kubernetes 生态; 2. 有生产环境混合云配置与管理经验; 3. 有机房高可用网络环境配置与管理经验; 4. 对 GPU 设备有所了解,构建过针对机器学习场景的平台。
  • 19k-21k·14薪 经验3-5年 / 硕士
    人工智能服务,IT技术服务|咨询,数据服务|咨询 / 不需要融资 / 50-150人
    之江实验室与无锡江南计算技术研究所合作,联合研制异构融合智能超级计算系统,其软硬件研制开发主要在无锡完成。 工作职责: 1.大规模分布式深度学习系统的设计和开发; 2.模型算法与智能计算软硬件系统协同优化; 3.深度学习平台前沿技术跟研和技术发展路线规划; 4.常驻无锡工作。 任职资格: 1.***硕士及以上学历,具有3年及以上工作经验,计算机科学与技术、软件工程等相关专业。 2.良好的软件开发素养,熟练使用Linux操作系统,掌握shell、C/C++、Python等编程语言,熟悉设计模式、网络通信、多线程编程、计算机体系结构等技术者优先; 3.熟练使用一种以上深度学习框架(tensorflow/pytorch/caffe/mxnet等); 4.掌握分布式机器学习架构及优化算法,有华为、百度或其它国产AI芯片上进行算法移植和优化经验者优先; 5.在国内外高水平刊物或会议上发表过人工智能相关学术论文者优先。