• 40k-60k 经验5-10年 / 本科
    人工智能服务,科技金融 / 不需要融资 / 500-2000人
    岗位职责: (1)负责分布式数据库领域的前沿技术研究; (2)参与兴业银行分布式数据库的技术选型; (3)参与兴业银行分布式数据库相关规范指引的制定; (4)负责兴业银行系统在分布式数据库方面的技术方案制定与实施; (5)负责分布式数据库的日常技术支持,包括性能优化、故障处理、技术培训等。 岗位要求: (1)具备5年以上分布式数据相关工作经验; (2)对分布式数据库(TDSQL、GaussDB、OceanBase等)底层原理及技术架构有深入的研究,具备分布式数据库架构设计能力,并能熟练的进行性能调优、故障处理,熟悉常用的监控工具; (3)曾主导大型分布式应用系统的分布式数据库架构设计及项目实施; (4)熟悉各类分布式数据库的优缺点,对分布式数据库的应用场景和局限性有深入的理解; (5)对其他流行数据库(Oracle、MySQL、OpenGauss等)底层原理有深入的研究,在数据库备份恢复、性能调优、高可用性设计、故障处理等方面有丰富的经验。 工作地点:上海、福州
  • 50k-70k 经验5-10年 / 本科
    人工智能服务,科技金融 / 不需要融资 / 500-2000人
    岗位职责: (1)负责分布式数据库领域的前沿技术研究; (2)参与兴业银行分布式数据库的技术选型; (3)参与兴业银行分布式数据库相关规范指引的制定; (4)负责兴业银行系统在分布式数据库方面的技术方案制定与实施; (5)负责分布式数据库的日常技术支持,包括性能优化、故障处理、技术培训等。 岗位要求: (1)具备5年以上分布式数据相关工作经验; (2)对分布式数据库(TDSQL、GaussDB、OceanBase等)底层原理及技术架构有深入的研究,具备分布式数据库架构设计能力,并能熟练的进行性能调优、故障处理,熟悉常用的监控工具; (3)曾主导大型分布式应用系统的分布式数据库架构设计及项目实施; (4)熟悉各类分布式数据库的优缺点,对分布式数据库的应用场景和局限性有深入的理解; (5)对其他流行数据库(Oracle、MySQL、OpenGauss等)底层原理有深入的研究,在数据库备份恢复、性能调优、高可用性设计、故障处理等方面有丰富的经验。 工作地点:上海、福州
  • 电商平台 / C轮 / 2000人以上
    一、缓存方向: 【岗位职责】 1.负责设计和实现分布式通用KV系统,满足SHEIN场景的大并发、低延迟和低成本要求。技术上在高并发,低延迟和高可用上追求极致; 2.参与电商系统的架构设计,提出合理的缓存方案和应用策略并落地; 3.负责双机房互为主备,多机房单元化等不同部署方案的实现,提高集群整体的高可用性,提高容灾能力; 4.负责跟进新硬件和相关技术领域的发展,推动软件架构的相应演进升级。 【岗位要求】 1.3年以上大型分布式系统或高性能缓存服务的设计与研发经验; 2.熟悉redis/memcached/levelDB/rocksDB的一项或多项,并有二次开发能力; 3.有丰富的大规模分布式集群开发经验,熟悉CAP理论、Paxos/Raft算法等; 具备优秀的沟通能力和团队协作精神。 二、检索服务方向: 【岗位描述】 1.负责电商搜索数据库架构设计,打造高性能、高可用、可扩展的架构,支撑业务快速发展; 2.负责高并发搜索引擎的全链路架构,优化搜索引擎的计算和存储性能; 3.负责系统规划和建设,并推动在搜索、核心业务复杂搜索场景落地。 【岗位要求】 1. 熟练掌握Java/C++等开发语言,有系统级性能调优经验; 2. 熟悉Redis/HBase/MongoDB/ElasticSearch/Spark/Flink等,具有任一框架优化经验者更佳; 3. 有良好的可靠性意识,包括不限于监控、容灾等。 4. 加分项: 对搜索业务/ 推荐业务/电商业务有深入了解。 三、消息方向: 【岗位描述】 1.负责SHEIN中间件消息队列产品的系统建设,架构设计,方案规划和需求落地工作; 2.根据业务要求,完成中间件消息队列产品的迭代实施和产品优化工作; 3.指导消息队列中间件产品在业务场景下的技术落地和落地实施工作; 【岗位要求】 1.熟悉开源消息队列Kafka/Pulsar/RocketMQ/RabbitMQ等,有相关开发经验者优先; 2.熟悉CAP理论、Paxos/Raft算法、高可用架构、分布式事务等,有一定实践经验者优先; 3.有MQ开源社区相关贡献或工作经验者优先; 4.了解或熟悉一种分布式流计算框架的应用场景和关键技术,例如Spark/Flink/Kafka Streams/Apache Samza等,有相关研发经验者优先; 5.有技术热情和较强的学习能力,有良好的分析解决问题和技术攻关能力。
  • 15k-25k 经验3-5年 / 本科
    金融 / 上市公司 / 2000人以上
    工作职责 1、参与平安云分布式存储建设工作,保证生产系统稳定运行; 2、熟悉常见的云存储产品功能、特点,参与云存储产品规划,思考并提出建议; 3、参与云存储系统核心功能的设计、开发工作; 4、保证云存储生产运行中的系统稳定运行,了解其运行情况,对问题及时进行诊断及解决; 5、与关联系统团队保持良好沟通及协作,保证各项工作稳定开展。 任职要求 1、熟悉Linux环境编程, 具有3年以上的后台开发经验 ; 2、掌握基础网络协议(TCP、HTTP等)知识,熟悉网络编程和网络服务框架等; 3、具有扎实的编程基础,熟练掌握至少一门语言c/c++/python/go/java,如无go语言经验,愿意转go; 4、追求高品质代码,对工程质量有深刻认识, 注重模块化、单元测试、异常测试; 5、熟练掌握常用数据结构和算法,熟悉多线程编程技术,熟悉分布式协议(如Paxos/Raft/Zab等) ; 6、有较强的学习能力,有强烈的求知欲和进取心,能及时关注和学习业界最新技术。 满足以下条件者优先: 1、有大规模对象、文件、块存储或数据库等项目相关经验; 2、有Ceph开发运维经验; 3、熟悉以下任一开源存储系统源码:beegfs、ZFS、TiKV,Redis、HDFS、LevelDB、RocksDB、Mysql、MongoDB等; 4、熟悉Linux下 I/O协议栈; 5、具有内核,操作系统相关开发经验。
  • 15k-30k 经验5-10年 / 本科
    金融 / 上市公司 / 2000人以上
    工作职责 1、参与平安云分布式存储建设工作,保证生产系统稳定运行; 2、熟悉常见的云存储产品功能、特点,参与云存储产品规划,思考并提出建议; 3、参与云存储系统核心功能的设计、开发工作; 4、保证云存储生产运行中的系统稳定运行,了解其运行情况,对问题及时进行诊断及解决; 5、与关联系统团队保持良好沟通及协作,保证各项工作稳定开展。 任职要求 1、熟悉Linux环境编程, 具有3年以上的后台开发经验 ; 2、掌握基础网络协议(TCP、HTTP等)知识,熟悉网络编程和网络服务框架等; 3、具有扎实的编程基础,熟练掌握至少一门语言c/c++/python/go/java,如无go语言经验,愿意转go; 4、追求高品质代码,对工程质量有深刻认识, 注重模块化、单元测试、异常测试; 5、熟练掌握常用数据结构和算法,熟悉多线程编程技术,熟悉分布式协议(如Paxos/Raft/Zab等) ; 6、有较强的学习能力,有强烈的求知欲和进取心,能及时关注和学习业界最新技术。 满足以下条件者优先: 1、有大规模对象、文件、块存储或数据库等项目相关经验; 2、有Ceph开发运维经验; 3、熟悉以下任一开源存储系统源码:beegfs、ZFS、HDFS、Hbase,LevelDB,RocksDB,Mysql、MongoDB,TiKV,Redis等; 4、熟悉Linux下 I/O协议栈; 5、具有内核,操作系统相关开发经验。
  • 20k-30k·13薪 经验不限 / 本科
    移动互联网,企业服务 / B轮 / 15-50人
    工作内容: 1. 分布式存储 ceph(或其他)的部署、运维、突发故障排查、性能优化; 2. 在私有机房环境部署新集群,需要偶尔出差; 3. 输出运维技术文档。 任职要求: 1. 本科及以上学历; 2. 对 Linux 系统熟悉,能编写 Shell 脚本,至少熟悉一门脚本语言(Python/其他); 3. 有构件并维护生产环境 ceph 的工作经验; 4. 对操作系统、硬件有一定的理解,有能力发现和处理集群在运行过程中遇到的问题; 5. 优秀的学习能力,愿意接触新知识、新技术。 ## 加分项: 1. 有 Kubernetes 生产环境维护管理经验,熟练使用 Kubernetes,熟知 Kubernetes 生态; 2. 有生产环境混合云配置与管理经验; 3. 有机房高可用网络环境配置与管理经验; 4. 对 GPU 设备有所了解,构建过针对机器学习场景的平台。
  • 18k-35k 经验3-5年 / 硕士
    企业服务,人工智能,通讯电子 / 天使轮 / 50-150人
    职位描述 1. 负责带领团队建设大模型分布式系统研发体系和多GPU优化技术体系,跟踪和探索面向大模型的分布式优化技术新趋势; 2. 负责组织进行软件的设计和开发,对多GPU(同一节点和跨网络多节点)通信性能优化; 职位要求 1. 研究生及以上学历,计算机/电子相关专业优先,5年(博士3年)以上分布式系统优化经验; 2. 熟悉计算机体系架构、分布式并行计算和异构计算框架,具备OpenMPI, OpenSHEM, MPICH 等相关知识及支持库(NCCL,UCX, etc.)和经验者优先; 3. 具备芯片互联和网络传输编程相关知识,例如RDMA,PCIE Peer2Peer, GPU Direct等经验者优先; 4. 熟练掌握深度学习分布式优化方法,有大模型训练和推理优化经验者优先; 5. 统筹协调能力强,有大型系统开发团队管理经验优先。
  • 50k-80k·15薪 经验10年以上 / 本科
    专业服务|咨询 / 不需要融资 / 15-50人
    岗位职责: 1、深刻理解存储行业,梳理产品定位和核心信息,关注市场竞争态势,负责分布式存储产品规划。 2、负责构建并持续优化大规模分布式存储系统,包括整体架构设计、核心组件选型、基础架构搭建、高性能设计等。 3、负责主导分布式存储产品技术方案设计,保持产品竞争力和技术前沿性。 4、负责云存储产品架构设计及优化,牵头云存储产品技术演进,支撑云存储产品能力提升。 任职要求: 技能需求: 1、本科及以上学历,10年及以上存储相关工作经验,5年及以上分布式存储系统架构工作经验。 2、具备大规模分布式系统(如存储、搜索引擎、数据库、NoSQL、CDN、容器、分布式计算等)开发实践经验。 3、具备行业洞察能力,能够通过行业发展总结行业关键进展和需求,对多个行业如金融,政府,互联网等的客户特征,决策流程等有一定认知。 4、具备良好的逻辑思维及沟通能力,自驱、主动、有团队合作意识。 5、曾在阿里云、腾讯云、华为云、AWS、百度云、金山云、火山引擎从事分布式存储相关工作者优先。
  • 30k-60k 经验5-10年 / 本科
    电商平台,在线教育,新零售 / 不需要融资 / 50-150人
    工作职责 1、负责分布式容器云平台研发,面向多集群、混合云、分布式计算和容灾等场景,对容器云的计算、网络、存储、安全、监控、日志、作业、应用、流量等进行统一管控,实现对各种异构计算资源的容器化统一调度和运维。任职要求 1、大学本科及以上学历,计算机类专业优先; 2、八年及以上软件研发经验,其中至少两年容器研发相关经验; 3、熟悉K8S架构和基础组件概念与原理;精通K8S容器Calico,Flannel等网络组件工作原理,熟悉CNI原理;精通K8S容器编排基础组件,包含但不限于 helm,prometheus,jenkins等;熟练使用golang等技术语言,有实际项目开发经验;熟悉Prometheus grafana,有一定的实际项目经验; 4、有PaaS平台研发相关容器化项目经验者优先; 5、有容器引擎、分布式容器管理、服务网格、镜像加速、弹性容器实例、容器安全相关研发经验优先; 6、诚实守信、作风踏实严谨、责任心强,具备良好团队协作能力精神,学习能力强,善于解决复杂问题; 7、40周岁(含)以下,身心健康; 8、过往工作业绩优秀,或有知名互联网/IT、云服务头部企业工作经验者,年龄、工作年限可适当放宽。
  • 15k-30k 经验1-3年 / 本科
    企业服务,人工智能,通讯电子 / 天使轮 / 50-150人
    职位描述 1. 负责大模型分布式系统和多GPU优化系统研发,探索面向大模型的分布式优化新技术; 2. 负责分布式系统软件的设计和开发,提升多GPU(同一节点和跨网络多节点)高性能网络通信性能; 职位要求 1、本科及以上学历,计算机/电子相关专业优先,至少2年分布式、通信系统优化经验; 2、熟练掌握C、C++、Go等一种或多种编程语言,熟悉计算机体系架构、分布式并行计算和异构计算框架; 3、熟悉OpenMPI, OpenSHEM, MPICH,NCCL,UCX等一种或多种分布式通信软件者优先; 4、了解RDMA,PCIE Peer2Peer, GPU Direct等芯片互联和网络传输编程相关知识者优先; 5、了解常见的深度学习分布式优化方法者优先;
  • 10k-20k 经验1-3年 / 大专
    其他 / 未融资 / 50-150人
    岗位职责: 1、负责管理分布式光伏电站项目建设以及相关的沟通协调工作, 能独立完成或指导技术支持完成项目现场施工勘察直至竣工管理的工作; 2、实施项目成本控制; 3、配合技术部门完成项目技术方案设计,与客户进行前期沟通工作; 4、独立完成现场与项目方相关部门、监理的协调工作;严格实施公司关于现场管理的相关规定,做好项目范围、工程量、材料、施工计划、工期、施工质量、施工安全、人员组织等的管理 任职要求: 1、熟悉强弱电等设备的安装、调试、维护、操作等相关标准规范及施工工艺,能独立进行现场施工操作、指导; 2、能够对工前、过程、验收及现场进行有效的组织和实施,并可进行技术指导;3、 能够独立进行工程项目的管理和实施,有较强的现场组织、沟通和协调能力;4、 责任心强,有团队合作精神; 5、 具备相关项目的管理经验,有地面电站、渔光互补电站项目管理经验者优先;有三年以上相关工作经验或相关执业资格证书(一建、二建)者优先。
  • 40k-70k·16薪 经验不限 / 本科
    消费生活 / D轮及以上 / 500-2000人
    1.负责机器学习分布式训练方向的工作,系统开发、高性能优化 2.熟悉分布式训练框架,熟悉数据并行、模型并行、流水线并行等常见并行策略 3.有大规模分布式训练性能优化的相关经验,支持过多机多卡的分布式并行任务训练和性能调优 4.熟悉cuda编程,网络吞吐性能优化,可对神经网络特定layer进行深层优化
  • 消费生活 / D轮及以上 / 500-2000人
    1.负责机器学习分布式训练方向的工作,系统开发、高性能优化 2.熟悉分布式训练框架,熟悉数据并行、模型并行、流水线并行等常见并行策略 3.有大规模分布式训练性能优化的相关经验,支持过多机多卡的分布式并行任务训练和性能调优 4.熟悉cuda编程,网络吞吐性能优化,可对神经网络特定layer进行深层优化
  • 24k-45k 经验3-5年 / 本科
    移动互联网,广告营销 / 上市公司 / 2000人以上
    云存储/分布式存储研发工程师 岗位职责: 1、负责分布式存储平台的研发建设工作,包括对象存储/块存储/文件存储等系统的开发、优化; 2、持续推动公司存储技术栈的优化和演进、支撑业务在存储端的各类需求; 3、负责部分运维任务,高效定位,分析和解决线上问题; 岗位要求: 1、重点本科及以上学历,计算机相关专业; 2、2年及以上云存储相关工作经验; 3、熟练掌握GO/JAVA等语言进行开发(至少熟练掌握一种); 4、有扎实的算法基础,能灵活应用各种常见的数据结构; 5、熟悉操作系统原理、Linux IO性能调优方法; 6、熟悉分布式系统的设计和应用,了解分布式常用技术原理 ; 7、熟悉一业界主流分布式存储产品,如AWS-S3、CEPH,HDFS,HBASE等; 8、有对象存储,块存储,NOSQL存储或其他大规模
  • 人工智能服务,IT技术服务|咨询 / D轮及以上 / 500-2000人
    工作职责: 1.设计并实现创新的机器学习解决方案,并将其应用到大规模分布式机器学习系统中。 2.适配最新的机器学习算法与架构,深入主流的机器学习框架,对框架进行调整、改进和优化。 3.研究核心技术突破点,在模型并行、数据-计算结合等方面打造机器学习系统性能与易用性优势。 4.对服务整体稳定性负责,分析并深入发现系统风险点,提高系统服务在各种风险下的容错能力。 任职要求: 1.有比较扎实的计算机理论基础,熟练使用C/C++编程,对数据结构和算法有较为深刻的理解。 2.具有快速学习的能力,有灵活应用开源项目的经验。 3.具备英文文档阅读分析能力,良好的沟通能力和团队协作能力。 4.对技术有执着的追求和热爱,并对新技术持有敏感性并愿意致力于新技术的探索和研究,对解决具有挑战性问题充满激情。 加分项: 1.深入了解业界主流机器学习框架如Pytorch/Tensorflow/Mxnet等中至少一种,社区核心贡献者优先。 2.在异构计算或并行计算系统开发方面有丰富经验,如CUDA,OpenCL,OpenMP,MPI等,并能有效利用这些技术进行高效计算优化。 3.有成熟的大规模分布式机器学习系统设计与实施经验,例如对Megatron-Deepspeed、Colossal-ai等有深入理解和实践。 4.在OSDI/SOSP等**会议或期刊上发表过相关领域的论文。 5.对分布式系统中的容错、一致性、并发性和安全性等问题有深入的理解,并能应用如ZooKeeper、Etcd等工具进行处理。 6.深入了解 YARN、Kubernetes、Hadoop、Spark、Flink、Horovod等系统和生态,在社区有过相关代码贡献者优先。 工作地点:北京、上海、深圳、新加坡;