-
职位职责: 1、参与面向企业服务的大规模分布式文件存储产品的设计和开发,打造业界先进的标准化产品; 2、持续优化系统稳定性、性能、成本、可扩展性、可维护性等; 3、深入理解业务场景的存储需求,针对性的为不同业务场景提供最合适的存储方案。 职位要求: 1、熟悉分布式存储系统的实现原理,具有计算机相关工作经验; 2、熟悉Go/Python/C/C++中至少一种,对工程质量有很高的自我要求; 3、对分布式存储的一致性、可靠性、高性能、成本优化等方向有深入理解; 4、熟悉文件存储、块存储、对象存储中的一种或多种者优先; 5、对技术有强烈的进取心,具有良好的沟通能力和团队合作精神、优秀的分析问题和解决问题的能力优先。
-
关于我们 加入阿里云飞天企业版团队,您将参与构建面向云原生、DevOps、IoT、AIOps、时序存储与安全分析的企业级大数据服务,并参与面向 AI 的智能化能力落地。在国内最大规模的云平台上,解决真实且复杂的工程问题,成长与影响力并重。 参与企业级大数据产品的核心分布式架构设计与性能优化; 推动微服务平滑拆分与弹性扩缩容,提升系统自愈能力与可观测性; 深度结合安全、容灾与自动化运维,保障企业级服务的合规与可靠性; 有机会将前沿云计算与 AI 能力快速落地,参与产品长期演进规划。 ========= 负责飞天企业版大数据类产品的分布式系统开发与架构演进,推动微服务化与弹性扩缩容方案落地。 优化系统性能与资源使用(内存/CPU),设计退避、限流、熔断等容错与自愈机制。 主导或参与底层库与中间件的调优、代码重构与可测试性改进,提升系统可维护性。 构建与完善漏洞自动化修复、容灾恢复流程,支持企业级特殊服务/数据场景。 与产品、运维、测试等团队协同,推动线上演进、容量规划与可靠性保障。 岗位要求 熟练掌握 C++/Python/Go/Java 中至少一种,具备良好的编码规范与单元测试习惯;熟悉代码重构与常用设计模式。 三年以上分布式系统开发经验,有公有云/私有云相关项目经验优先。 了解编程语言演进与 Core Guidelines(如 C++ Core Guidelines)者优先。 熟悉 Folly、Abseil、ElasticSearch、ClickHouse、Kafka 等大数据基础开源组件,能阅读源码并有社区贡献或提交者优先。 熟悉 Kubernetes 等容器编排/分布式管控系统;使用过 Azure Stack、AWS Outposts 等专有云/混合云解决方案者更佳。 学习能力强,对云计算前沿技术充满热情,能将新技术快速工程化并在产品迭代中做出合理权衡与规划。
-
【岗位职责】 1、负责分布式系统核心产品关键技术的研究,确保产品领先业界竞争力。 2、负责新一代分布式All-Flash存储引擎设计开发,关键技术点突破,可靠性设计,全栈性能优化,提升产品竞争力。 3、负责AI分布式文件系统设计开发,深度探索剖析AI业务场景瓶颈,基于DevOps流程端到端交付特性,参与项目的全生命周期管理。 4、负责多并发任务调度系统架构设计和开发,优化openstack卷管理调度性能问题,对接瑶光架构技术开发项目,实现更优的性能云资源服务。 【岗位要求】 1、***本科及以上学历,有大规模系统开发经验优先。 2、掌握c/c++/java/python语言的一种或多种,熟悉linux系统。 3、熟悉分布式存储/云计算/虚拟化等关键技术,具有实际项目经验者优先。 4、熟悉openstack开源项目,对数据中心资源调度有研究背景优先。 5、对新技术充满求知欲,乐于团队合作和技术分享。
-
岗位职责 1.从事分布式大数据/文件/对象存储系统的测试和开发; 2.实现公有云/私有云分布式文件/对象/块存储服务的高性能、高可靠性、高可用目标。 岗位要求 1.掌握C/C++/Java/go/Python/JS等一种或多种编程语言,熟悉Linux相关知识,对基本数据结构和算法有一定的了解; 2.有存储、分布式、文件系统、容器领域、Linux内核、AI以及大数据开发经验者优先; 3.具备良好的解决问题能力,逻辑思维能力,善于沟通与合作; 4.干工作认真负责,能承受一定工作,具备良好的团队协作与沟通交流意识。
-
分布式数据平台开发工程师
[杭州·萧山区] 2023-01-1220k-40k·15薪 经验在校/应届 / 硕士软件服务|咨询,数据服务|咨询,IT技术服务|咨询 / 未融资 / 150-500人岗位职责: 1、设计并实施灵活可扩展的支持数据建模、数据治理、数据质量、数据分析和优化的支持企业和产业数字化的数据架构; 2、设计并实施基于支持企业和产业数字化的数据架构并灵活集成统计、运筹和机器学习算法的数据平台; 2、负责数据平台的研发和迭代升级,持续提升平台稳定性,优化改进分布式存储、计算系统性能; 4、推动新型分布式高性能数据存储、计算、传输和访问技术在企业和产业数字化的落地应用。 任职要求: 1、硕士及以上学历,计算机基础扎实。熟悉计算机网络、Linux操作系统、分布式存储、算法和系统相关知识; 2、熟练掌握java、Scala、Go、C++编程语言的一种或多种,具备良好Coding技能和优雅的代码规范; 3、有过Apache开源生态分布式系统经验者优先,学习了解过Spark/Flink/Presto/Impala/Hadoop/HBase/Cassandra/GraphDB一种或多种引擎,有源码阅读或修改者优先; 4、强烈的上进心和求知欲,较强的学习能力和沟通能力,具备良好的团队合作精神。 加分项: 1、计算机领域相关的编程大赛获奖、专业期刊发表文章或者有发明专利等; 2、具备数据云平台、计算存储平台、可视化开发平台经验; 3、具备专业领域的计算机知识和技能: Alluxio/Hive/Hbase/RocksDB/Kafka/JanusGraph/GraphQL等。 4、对知识图谱、数据搜索、分布式算法、关系型数据库内核和优化、非关系型数据库内核和优化、云计算等技术有一定研究者优先。 -
职位描述: 作为Alluxio的分布式系统工程师,你将负责构建Alluxio(原名为Tachyon)系统。这项工作解决了分布式系统中最具挑战性的问题,包括在大规模云环境中构建缓存策略,优化并发和锁定机制,构建高可用性分布式系统。 职位要求: 1.计算机科学,或者相关专业,本科及以上学历,硕士或者博士优先; 2.具有一种或多种通用编程语言的软件开发经验,包括但不限于Java、C++和Go; 3.熟悉分布式系统原理、RPC以及消息中间件原理。具备大规模后台开发经验; 4.熟悉常用的数据结构与算法,对设计模式、软件工程等有较深入的理解; 5.具备良好的学习能力和分析解决问题的能力,具备激情,和良好的沟通能力,高度责任心和团队合作精神; 加分项: 1.良好的英语听说读写能力; 2.有参与开源社区开发经验: 3.有Alluxio,HDFS,Spark,Presto,Impala,Ceph,Kubernetes等分布式系统开发或深度使用经验; 4.熟悉Java语言和面向对象设计开发,熟悉多线程程序开发,对多线程技术、异步、并发有较深入理解。
-
AI领航员:分布式存储系统开发工程师
[北京·海淀区] 2022-12-2920k-40k·15薪 经验在校/应届 / 本科人工智能服务,IT技术服务|咨询 / 上市公司 / 2000人以上岗位职责: 参与AI IaaS新一代存储系统的开发。 任职要求: 1、计算机或相关专业,本科及以上学历,熟悉计算机体系结构, 理解硬件的工作原理; 2、有扎实的 C/C++ 或者 Rust 编程功底 3、熟悉多进程、线程和异步编程,算法与数据结构知识扎实; 4、有良好的学习和团队协作能力,热爱编程,乐于接受挑战 5、对编写高性能和高可靠的系统软件有狂热精神和偏执的追求 -
负责分布式存储集群各个组件(硬件,软件)的监控,数据收集以及存储,展示功能 负责分布式存储系统的监控,告警系统 负责分布式存储集群的自动化运维设计与开发,通过技术手段提升运维效率和运维质量 负责运维系统的开发和版本迭代 负责存储管理web界面的后端功能实现与监控告警功能 探索智能运维的技术方向,实现自动化故障分析,预警,以及自动化故障处理决策 对线上故障进行排查,总结自动化运维的改进点 完善运维体系和流程 能力要求: 1.计算机或者相关背景,有良好的数据结构和算法基础 2.熟悉Linux系统,掌握 C/Golang/shell至少一种编程语言 3.对使用技术手段提高生产效率有极致追求 4.了解web后端相关技术,如nginx 优先条件 1.熟悉常用的开源产品如Prometheus,Alertmanager等开源运维工具 2.熟悉容器存储以及容器技术,例如kubernetes, Docker 3.熟悉开源分布式存储产品如(Ceph, Gluster, HDFS) 4.熟悉web后端框架
-
岗位职责: 1、围绕公司分布式数据库产品进行软件测试工作,包括白盒测试、黑盒测试、混沌测试等内容 2、针对产品新功能进行测试工作,编写测试脚本,验证产品功能、性能、稳定性等方面的表现能力 3、深入学习和掌握混沌测试工具,针对分布式数据库开展混沌测试工作 4、编写测试脚本、设计混沌测试用例,并针对发现的产品问题进行定位分析,协助研发人员进行问题修复 5、持续维护公司测试平台,保证日常测试工作的正常推进 岗位要求: 1、本科及以上学历,英文读写熟练; 2、掌握python或其他脚本语言,具备对应编程语言的调试能力,具有良好的编程习惯; 3、掌握常用数据结构、算法等基础知识; 4、有较强的学习能力,活泼开朗,善于沟通,能够快速融入团队。 加分项: 1、有混沌测试工具使用经验者优先; 2、有持续集成和交付平台使用经验者优先; 3、有数据库系统、分布式系统测试经验者优先。
-
岗位职责: 1、负责开发分布式存储平台相关软件,承担需求分析、设计、编码、测试和维护工作。 任职要求: 1、大学本科及以上学历;熟练掌握 C 语言编程,需要有丰富的实践经验; 2、需要熟悉至少一种分布式存储软件,熟悉分布式软件管理以及 IO 处理流程,有一定的开发经验; 3、熟悉 TCP/IP 协议及 SOCKET 编程,熟练掌握 linux 操作系统,对 linux 存储相关模块有深 入的了解,有一定的 linux 开发经验; 4、熟悉 linux 脚本开发,能够熟练的使用 shell 和 python 开发自动化测试脚本; 5、善于沟通,具有团队合作精神,执行力强.
-
岗位职责: 1 、根据需求完成业务模块的开发 2、研究开源协议和项目,完成系统集成。 3、处理高并发大数据量的实时请求。 4、完成高可用性的开发,保证系统的健状性。 任职资格: 1、 985/211、双一流院校,计算机,电子信息、通信、数学理论及信息安全、加密解密,学科或其他数字信号处理相关专业相关本科或本科以上学历,工作经验超过三年 2 、精通Rust或c++,熟悉常用算法及数据结构 3、精通websocket 熟悉 软硬件通信协议。精通kafka 消息队列。 精通redis 发布/订阅应用。 4、 具有大型分布式开发经验,精通多线程并发编程,具有较强的模块化思维。 5、 具有较强的学习、理解能力,统筹协调能力。具备较好的分析问题和解决问题的能力 5 具备良好的沟通习惯、语言表达清楚、思路清晰,有团队合作精神 6 具有以下条件者优先: 熟悉密码学,安全协议和加密算法相关编程经验。
-
岗位职责: 设计、实现并优化MatrixDB超融合时序数据库~ 1.负责分布式时序数据库查询优化器的设计与研发; 2.负责分布式时序数据库执行引擎的设计,研发与性能优化; 3.负责分布式时序数据库存储引擎的设计,研发与性能优化; 任职要求: 1.精通系统编程或者网络编程,理解计算机基础原理,包括编译原理、操作系统、数据结构和算法等; 2.精通或者热爱数据库内核这一最具挑战的软件开发领域,愿意在这一领域投入至少5年以上精力深耕; 3.精通某一种语言(C、golang、Java等均可),理解其语言本质; *加分项:有数据库内核开发经验者优先,熟悉Greenplum、PostgreSQL者优先~熟悉HDFS, Kudu, RocksDB存储引擎原理、学习过CMU15-445 , MIT 6.824优先
-
主要岗位职责: 1、参与设计、开发存储自动化运维、监控平台,负责 存储故障处理自动化、自动化部署、灰度发布相关功能开发。 2、对存储服务的SLA负责,包含存储故障的及时处理,故障的复盘,制定改善计划;以及推动存储服务的可靠性持续改善。 3、参与运维体系建设、包含但不限于 容量规划、链路优化、巡检方案制定以及流程机制的改善。 任职资格要求: 1、本科及以上学历,计算机软件或相关专业; 2、对于分布式存储、传统存储、数据库有2年以上运维或开发经验; 3、熟悉linux系统运维、shell或pyhon 编程,熟悉linux 网络故障的排查,熟悉linux相关存储 知识。 4、有互联网大规模系统运维平台开发或运维经验,有ceph相关开发、运维经验优先。
-
职位描述 - 参与大规模分布式存储产品的设计和开发; - 持续优化系统稳定性、性能、成本、可用性、可扩展性、可维护性等; - 深入理解业务场景的存储需求,针对性的为不同业务场景提供最合适的存储方案; - 负责优化rocksdb存储引擎,负责优化公司强一致存储产品; 工作要求 - 热爱数据库和存储,以数据库和存储技术作为发展方向,并希望在该领域长期发展下去; - 熟悉rocksdb机制和源码,有rocksdb开发经验者优先; - 极强的学习能力和动力,对未知技术和领域能快速掌握并实践; - 在开源社区活跃并有积极贡献者优先; - 精通C/C++,网络,有分布式存储系统开发经验者优先; - 精通redis,熟悉redis源码优先; - 熟悉raft协议,理解raft工作机制优先;
-
职位描述 1. 负责带领团队建设大模型分布式系统研发体系和多GPU优化技术体系,跟踪和探索面向大模型的分布式优化技术新趋势; 2. 负责组织进行软件的设计和开发,对多GPU(同一节点和跨网络多节点)通信性能优化; 职位要求 1. 研究生及以上学历,计算机/电子相关专业优先,5年(博士3年)以上分布式系统优化经验; 2. 熟悉计算机体系架构、分布式并行计算和异构计算框架,具备OpenMPI, OpenSHEM, MPICH 等相关知识及支持库(NCCL,UCX, etc.)和经验者优先; 3. 具备芯片互联和网络传输编程相关知识,例如RDMA,PCIE Peer2Peer, GPU Direct等经验者优先; 4. 熟练掌握深度学习分布式优化方法,有大模型训练和推理优化经验者优先; 5. 统筹协调能力强,有大型系统开发团队管理经验优先。


