• 20k-35k·15薪 经验3-5年 / 本科
    移动互联网,文娱丨内容 / 上市公司 / 2000人以上
    工作职责: 1、负责业务稳定性和SRE效能类工具和平台的设计、开发功能; 2、分析系统瓶颈,解决各种疑难问题,对系统进行性能调优; 3、深入发掘和分析业务需求,撰写技术方案和系统设计,主要实现语言为Golang。 工作要求: 1、计算机或相关专业学历,有2年以上互联网后端开发经验; 2、熟悉Go/Python等至少一门语言,有Go开发经验者优先; 3、熟悉linux操作系统,具有较好的系统瓶颈发现、解决能力; 4、熟练掌握SQL,有千万量级及以上数据量的数据库设计能力优先; 5、对设计模式、网络编程、并发编程熟悉,具备后端服务视野优先; 6、具备很强的逻辑思维能力,有较好的算法基础者优先; 7、具备良好的设计和文字表达能力,能独立完成设计文档的撰写; 8、具备团队合作能力,良好的沟通能力与口头、书面表达能力,严谨的工作态度与高质量意识,良好的抗压能力。 9、具备如下平台经验优化:cmdb、服务树、作业、预案、变更管控、混沌工程、ci&cd等
  • 30k-55k·13薪 经验不限 / 不限
    旅游|出行 / D轮及以上 / 500-2000人
    岗位职责: 1、负责服务稳定性建设,包括日常监控、故障处理、故障预案等,保障服务稳定性 2、负责SRE团队和能力体系建设,持续提升SRE在效率、质量和安全方面的核心SRE能力 3、负责制定核心服务的SLI/SLO指标以及错误预算指标 4、负责管理和落实oncall流程和故障复盘机制,对 MTTR 负责 5、负责相关应用的监控告警、降级与预案建设,组织故障演练和应急止损等稳定性工作 6、负责保障各类活动(大促)的稳定性和用户体验 7、完善跨团队合作机制,基于业务导向,提供符合实际业务场景的SRE解决方案 8、通过培训,知识库建设,工具平台建设,流程优化等手段,提升一线服务专业度 职位要求: 1、**本科及以上学历,具备7年以上工作经验,其中3年以上SRE相关经验; 2、熟悉SRE相关流程,了解行业内SRE技术的发展趋势,具备0到1的SRE体系搭建能力 3、熟悉Linux操作系统,对计算机体系结构、网络、容器及虚拟化有较好理解,具备快速定位和处理告警或故障能⼒,具有CDN、k8s、中间件运维经验; 4、优秀的逻辑思维能力及沟通能力,高效的执行力,责任心强,工作积极严谨,对生产环境有敬畏之心; 5、熟悉公有云产品高可用架构,对容灾建设、容量管理、性能优化有较深入理解; 6、抗压性强,良好的服务意识和团队合作精神。 7、熟悉Java/Golang语言开发优先
  • 30k-60k·15薪 经验5-10年 / 本科
    工具 / 上市公司 / 500-2000人
    职位描述: 1、负责承接迅雷私有云、家庭场景相关产品的战略目标规划、功能规划和项目推进; 2、负责市场和用户调研,挖掘和把握各层次用户在家庭场景的需求,设计产品功能和交互流程,优化用户体验,完善产品功能,提升用户留存; 3、与运营团队协作,确保产品运营方案落地,并不断分析产品运营效果,制定产品优化方案; 4、驱动数据团队分析用户反馈及相关业务数据,定位产品问题并提出优化方案,促进产品及运营策略调优; 职位要求: 1、**本科及以上学历,5年以上产品岗经验,产品基本功扎实且有方法论沉淀; 2、有服务器/PC/平板/机顶盒等硬件产品0-1研发及项目管理经验优先,熟悉主流的芯片平台方案,有产品上市经验优先; 3、对网盘、NAS、视频点播相关业务有极强兴趣,有对应行业从业经验者优先; 4、乐于尝试0-1业务,有创业精神, 具备开放、创新特质;
  • 20k-30k·17薪 经验3-5年 / 本科
    移动互联网,金融 / 不需要融资 / 150-500人
    岗位职责: 1.系统应用运维SRE工作,包括并不限于日常运维、应用监控、持续交付、应急响应等,保证应用系统稳定运行。 2、推广运维领域自动化工具使用,提升运维效率和质量。 3、参与项目架构设计、规划,执行部署实施以及管理;结合专业技术和领域知识,构建并优化运维体系。 任职要求: 1、研究生学历,计算机、信息技术及金融工程等相关专业; 2、对Linux系统有了解,至少掌握一门开发语言 Python/Java/Go不限; 3、具备强大的自驱力,主动学习,独立思考; 加分项: 1. 有大型公有云产品使用经验,阿里云/华为云/腾讯云不限; 2. 了解云原生架构,对K8S,DevOps等技术平台有一定了解;
  • 15k-30k·14薪 经验3-5年 / 本科
    金融 软件开发 / 不需要融资 / 2000人以上
    职责描述: 1、负责公司大数据平台的运维保障工作,保障平台的正常运行和相应数据服务的稳定高效; 2、对接数据开发侧团队,主动优化和完善服务巡检、监控工具、脚本等,减少人工操作提高运维效率;负责数据平台的故障处置、推动性能优化。如平台产品技术问题,提交给平台产品技术组进行后台处理,并及时反馈. 3、负责数据平台二线运维支撑保障,响应运维/服务台一线请求:处置生产事件,跟踪问题处理; 4、定期组织团队人员开展大数据平台的技术知识积累和移交; 5、负责设计日常运维相关的自动化工具或系统,并完成相应需求收集和需求管理 ; 任职要求: 1. 具有1年以上金融行业数据类项目运维经验,熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员,或长期在类似的运维项目上承担运维工作优先; 2. 具备较强的数据开发分析能力,熟练掌握SQL等技能,熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先; 3. 具备较强的数据分析,问题分析,逻辑思维能力,团队协作能力,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 4. 强烈的自驱力和责任感,面对复杂业务问题,可以从业务和技术多角度推进,最终达成目标。
  • 25k-35k 经验5-10年 / 本科
    居住服务 / C轮 / 2000人以上
    岗位职责 1、通过设计及监控可用性,延时等服务整体健康性指标,来运维线上服务 2、负责线上系统的可靠性改进,工作包括主导SLI/SLO制定,监控改进,容量管理,变更管理,应急响应,故障演练,OP改进等各种提升可靠性工作 3、保障云原生/分布式存储/消息中心/注册中心等多个核心系统的可靠性与正常运行,同时关注系统成本与稳定性; 4、负责自如网的核心基础设施架构设计、研发和持续交付 任职要求 1、大学本科及以上学历,3年以上运维工作经验; 2、具有云原生相关组件/分布式存储/消息中心/注册中心等系统运维经验(Nginx/Kubernetes/MQ/ZK/ETCD/Ceph等) 3、熟悉go、python等常用运维开发语言及框架; 4、熟悉主流容器化技术,具备Kubernetes使用经验; 5、有丰富的系统运维经验,对常见的系统隐患、系统故障有系统性总结和实际处理经验; 加分项 1、有自动化构建系统、配置管理、CI/CD系统、监控报警等自动化运维平台建设经验者优先; 2、有ServiceMesh使用维护经验者优先;
  • 20k-40k·13薪 经验不限 / 不限
    旅游|出行 / D轮及以上 / 500-2000人
    岗位职责: 1、负责服务稳定性建设,包括日常监控、故障处理、故障预案等,保障服务稳定性 2、参与制定核心服务的SLI/SLO指标以及错误预算指标 3、第一时间响应、处理和协调,并与研发共同解决各类突发事件,保证业务连续性 4、完善相关应用的监控告警、降级与预案建设,组织故障演练、应急止损、事故复盘等稳定性工作 5、参与保障各类活动(大促)的稳定性和用户体验 6、梳理、识别服务风险,解决或推动研发解决风险 岗位要求: 1、**本科及以上学历,具备5年以上工作经验,其中2年以上SRE相关经验; 2、熟悉AWS、阿里云等公有云服务运维,具备实践管理经验; 3、熟悉Linux操作系统,对计算机体系结构、网络、容器及虚拟化有较好理解,具备快速定位和处理告警或故障能⼒,具有CDN、k8s、中间件运维经验; 4、熟悉公有云产品高可用架构,对容灾建设、容量管理、性能优化有较深入理解; 5、较好的逻辑思维能力及沟通能力,高效的执行力,责任心强,工作积极严谨,对生产环境有敬畏之心; 6、抗压性强,良好的服务意识和团队合作精神。 7、熟悉Java/Golang语言开发优先
  • 36k-60k·15薪 经验5-10年 / 本科
    金融 / 上市公司 / 2000人以上
    岗位描述 1. 负责公有云/自建IDC各类系统的容量管理、成本管理、监控、故障处理等日常运营事项,保障业务稳定性; 2. 负责基础运维体系的搭建,包括资源管理,智能化,自动化等工具和平台建设,提升工作效率,降低运维成本 4. 负责团队日常管理,优化运维规范,流程,演练,应急预案等 岗位要求 1. ***本科及以上学历,计算机相关专业,至少5年以上的SRE相关经验; 2. 熟悉Linux操作系统和saltstack,ansible等自动化运维工具,以及Zabbix、Prometheus、Grafana等监控系统,并具备较强的故障排查经验; 3. 熟悉各类网络设备、服务器硬件的管理,有机房级部署和管理经验; 4. 熟练掌握Docker、Jenkins、ELK、Kubernetes、Nginx、Kafka等中间件与平台的部署和维护; 5. 深入理解Devops思想和相关工具链,有相关实践检验 6. 对操作系统、数据库、容器技术、虚拟化技术、TCP/IP协议、分布式计算框架的一个或多个等有较深入的理解 7. 精通shell,python或go其中一种语言 8. 对技术有强烈的好奇心,喜欢钻研;具有良好的学习能力,沟通技能,团队合作能力;有强烈的责任心和自我驱动力 9. 有运维团队管理经验者优先
  • 8k-10k·13薪 经验不限 / 本科
    工具类产品,软件服务|咨询,IT技术服务|咨询 / 不需要融资 / 500-2000人
    岗位职责 我们团队主要负责蚂蚁国际钱包科技SRE工作,在这里你可以学习到最前沿的电子支付技术架构以及产品 。我们主要业务方向是将国内成熟的移动支付 的技术服务到海外不同的国家和地区,为当地用户带来移动支付的便利。 包括东南亚 印尼Dana, 马来TNGD, 菲律宾GCash,韩国Kakaopay, 印度Paytm,南非Vodapay 岗位职责 1. 搭建及维护基础设施,如域名/反向代理/容器/主机/数据库/缓存/日志/存储等资源。 2. 支撑业务快速增长,管理资源容量,保证业务增长时不受容量限制。 3. 守护业务可用性,实施高可用方案,推动业务SLA提升。 4. 持续提升资源利用率,控制资源成本。 5. 制定监控规则、响应告警,支持业务线上需求和解决业务遇到的各种问题 岗位要求 1. 有强烈的技术热情,工作责任感,有开源社贡献优先; 2. 有良好的沟通,团队协作能力,熟悉DevOps流程。 3. 熟悉Linux系统及网络,熟练使用shell/python/go进行相关工作。 4. 熟练搭建及维护各类组件,如Nginx/Docker/Mysql/Redis/Prometheus,以及ansible/terraform等编排工具。 5. 熟悉混合云架构,有过云服务以及硬件服务器的维护经验。 6. 对K8S和aws、阿里云等公有云部署有一定的了解,可以trouble shooting,遇到问题,会通过查询相关配置或者跑命令的方式去解决紧急问题。 7.【加分项】英语可以口语沟通及书写。
  • 30k-40k 经验5-10年 / 本科
    游戏 / 不需要融资 / 2000人以上
    【岗位描述】 1、主导大规模云服务基础设施的设计、实施、优化并维护其高可用性; 2、 深度参与DevOps平台的开发和优化,包括但不限于告警、日志、CI/CD、WorkFlow等功能; 3、负责标准自动化DevOps Pipeline的建立和优化,管控优化运维流程。 【岗位要求】 1、本科及以上学历,5年以上相关工作经验者优先; 2、 熟悉至少一种主流公有云/私有云,包括但不限于Aliyun/腾讯云/AWS/GCP; 3、 熟悉至少一种自动化工具,如Terraform/Ansible/Saltstack等; 4、熟练使用 Shell,熟练使用 Python 或至少另外一种编程语言,有用 Golang 开发过系统性项目者优先; 5、熟悉 Linux 操作系统,拥有很强的排查、解决问题的能力; 6、 践行过运维自动化,有通过平台化且标准化的方式支持过公司的核心业务; 7、熟悉网络,主机,接入层等基础设施,了解数据库等组件的管理; 8、有K8s或Docker化经验者优先。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责穿山甲广告系统的机器资源管理、规划、成本治理,提升资源效率; 2、负责穿山甲广告系统运维工作自动化,包括线上变更、服务监控配置、资源管理等; 3、负责穿山甲广告系统的容灾方案设计、演练和实施; 4、参与穿山甲广告系统稳定性架构设计,保障系统的长期高可用和可维护。 职位要求: 1、具备较强的分析和解决问题能力,有强烈的责任心和良好的沟通能力; 2、本科及以上学历,计算机、软件工程相关专业,具备互联网业务运维经验; 3、具备扎实的计算机软件开发基础知识,精通 Linux 操作系统、网络、存储等相关原理; 4、熟悉一种或多种编程语言,包括但不限于 Shell/Python/Java/Golang/C 等; 5、有广告、推荐、搜索业务运维经验或大型云平台服务运维经验者优先。
  • 25k-50k 经验3-5年 / 本科
    科技金融 / 不需要融资 / 2000人以上
    岗位职责: 1、负责处理系统咨询类、操作类、业务类问题解答和处理; 2、负责系统常见问题和故障的定位和处理; 3、负责中间件,数据库性能的深入分析; 4、负责系统运维手册、应急预案等文档的维护; 5、负责系统日常监控、健康检查、生产应急等; 6、负责投产管理,质控管理及投产上线支持; 7、负责自动化运维,智慧运维的实践和研究; 8、负责运维开发的相关事宜。 职位要求: 1、本科及以上学历;计算机,软件工程等相关专业; 2、了解计算机软硬件、网络、设备等基础设施的基本知识; 3、了解操作系统、数据库、中间件等基础软件基本知识; 4、熟悉Java,python语言,能够编写脚本; 5、了解微服务架构,分布式架构; 6、有较强的沟通协调能力和执行力; 7、具有较好的抗压能力。
  • 20k-40k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、保障飞书会议核心系统的线上稳定性,对线上事故进行快速响应并建立机制、平台提升处理效率; 2、参与建设运维工具、平台,推进运维自动化; 3、通过持续的全方位数据运营(包括可用性指标、历史事故、资源利用率等),找到系统薄弱点,落地地改进项目; 4、积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档; 5、推动提升服务的可靠性、可扩展性以及性能优化,保障系统 SLA。 职位要求: 1、3 年以上后端或全栈开发经验,本科以上学历,计算机基础知识扎实,编码能力强; 2、熟悉常见服务端组件,如 Redis、MySQL、常见 MQ、etcd 等,并了解基本原理; 3、熟练掌握 CI/CD 工具的使用,如 Jenkins、Gitlab 等,了解常见前后端研发和发布流程; 4、熟悉 Linux 操作系统和常用开发调试工具,网络知识扎实,有平台化项目经验者优先; 5、熟悉 ELK 等日志平台组件,熟悉监控告警相关原理,有实战经验者优先; 6、有良好的沟通能力、自我驱动能力、业务理解能力和文档风格。
  • 15k-30k·15薪 经验3-5年 / 本科
    人工智能,软件开发 / B轮 / 150-500人
    职位描述: 1.Site Reliability Engineer,负责业务系统及各类在线服务可靠、稳定、高效运行; 2.设计研发服务运维解决方案,包括故障分析、弹性计算、容量管理、性能调优、持续交付; 3.精细化数据运营,包括可用性指标、历史事故、资源利用率等,挖掘系统薄弱点,落地改进项目; 4.积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档。 职位要求: 1.**本科及以上学历,3年以上相关工作经验,熟悉Linux系统,有计算机体系结构及网络方面的知识; 2.有Docker、Kubernetes等容器运维经验; 3.熟练掌握Go/Shell/Python至少一种编程语言; 4.强烈的责任心、进取心、团队合作精神和Ownership
具有以下条件者优先: 5.具有阿里云、AWS、腾讯云等云平台维护经验者优先。
  • 20k-30k·14薪 经验3-5年 / 本科
    软件服务|咨询,营销服务|咨询,数据服务|咨询 / B轮 / 150-500人
    岗位职责 1、保障公司业务的稳定、高效运行,快速响应业务需求、积极解决业务问题; 2、深入业务架构,结合运维相关的最佳实践,持续对线上系统进行优化; 3、持续梳理和完善业务运维文档,包括业务架构、监控报警指标、日常操作规范、应急预案等各类文档; 4、推动线上服务稳定性建设,提升服务的可靠性、可扩展性,保障系统 SLA; 5、参与 On-Call 值班,及时响应处理线上报警事件。 岗位要求 1、**本科及以上学历;至少 3 年以上互联网系统的运维经验; 2、熟悉 Linux 操作系统、计算机网络等,基础知识扎实; 3、有生产环境下 K8s 的使用和维护经验; 4、至少熟练掌握 Shell 或 Python 一种脚本语言; 5、具有良好的线上安全意识,有责任感,有良好的的服务意识和团队精神。 加分项 1、有丰富的 GCP 或 AWS 云平台使用经验 ; 2、有优秀的英文听说读写能力。 为什么加入我们 1、高速发展:公司处于快速发展期,规模及营收每年持续快速增长; 2、朝阳行业:国际电商 SaaS 服务赛道,国际一线投资机构加持,行业大佬背书; 3、多元文化:团队来自全球 20 多个不同城市,国际化视角、扁平化管理; 4、极客氛围:拥抱开源技术,实践敏捷开发,崇尚通过工具和自动化来解决问题; 5、特色福利:学习基金、 一对一帮带、内部商城、提供 MacBook 及可升降办公桌。