• 25k-35k 经验3-5年 / 本科
    金融 / 上市公司 / 2000人以上
    工作职责 1、制定系统稳定性方案及度量体系,掌控系统可用性风险,针对各类隐患做好故障防范和应急方案,保障系统稳定性SLA达成; 2、推动重大稳定性治理项目,识别系统的风险/效能/成本问题,构建以稳定性为核心的工程技术平台,持续优化1-5-10应急响应机制(1分钟告警、5分钟定位、10分钟恢复); 3、制定运维领域智能化规划,运用平台已有能力,对于团队工作问题提出针对性智能化解决方案,改进工作效率和质量; 4、关注行业动态和新技术发展,探索前沿AI技术在运维领域的创新应用,推动新技术在运维场景中的落地应用,升级运维体系。 任职要求 1、本科及以上学历,计算机相关专业,3年以上系统运维(SRE)或系统架构稳定性设计经验; 2、熟悉云原生和AI主流应用架构,能根据运维场景利用AI技术进行工作流优化重构; 3、具备良好的项目管理和沟通能力,作为技术牵头人推动运维自动化/智能化项目落地; 4、有知名互联网公司工作经历者优先。
  • 25k-50k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、保障全公司包括抖音、国际化短视频、广告等业务的数据稳定性,提升数据平台服务产品质量,保障业务的持续可用; 2、基于运维经验、工具、平台对线上事故快速响应提升处理效率,同时优化运维体系,推动提升服务可靠性、可扩展性,保障系统SLA,同时推进运维自动化提效; 3、通过持续的全方位运营,包括运维规范及最佳实践、监控及可用性指标、历史事故等,为数据高可用架构设计和选型提供指导,同时能够系统性排查架构风险隐患,推进改进项落地; 4、参与大数据运维平台的研发、自动化建设与持续迭代,引导产品的运维模式向数字化,智能化方向发展演进。 职位要求: 1、计算机相关专业,本科及以上学历; 2、3年及以上SRE运维经验,熟悉运维体系建设与稳定性保障; 3、熟悉Linux、网络等系统运维技能,具备运维问题分析、应急解决以及性能调优等能力; 4、熟悉至少一门编程语言,包括但不限于:Shell、Python、Java、Scala、PHP、Go等; 5、具备良好的沟通表达、团队协作以及自驱能力,促进跨团队的合作; 6、有大数据稳定性问题排查经验,具备清晰排查思路,具备快速定位问题能力加分。
  • 10k-20k 经验10年以上 / 本科
    软件开发、企业服务 / A轮 / 50-150人
    任职资格: 1、熟悉 Go/Python/Shell 开发。 2、熟悉Linux操作系统,能进行基本的性能优化。 3、熟悉信创生态,包括国产服务器、国产操作系统、国产数据库、国产中间件等。 4、熟悉kubernetes生态,能进行基本的问题排查解决。 5、熟悉主流互联网架构体系和常用组件的使用与优化,如 PostgreSQL、Nginx、 Kafka、Redis、Rabbitmq、Elasticsearch 等。 6、熟悉主流监控系统,包括不限于 zabbix/prometheus/openfalcon/nightingale等。 7、熟悉CI/CD工具,如ansible、jenkins、Tekton、argocd、gitlab等,掌握jenkins pipeline或者yaml 流水线开发能力。 8、具有公有云如阿里云、华为云等经验。 9、熟悉开源云计算与虚拟化技术,具有实际项目经验。 岗位职责: 1、负责平台及应用的自动化部署及维护; 2、负责产品的实施交付及问题support; 3、负责平台相关的自动化流程开发和持续改进,包括流程的开发、测试和运维; 4、及时响应业务需求,处理故障或者其它突发情况,保证业务稳定运行; 5、从运维角度主动识别业务架构和技术方案的风险,并给出专业的解决方案; 6、负责技术文档手册编写、更新,经验总结沉淀,培训分享。
  • 20k-30k 经验5-10年 / 本科
    人工智能服务 / B轮 / 150-500人
    岗位职责: 1.全面管理运维工作,包括应用配置管理、系统监控、容量评估、扩容、容灾、架构改造等;处理系统故障,缩短故障影响时长,跟进、推动重大事件改进措施实施,保障SaaS和专有云稳定高效的部署及运行 ; 2.深入研究运维相关技术及团队业务,设计、规划以及完善现有运维业务体系及平台建设,支撑团队在资源管理、部署、监控、日志、容灾切换、弹性伸缩、故障分析处理等运维领域能力提升; 3.参与业务的长期规划,把握业界devops运维领域的方向和趋势,具有较强的运维平台产品规划能力,保障产品运维能力业界领先; 4.保障运维安全,建立运维安全防护能力,主动探索、研究新的运维技术方向。 任职要求: 1.本科及以上学历,5年以上运维相关工作经验; 2.了解Devops理念、熟悉devops前沿技术、有主导DevOps工具链产品交付经验者优先; 3.熟悉Prometheus、Grafana、skywalking等常用监控组件的监控系统管理与调优; 4.具有公有云(阿里云腾讯云华为云等)运维经验,有大规模集群操盘经验者优先; 5.有大数据运维系统架构经验者优先。
  • 30k-45k·16薪 经验5-10年 / 本科
    企业服务 / 未融资 / 少于15人
    岗位职责: 1、负责生产系统的监控,审查,故障响应、排查、解决与后续优化推进工作。 2、推动系统运维工作的标准化,自动化,平台建设,提升系统运维的工作质量和效率。 3、持续监控和审查系统架构合理性、流程逻辑合理性,系统性能、稳定性等技术领域和指标,并有责任和权利驱动业务团队解决问题。 4、负责对事件及故障进行分析和总结,出具技术方案,并推动相关团队解决. 5. 梳理并挖掘系统运维中的优化点并加以改进. 任职要求: 1、本科及以上学历,计算机软件或相关专业,5年以上相关工作经验。 2、熟悉linux系统,熟悉go、shell、python等语言中至少一种,可以用ansible/saltstack等实现配置管理。 3、熟悉互联网技术架构,对网络通讯协议、应用服务器、负载均衡、微服务架构有较深入的理解。 4、熟悉容器技术,掌握docker、k8s的技术原理,至少2年以上经验。 5、熟悉主流云计算相关技术,如AWS/AliCloud,有实际使用经验优先. 6、熟悉Kafka/ZooKeeper/Redis/ElastiSearch等常见中间件,理解其应用场景. 7、优秀的逻辑思维能力和沟通技巧,具备良好的业务理解能力和挖掘定位问题的能力,有清晰的问题排查思路。 8、在基础设置即代码(Terraform)/大规模监控/Nginx开发/数据分析和治理/容器技术,任一方向有深度研究的将会是加分项。 9、对工作有热情且自我驱动,对于技术有执着的追求。
  • 25k-35k·15薪 经验5-10年 / 大专
    工具类产品,专业服务|咨询 / 未融资 / 50-150人
    1、负责日常环境运维及服务保障工作,故障发现、故障应急、演练等; 2、解决和分析运维工作中的重大故障,推进性能瓶颈优化、架构优化调整等; 3、深度参与运维与架构、体系建设(含:监控、配管、自动化、运维流程等),能够快速适配业务发展需求; 4、相关新技术的研究及落地实施。
  • 20k-30k 经验5-10年 / 本科
    人工智能,物联网 / 不需要融资 / 500-2000人
    岗位职责: 1、负责云原生系统架构、安全架构、网络架构和存储架构的支持、技术难点组攻坚以及监控运维产品设计及研发落地。 2、规划和落地云原生技术底座,结合多活架构,统筹中心云、区域云、边缘云,打造算力弹性扩展、流量统一调度、计算与存储协同的分布式基础设施。 3、负责Kubernetes周边产品和生态系统建设,从稳定性、成本、效率方面提升整体运营水平,系统化建立云原生能力体系。 4、参与技术评审,对技术方案合理性、架构符合性、项目运作规范性等提供参考意见。 任职要求: 1、本科及以上学历计算机相关专业学历,5年以上实际开发经历,同时具备3年以上微服务相关应用架构或云原生技术架构设计工作经验。 2、掌握Java/Go/Python等至少一种编程语言。精通Linux操作系统底层知识,基础管理与操作维护。 3、熟悉容器云平台相关领域业务和技术知识,具有深厚的技术背景,熟练掌握K8S/Docker/微服务/Services mesh/Serverless等主流云原生技术体系。 4、熟悉网络、安全、云原生、Devops、存储、数据库等前后端领域相关技术架构,能够结合实际情况灵活运用。 5、精通Docker、K8S、prometheus、grafana 、Istio等开源产品。熟悉掌握分布式系统原理,有较深入认识,有微服务开发经验。 6、具备较强的逻辑思维和宏观抽象能力,能够清晰简洁、通俗易懂的表达技术问题。对新事物保持敏感和好奇心,具备产品化思维,能积极主动关注云计算行业产品与技术的演进趋势。
  • 70k-100k·15薪 经验10年以上 / 本科
    企业服务 / 不需要融资 / 50-150人
    工作职责: 1、深入理解业务需求,设计有效的资源效能提升方案,提高资源效能,降低资源投入成本。 2、负责大数据和交易业务混部方案设计和落地,解决项目落地过程中遇到的各种挑战。 岗位要求: 1、熟悉基础架构和大数据组件技术、技术架构和业务场景。 2、有知名大厂资源效能提升项目落地经验优化。 3、熟悉大数据组件,有大数据混合部署项目经验优化。 4、有K8S相关项目经验优先。 要有大数据混合部署经验,
  • 30k-40k·14薪 经验3-5年 / 本科
    社交平台 / 未融资 / 50-150人
    职责: 1.负责AWS服务器、网络和应用系统的运维管理; 2.维护AWS安全监控平台,对业务系统的监控分析、故障排查,以及紧急情况下的应急处理; 3.高并发访问情况下的应用系统架构设计,系统扩容的方案制定及实施; 要求: 1. 3年以上AWS运维经验,熟悉Linux操作系统和容器化(K8S),熟悉操作系统相关性能参数收集和调整,如文件系统、网络等性能调整和优化; 2. 熟悉Nginx,ELK、S3、CloudFront、Rocket等常用软件维护和监控系统; 3. 熟悉Mysql和MongoDB等数据库。 4. 熟练掌握AWS云平台构筑技术(计算,网络,安全,存储)
  • 25k-35k·15薪 经验10年以上 / 本科
    移动互联网 / 不需要融资 / 2000人以上
    PASS运维专家 岗位职责: 1、牵头负责卓望PaaS业务领域技术体系规划和建设,包括工具手段建设和团队梯队培养建设,打造卓望PaaS领域的服务技术团队; 2、结合业界技术发展趋势和服务项目交付的实际经验,规划设计包装面向PaaS垂直细分领域的服务产品,并支撑市场团队进行推广落地; 3、负责PAAS平台技术栈复杂问题处理(应急,故障,架构等),以及各类系统高阶运维架构工作,包括运维架构设计、巡检监控、故障分析、性能调优; 4、作为行业专家和公司技术专家参加,参与公司重点客户和重点项目的交付,包括各种会议; 5、负责PAAS运维工作工具手段打造,结合行业经验和主流技术,搭建卓望的PAAS运维平台体系; 6、负责PAAS中间件的整体架构的规划设计和标准制定。 7、负责PAAS平台服务梳理,计划制定、技术设计及实现。 8、参与服务性能优化,深入理解业务场景,解决性能瓶颈,实现业务目标。 任职要求: 1、本科学历及以上,主要从事PAAS平台中间件相关工作,8年以上云行业相关的PAAS中间件支持或者丰富的中间件产品经验。 2、熟悉Nginx、Redis、Kafka、Nacos、Zookeeper、Pulsar、RocketMQ、RabbitMQ、Consul等中间件的生产部署、配置和性能调优;能够对高并发、大流量场景下中间件的应用、调优和改进。 3、熟悉Shell/Python中至少一种编程语言; 4、熟悉Linux操作系统的生产配置、管理及优化和调试,和TCP/IP网络协议栈及协议分析。 5、有集群的日常运维包括Kubernetes、kafka、elasticsearch、etcd等组件的服务的经验优先。 6、具备扎实的操作系统,数据结构,工程架构设计能力,学习能力强,自驱性强,有丰富的大项目实战经验和问题诊断分析,定位解决能力。 7、深入了解网络云主流技术与架构规范,具备优良的学习能力,具备基本的英文技术文档阅读能力,和中文技术文档编写能力。 8、具有云计算相关认证CKA、CKS、RHCA、RHCE证书优先。 10、具备极强的学习能力和沟通能力,责任心强,具有创新精神和团队合作精神。 11、能适应客户现场工作及出差。 12、政治素质好,遵守纪律,品行端正,爱岗敬业,党员优先。
  • 25k-50k·15薪 经验5-10年 / 本科
    在线教育 / C轮 / 2000人以上
    工作职责 1.负责系统平台运维工作,包括环境部署、故障排查、架构优化、核心链路服务稳定性建设等相关工作; 2.实现分布式集群的高可用运维,制定业务相关的运维技术方案,确保业务高效稳定的运行; 3.负责应用监控和告警方案的设计,实现快速发现线上问题并协助定位问题; 4.参与重大活动和产品的设计过程,对技术风险领域进行评审和分析; 5.参与设计、开发提高稳定性、工程效率、资源效率的相关运维自动化工具与平台; 6.应用相关技术实现运维成本控制,优化并提升资源利用率,通过技术手段完成高效运维服务支持。 任职资格 1.计算机相关专业,本科及以上学历,至少3年以上的大规模系统运维经验; 2.熟悉Linux、Docker、K8S运维,有K8S平台服务编排、性能调优、监控、故障诊断等实践经验; 3.掌握Nginx,Redis,消息队列,分布式服务调用框架等基础组件,有微服务架构经验及Istio等云原生技术栈能力尤佳; 4.有devops开发经验或有中大型互联网公司运维自动化经验者优先; 5.熟悉TCP/IP、HTTP等协议,有良好的网络、数据传输、安全、计算机体系结构方面的知识; 6.熟练使用公有云产品,包括不限于阿里云、腾讯云、AWS等; 7.掌握python/shell/golang/java等任意一种以上的编程语言,有运维自动化开发经验为加分项; 8.良好的沟通表达能力、技术文档编写能力; 9.能够自主思考,具有自驱动性,对于新技术保持兴趣。
  • 40k-60k·16薪 经验5-10年 / 本科
    软件服务|咨询,IT技术服务|咨询,科技金融 / 不需要融资 / 2000人以上
    工作职责: 1、根据公司战略和业务发展的要求,设计系统运维方案和基础架构,并优化演进 2、深入理解业务线各项业务系统,研究、规划并建立支持大规模集群的运维管理平台和工具 3、深度参与业务系统的设计与实施,主导系统架构的可靠性、可运维性设计、容量规划 4、不断探索和研究前沿的运维、基础架构技术方向和工具,通过赋能提升运维和研发的交付效率 5、制定运维和基础资源需求计划,合理使用资源,有效控制成本 任职资格: 1、本科及以上学历,具备至少5年以上互联网行业运维经验,具备大规模、高可用集群的运维规划设计与实现经验 2、精通分布式管理、大规模集群、容灾、备份、负载均衡等技术,对高可用、高并发架构、容量规划和疑难问题有深度和丰富经验 3、具备较强的工程与开发能力, 至少精通一个运维或基础架构子领域,数据库、SRE、DevOps、信息安全和云原生等 4、具备一定项目管理能力,具备系统化解决问题的思考能力 5、具有强烈的团队协作意识,高度的责任感,勇于承担压力,对工作积极严谨,有较强的逻辑思维能力、学习创新能力
  • 35k-50k·14薪 经验5-10年 / 本科
    游戏,软件服务|咨询,区块链 / 未融资 / 15-50人
    任职要求: ·5年以上相关工作经验.本科以上学历,计算机及相关专业: ·精通linux操作系统,对系统有深入理解; ·精通至少一门脚本语言与静态语言,有大规模系统设计经验者优先; ·熟悉TCP/P与HTTP协议,对协议有深入理解与实际排错经验者优先; ·熟悉容器技术与容器编排技术,有k8s生产运维经验者优先; ·熟悉数据库原理,对常见数据库引擎有深入理解者优先; ·对分布式分布式系统有深入理解,熟悉互联网常用开源基础组件(nginx,redis,kafka, mysl,hbase,zookeeper,hadoop等): ·有大数据运维及开发经验者和机器学习算法经验者优先; ·有持续集成/持续部署经验加分,有超大规模集群管理经验者优先; ·责任心强,积极主动,热爱学习,注重团队合作; ·加分项:熟悉运维常用的工具漏洞,以及linux服务器常见漏洞以及优化。 岗位职责: ·负责部门核心系统和应用的线上监控和告警实施,保障系统的稳定运行 ·参与线上突发事件管理,分析定位,处理和跟踪改进; ·对系统进行资源统计,性能评估和容量规划; ·推进部门devops落地,全方位建设提升运维能力(持续集成,应用发布,持续部署,监控告警,应急预案,智能运维等); ·推进运维标准化,自动化和智能化(AlOps)。
  • 25k-35k·15薪 经验5-10年 / 本科
    移动互联网 / 不需要融资 / 2000人以上
    岗位职责: 1、负责运维服务方案和产品的设计、开发和实施,完成服务产品相关的文档、报告等工作; 2、负责服务产品的包装输出,支撑一线售前和销售,协助产品完成对外拓展和重点客户沟通交流,负责产品线的横向拉通和向下赋能,对产品在区域的落地和优化提供支撑; 3、作为行业专家和公司技术专家参加,参与公司重点客户和重点项目的交付,包括各种会议; 4、完成负责服务产品线的管理,包括对产品的方案、团队、能力、工具、效能的整体规划、设计、标准的制定和管理等; 5、对运维服务进行市场调研,结合客户需求进行服务产品优化; 6、助力已有产品新业务的拓展,以及新产品的打造和设计; 7、提高运维服务的竞争力,提升团队效能和技术能力建设,推动服务产品支撑工具的建设和落地。 任职要求: 1、本科学历及以上,计算机或通信专业。8年以上的IT系统运维工作经验,有较丰富的运维项目管理经验。 2、深刻理解运维服务的痛点与难点,对业务有深度洞察,推动能解决客户问题的新技术方案的研发。 3、能跟踪运维的前沿技术发展趋势,结合公司战略方向和实践状况,适时地提出和推荐新的和有价值的运维技术措施及方法。 4、精通主机、网络、存储、数据库、大数据、云计算等业务领域中1-2个方向,熟悉国内外常用技术标准,在上述领域有丰富的理论研究或实践经验,能够指导团队成员高效开展相关工作。 5、精通服务管理理论,熟悉各项运维服务内容和流程,能够独立负责中大型运维服务项目的实施。 6、具有产品经理的视野和知识,熟悉运维服务行业和主要竞争对手。 7、有优秀的数据分析能力,能够对市场需求和产品数据进行有效的分析。 8、有良好的文档编写能力,能够清晰、简洁地描述产品功能。 9、沟通能力强,能够有效地与内外部团队合作。 10、具有主流中级以上IT技术资格认证和项目管理认证。 11、能适应客户现场工作及出差。
  • 50k-80k·15薪 经验5-10年 / 本科
    硬件 / 不需要融资 / 2000人以上
    岗位职责: 1,负责k8s集群稳定性保障,高可用优化方案设计与落地,建立故障恢复和演练机制。 2,负责容器自动化运维能力建设。 岗位要求: 1、深入了解K8S集群基础概念和原理,具备生产级容器系统管理经验,有istio等service mesh经验优先 2、了解Docker底层原理,了解Linux kernel核心子系统(内存管理,文件系统,网络,进程调度等)基本原理。 3、熟悉网络基本原理,熟悉tcp/ip协议,熟悉容器网络基本原理。 4、熟练使用Prometheuse等监控工具对K8S集群进行监控和告警管理 5、掌握bash/python/go中的一种或多种语言,有运维开发经验。 6、熟悉常见CI/CD和自动化运维工具。 7、具备良好的沟通能力和强烈责任心,有良好的工作流程,文档指定撰写习惯。 8、有大规模容器/虚拟机/物理机等相关运维经验者优先 9、具备成熟的稳定性体系化建设思想和实践是加分项