• 25k-50k 经验3-5年 / 本科
    文娱丨内容 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:基础架构 Observerability Infrastructure 可观测性基础设施团队负责(1)自研海量时序数据库、调用链路、日志系统;(2)一站式可观测性平台包括自定义大盘、智能报警和智能监控产品的归因自愈、链路排障分析,由此推动线上稳定性保障、故障诊断、容量管理和服务治理等能力构建。 1、负责云监控平台的实施交付,配合客户完成云监控的资源规划、服务迁移等工作; 2、负责梳理提炼用户的日常问题和需求,对平台环境中存在的问题进行定期反馈和推动改善; 3、维护客户关系,定期与客户和项目经理共享项目阶段总结,协助项目经理完成项目的执行、验收等工作,及时解决项目阶段中出现的各种问题,提高客户满意度; 4、按计划完成每个阶段的产品部署、升级进展和成果,确保项目验收合格,并负责已验收客户的维护工作。 职位要求: 1、本科及以上学历,1年以上相关工作经验; 2、熟悉Linux环境,熟练使用一种以上脚本语言; 3、熟悉Ansible、SaltStack、Puppet、Terraform等自动化部署和编排工具开发和使用; 4、熟悉Docker、Kubernetes等虚拟化/容器化/编排调度相关技术; 5、善于团队协作与独立工作,具备良好的沟通协调能力、积极认真的态度和较强的语言表达能力、抗压能力,有客户意识; 具备以下条件之一者优先: 1、有大型互联网公司系统开发、测试、运维工作经验; 2、有云计算、运维系统、分布式系统等任一方向研发经验; 3、有客户现场交付部署经验,有良好的用户导向,能与用户建立良好的沟通关系,及时发现客户的需求。
  • 25k-50k 经验3-5年 / 本科
    文娱丨内容 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:基础架构 Observerability Infrastructure 可观测性基础设施团队负责(1)自研海量时序数据库、调用链路、日志系统;(2)一站式可观测性平台包括自定义大盘、智能报警和智能监控产品的归因自愈、链路排障分析,由此推动线上稳定性保障、故障诊断、容量管理和服务治理等能力构建。 1、负责云监控平台的实施交付,配合客户完成云监控的资源规划、服务迁移等工作; 2、负责梳理提炼用户的日常问题和需求,对平台环境中存在的问题进行定期反馈和推动改善; 3、维护客户关系,定期与客户和项目经理共享项目阶段总结,协助项目经理完成项目的执行、验收等工作,及时解决项目阶段中出现的各种问题,提高客户满意度; 4、按计划完成每个阶段的产品部署、升级进展和成果,确保项目验收合格,并负责已验收客户的维护工作。 职位要求: 1、本科及以上学历,1年以上相关工作经验; 2、熟悉Linux环境,熟练使用一种以上脚本语言; 3、熟悉Ansible、SaltStack、Puppet、Terraform等自动化部署和编排工具开发和使用; 4、熟悉Docker、Kubernetes等虚拟化/容器化/编排调度相关技术; 5、善于团队协作与独立工作,具备良好的沟通协调能力、积极认真的态度和较强的语言表达能力、抗压能力,有客户意识; 具备以下条件之一者优先: 1、有大型互联网公司系统开发、测试、运维工作经验; 2、有云计算、运维系统、分布式系统等任一方向研发经验; 3、有客户现场交付部署经验,有良好的用户导向,能与用户建立良好的沟通关系,及时发现客户的需求。
  • 15k-30k·13薪 经验1-3年 / 本科
    人工智能服务,IT技术服务|咨询 / 不需要融资 / 500-2000人
    工作职责:1、负责北京银行容器云平台建设和日常运维工作;2、负责docker和K8S的部署和运维;3、持续梳理并优化容器云平台的架构和稳定性;4、助力业务线落地,输出解决方案,解决实际应用中的问题;5、优化平台资源,不断提高资源的利用率。任职要求:1、年龄30周岁(含)以下,***大学本科及以上学历,计算机、通信等相关专业;2、相关领域工作经验至少3年以上;3、精通Kubernets、Docker架构原理,配置调优与故障诊断;4、精通Linux操作系统管理、配置。5、熟悉Linux常用开源组件(Nginx、HAProxy、MySql、Redis,ELK等)的安装和配置;6、具有CKA、CKAD、CKS等相关证书者优先考虑;7、具备良好的服务意识,善于主动思考,自我驱动力强,有良好的沟通、协调能力,富有团队精神,有一定的抗压能力。
  • 15k-30k·13薪 经验3-5年 / 本科
    人工智能服务,IT技术服务|咨询 / 不需要融资 / 500-2000人
    工作职责1.负责存储日常巡检、生产变更、硬件报修、分盘、扩容、迁移、容灾及主机端操作等;2、负责存储架构优化;3、负责存储领域自动化运维能力提升;4、负责存储服务成本、性能、可靠性的优化。任职要求:1、年龄32周岁(含)以下,***大学本科及以上学历,计算机、通信等相关专业;2、相关领域工作经验至少5年以上;3、精通NAS、SAN等存储架构原理;4、精通存储光纤交换机配置;5、精通分布式存储常用技术原理,能够定位处理疑难存储问题;6、熟悉EMC VMAX存储、华为Dorado存储等产品运维,熟悉其他主流厂商服务器、磁盘阵列、存储交换机等相关产品,如:HPE、宏衫、Netapp、华为、博科等;7、深入理解Linux系统,精于分布式系统的架构设计和运维设计;8、熟悉Redhat、Windows等主流操作系统安装、配置和调优;9、具有HCIE-Storage、RHCE等相关证书者优先考虑;10、相关领域工作经验至少5年以上;11、具备良好的服务意识,善于主动思考,自我驱动力强,有良好的沟通、协调能力,富有团队精神,有一定的抗压能力。
  • 8k-12k·14薪 经验1年以下 / 本科
    人工智能服务,软件服务|咨询 / A轮 / 50-150人
    岗位职责描述: 1、应用、系统、网络、物理设备等日常运行情况的7*24 小时监控及巡检; 2、根据公司的报警及事故处理标准进行通知、汇报、记录、跟进、分析总结; 3、进行网络、系统和应用等故障的初步分析、判断及解决; 4、配合运维及项目部门处理相关业务,如上架,部署应用,发布等; 5、主动发现工作的不足之处,提出改进建议;" 任职资格: 1、语言表达流畅、逻辑清晰,能清晰地记录和反馈系统的情况 2、心理素质稳定,能分清事情的轻重缓急,随机应变,反应敏捷,对各类系统情况进行处理 3、有强烈的责任感,能将事情跟踪到底,达到闭环 4、诚信正直,性格外向,乐观,具有一定的学习能力,自我驱动力强 5、能够适应7*24小时综合工时制",做三休三
  • 10k-13k 经验3-5年 / 本科
    IT技术服务|咨询,软件服务|咨询 / 不需要融资 / 2000人以上
    不值班不出差少加班。环境管理的运维人员,要求熟悉sql,熟悉linux命令,可以执行部署验证,初级沟通主动就行。运维/DBA岗位会比较好找点,学历需要本科,薪资12-13K以内吧。在保税区上班,面试官同事在南山区科技生态园。
  • 30k-60k·16薪 经验5-10年 / 本科
    社交 / 上市公司 / 2000人以上
    1、负责公司监控系统的技术设计和迭代上线,持续提升技术保障能力; 2、提炼相关技术标准,服务公司内外部客户,不断提升服务质量监控覆盖; 3、对相关前沿技术、开源监控产品、监控协议进行研究,并结合客户需求规划技术路标。 4、主导监控系统集成开发、交付工作,根据客户业务特点梳理关键监控技术点、制定监控方案并交付落地。 5、站在用户角度,贴近业务思考。 职位要求: 1、本科以上学历,5年以上软件开发经验,其中2年以上互联网运维相关系统设计经验; 2、熟悉互联网运维的业务,有运维技术标准制定的经验; 3、熟悉Prometheus、OpenTracing、Fluentd、OpenTelemetry、Thano 等主流开源软件或协议,能够进行集成和二次开发; 4、掌握Kafka/Flink/ClickHouse/Elastic Search等常用软件架构; 5、良好的沟通能力,善于抓住客户需求关键点并制定技术方案。 6、有统一监控告警平台开发、交付经验者优先。
  • 30k-60k·16薪 经验5-10年 / 本科
    社交 / 上市公司 / 2000人以上
    1、负责公司监控系统的技术设计和迭代上线,持续提升技术保障能力; 2、提炼相关技术标准,服务公司内外部客户,不断提升服务质量监控覆盖; 3、对相关前沿技术、开源监控产品、监控协议进行研究,并结合客户需求规划技术路标。 4、主导监控系统集成开发、交付工作,根据客户业务特点梳理关键监控技术点、制定监控方案并交付落地。 5、站在用户角度,贴近业务思考。 职位要求: 1、本科以上学历,5年以上软件开发经验,其中2年以上互联网运维相关系统设计经验; 2、熟悉互联网运维的业务,有运维技术标准制定的经验; 3、熟悉Prometheus、OpenTracing、Fluentd、OpenTelemetry、Thano 等主流开源软件或协议,能够进行集成和二次开发; 4、掌握Kafka/Flink/ClickHouse/Elastic Search等常用软件架构; 5、良好的沟通能力,善于抓住客户需求关键点并制定技术方案。 6、有统一监控告警平台开发、交付经验者优先。
  • 电商平台,软件服务|咨询,IT技术服务|咨询 / 未融资 / 50-150人
    专业要求: ->计算机、软件工程、电子信息、项目管理相关专业 ->或者经济、金融、会计、数学、统计等专业有相关工作经历. ->本科及以上学历,专业工作经历不限 岗位职责: 1、协助做好个贷资产质量运行监测、分析和检查监督。 2、对网贷业务、线下个贷业务开展在线监测和检查监督,定期提交监测报告。 3、提出报表优化需求、开展测试等。 技术要求: 本科学信网可查以上学历,了解个人信贷业务,有资产质量管理经验、报表工作经验。
  • 5k-8k·15薪 经验不限 / 大专
    金融 / 不需要融资 / 15-50人
    岗位职责:1.负责交易页面相关的异常报警2.负责撰写和更新交易监控相关文档3.机房的日常检查4.领导交办的其他事宜。(一般以整理更新文档为主)职位要求:1.工作认真,细致,高度责任心。2.学历大专以上,经验不限。
  • 25k-50k·15薪 经验3-5年 / 本科
    电商平台 / 上市公司 / 500-2000人
    团队简介:STO-SRE Shopee Tech Ops SRE(Site Reliabilitiy Engineering)团队的使命是确保Shopee 24/7的高效和可持续性运转,从系统的可用性和效能出发,组建和维护大规模、高可用、高效能的分布式系统,是结合传统软件工程与系统运维形成的新体系。SRE团队需要深入Shopee各业务线,在于确保基础设施在快速演进的同时,具备高可用性以及扩展性,并从稳定性和效能的角度切入到业务研发,基础平台各部分组件(中间件、容器调度、缓存、对象存储等)的设计,OS的优化,数据中心和网络的优化,通过工程化和服务化手段来优化传统运维模式中低效,繁复的操作,并致力于建设完善的监控体系以提高故障处理效率。 岗位描述: 1. 负责应用系统资源(包括云和非云环境的系统、网络、存储等资源)的统筹规划和管控,提供稳定高效持续的应用系统资源交付能力,提高整体研发的效率,降低成本; 2. 负责海量系统高可用体系建设,如故障自动定位、自动恢复、自适应容灾等,保障业务持续可用 3. 参与应用系统架构规划和设计,推动或主导关键技术演进,提升资源的弹性、可扩展和质量; 4.负责各业务线的全链路压测,确保无单点,确保各组件的性能和可靠性; 5. 深入业务线,理解客户需求和业务需求,推动产品的可扩展性、稳定性和效能; 6.自动化运维平台个组件的设计和开发 岗位要求: 1. 本科及以上,2年以上工作经验,大型互联网公司或者大型IT企业应用运维经验者优先; 2.熟悉Python、Shell或Go,熟练编写各种日常工具,熟悉Django、Flask或GIN框架; 3.精通linux/unix操作系统,熟悉TCP/HTTP协议,熟悉性能调优,熟悉使用相关压测,监控等工具; 4.熟悉多种开源组件:Ansible、SaltStack、KVM、Nginx、LVS、Jenkins、Git、Memcached、Redis、Mysql/SQL等; 5. 熟悉Docker技术和对应的PaaS体系架构。有容器、调度相关经验或了解Mesos、Docker、Kubernetes、等相关技术者优先。 6.了解PaaS平台建设者或熟悉运维自动化体系建设; 7. 有单元化,异地多活容灾系统架构演化落地经验者优先; 8.熟悉阿里云,腾讯云,AWS,GoogleCloud 运维者优先; 9. 优秀的沟通、表达与组织协作团队合作能力,适应多元化国际化工作环境,具备一定的创新能力。
  • 18k-30k·15薪 经验5-10年 / 本科
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    岗位要求: 负责多个数据中心的监控系统的运维; 负责对监控体系的数据库、分布式存储模块的运维和性能优化; 负责监控服务体系建设与内容运维,管控监控数据的生命周期; 负责完整监控体系的集成、搭建和部署; 具负责监控体系的架构优化和智能化监控的建设,不断提升监控和报警的精确度; 任职资格: 1、有主动发现问题,对新技术进行探索和实践,对监控报警体系进行持续优化。 2、计算机及相关专业本科及以上学历,5年以上Linux系统运维相关经验,3年以上互联网行业相关工作; 3、Linux基础知识扎实,熟练掌握日常系统操作、常用软件服务部署等; 3、掌握主流开源监控软件的架构、配置使用,如Zabbix、Prometheus、Grafana等,具备较强的Troubleshooting能力; 4、有生产环境核心组件、业务、数据库、分布式存储中间件监控经验,并生成各种监控报表; 4、熟悉ELK日志分析系统; 5. 熟悉shell、python脚本编写和开发,能利用其开发脚本工具; 6. 具备良好的团队合作能力,学习能力,分析解决问题能力,能独立承担任务; 加分项 1. 拥有从0到1的大型生产环境的监控体系建设经验; 2. 拥有智能化运维监控相关的工作经验;
  • 8k-9k 经验1-3年 / 大专
    数据服务 / 未融资 / 2000人以上
    NOC监控运维工程师岗位描述 1、全天候监控系统、网络和业务实时运行状态,保障业务系统的高可用性; 2、依据告警信息能快速判断故障影响范围,快速定位故障并处理恢复业务; 3、报障快速响应,重大故障期间能主导故障处理,协调各个团队协同工作; 4、负责撰写故障及安全隐患处理报告,给出合理的改进建议及预防措施;5、与运营商故障管理的对接工作,及时对故障报修,跟进恢复情况; 职位要求: 1、熟悉Linux系统基本操作,能使用Shell或Python进行脚本编写; 2、熟悉网络基础知识,能快速判断基本的网络异常原因; 3、熟悉常用的监控工具如zabbix、nagios、cacti等等; 4、为人诚信、责任心强,良好的对外沟通和团队协作能力; 5、计算机、网络、电子等相关专业; 6、能适应白/夜倒班工作。 6天早班-休息2天-6天午班-休息2天-6天晚班-休息2天 早班:早上7点30分到下午15:30分 午班:下午15:30分到下午11:30分 晚班:晚上11:30分到早上7点30分
  • 15k-30k 经验3-5年 / 本科
    金融业 / 上市公司 / 2000人以上
    1、负责公司统一监控系统开发和维护。 2、保证公司的基础设施、系统、中间件、业务系统等IT资源得到有效监控和管理,保证其安全、稳定、高效运行。 任职要求: 1、重点大学本科及以上,计算机或相关专业,3年以上相关领域工作经验; 2、熟悉Linux和Windows系统管理,较强脚本编程能力(shell或powershell),至少熟练掌握Go/Python/Java语言中一种; 3、有常用开源监控系统(Zabbix、Prometheus、Open-falcon等)运维和管理经验; 4、熟悉K8S和容器技术,有扎实Go语言技能,有自研监控系统或在Prometheus、Open-falcon二次开发经验; 5、智能运维(AIOps)经验者优先; 6、大型互联网公司运维开发经验者、开源社区贡献者优先。
  • 文娱丨内容 / 上市公司 / 2000人以上
    职位描述负责公司基础设施、中间件、业务应用等的监控系统建设;主导或参与系统设计、研发、部署等工作;参与部分生产系统的维护工作,承接新需求、解决线上问题;对现有系统熟练掌握并能够提出优化方案;能够根据行业标准,指定系统演进方向,并主导逐步落地实施;职位要求大学本科以上学历;精通java或go语言,精通linux系统;熟悉 Redis、Memcache、消息队列等基础技术;两年以上运维开发项目经验;有大型分布式系统设计和实践经验;有大规模监控系统建设经验;熟悉业内常用的监控解决方案, 如ELK、Zabbix、Prometheus等;较强的分析和解决问题的能力,强烈责任感、 缜密的逻辑思维能力;能够承受较高的工作压力;有强烈的工作责任心;有较好的沟通能力;有良好的团队合作精神;有开源项目贡献者或开源项目领导者优先;