• 文娱丨内容 / D轮及以上 / 2000人以上
    职位职责: 1、完善监控告警、系统可观测性、问题定位等中台系统建设,支撑抖音/火山/直播/国际化产品等业务; 2、深入业务优化告警规则,开发多样的异常发现系统,优化异常触达的准召率、发现时间、恢复时间等指标; 3、告警分析引擎开发、提高服务治理和运维效率; 4、支持分布式服务异常排查、构建系统异常应对平台,提高事故处理效率。 职位要求: 1、本科及以上学历,计算机、通信等相关专业,2年以上工作经验; 2、熟练掌握 Linux环境下的 Go/C/C++/Python/Shell 等1至2种以上语言; 2、熟悉 OpenTSDB、Prometheus、Influxdb 等主流容器监控后端系统; 3、具备线上问题处理、排查和定位的能力; 4、有监控和告警系统开发经验者优先; 5、有开源项目贡献经验优先。 5、有开源项目贡献经验优先。
  • 25k-50k·15薪 经验3-5年 / 本科
    电商平台 / 上市公司 / 500-2000人
    岗位职责: 1、负责虾皮监控告警平台后的设计与开发; 2、负责监控平台自有链路采集与采集器框架开发功能; 3、参与代码评审和代码开源改造。 岗位要求: 1、大学本科及以上学历,计算机或者相关专业; 2、熟悉Golang开发流程,有异步逻辑开发经历,深入了解多线程、网络等基础框架; 3、熟悉大型分布式系统设计与开发; 4、熟悉Unix/Linux操作系统下的开发,部署,维护等工作; 5、熟悉业界时序数据库,influxdb,opentsdb, ClickHouse等,熟悉业界监控产品,zabbix,Prometheus等, 有相关开发经验者优先; 6、具有良好的沟通能力、学习能力、分析解决问题能力,高度的责任心和团队合作精神, 追求完美,有工作激情。
  • 6k-8k 经验1-3年 / 大专
    信息安全 / 不需要融资 / 50-150人
    岗位职责: 1、负责数据中心的日常值班工作,能够对公司日常后台运维工作提供全方位的支撑; 2、负责处理数据中心日常服务请求,设备维护、综合布线,能够协助二线工程师处理突发故障; 3、对监控中发现的告警或故障跟据处理标准进行调整、汇报、记录、跟进、分析总结; 4、负责对监控系统的日常维护以及管理配置工作; 5、领导交办的其他工作。 岗位要求: 1、具有机房基础运维相关工作经验,熟悉数据中心基础设施运维和管理体系; 2、熟悉基础网络知识、硬件服务器、网络设备相关基础维护工作; 3、具有zabbix、elk、grafana、Prometheus等相关监控工具的使用配置经验; 4、熟悉windows、linux操作系统,掌握操作系统常见的安装配置、故障排障分析; 5、熟悉ansible、saltstack等相关自动化运维工具; 6、具备至少1年运维监控工作经验。
  • 20k-35k·15薪 经验3-5年 / 本科
    移动互联网,金融 / D轮及以上 / 500-2000人
    "公司业务全球拓展中,团队快速扩张,大量机会等着你。 一起来干大事情,个人成长的同时,顺便把钱也赚了。 任职资格: 1.具备3年以上大型互联网公司运维相关工作经验; 2.熟悉prometheus,grafana,zabbix,pinpoint,skywalking等开源监控工具; 3.熟悉ELK系统,大数据日志分析; 4.熟悉监控指标收集,监控与报警功能开发,有全链路监控实践经验者优先; 5.熟悉shell,python脚本类语言; 6.有较强的责任心.服务意识.沟通能力.推动能力和较好的服务意识; 岗位职责: 1.负责自动化运维/监控告相关平台,工具的建设、支持、维护等工作,完善监控告警体系; 2.与应用运维.研发进行需求分析.功能实现和优化告警策略,保证系统稳定运行; 3.建立并持续优化监控系统的体系文档,并提供技术赋能和操作指导; 4.制定监控规范和标准,推进监控标准化建设,提高运维质量和效率,通过监控数据推动成本优化;"
  • 30k-45k·15薪 经验5-10年 / 本科
    移动互联网,金融 / D轮及以上 / 500-2000人
    "公司业务全球拓展中,团队快速扩张,大量机会等着你。 一起来干大事情,个人成长的同时,顺便把钱也赚了。 任职资格: 1.精通业界监控产品prometheus,grafana,zabbix,pinpoint,skywalking等; 2.熟悉业界时序数据库influxdb,opentsdb等; 3.有5年以上Python开发经验;精通Django/Flask/Tornado一种或多种框架,熟悉HTTP协议及restful api 4.熟悉多种中间件组件:etcd、keeplive、conf、kafka等; 5.精通ELK,熟悉大数据日志分析; 6.有大规模或链路监控系统开发经验优先; 7.高度的责任心和抗压能力,良好的沟通技巧,学习能力和团队合作精神; 8.有golang/java一年以上开发经验优先;熟悉spring cloud、dubbo、Gin或Beego框架优先; 岗位职责: 1.调研对比业界优秀监控系统,对现有架构进行优化升级; 2.负责保障公司监控系统功能开发,打造业界优秀的监控解决方案; 3.负责监控数据的存储架构优化和建设; 4.负责监控系统日常维护,保证监控系统高可用,完善监控系统,提升运维质量和效率;"
  • 20k-40k 经验5-10年 / 本科
    社交 / 上市公司 / 2000人以上
    岗位职责: 负责海量智能监控体系建设,调研业界优秀监控方案,深入理解用户需求,规划和实施监控体系升级和演进; 负责海量数据存储架构设计和建设。深入掌握当前监控海量存储架构,调研对比业界优秀存储方案后,对现有架构进行优化升级; 负责海量数据处理架构设计和建设。深入掌握当前监控海量数据处理架构,调研对比业界优秀数据处理框架,对现有架构进行优化升级; 负责监控功能开发,打造业界优秀的监控解决方案。 岗位要求: 计算机相关专业,本科以上学历,三年以上软件开发经验优先; 深入理解Linux系统,熟悉TCP/IP网络原理、HTTP协议工作原理; 精通如下一种语言,C/C++, java, go, php,深入理解敏捷开发理念和具有实际经验; 熟悉常用的数据结构、算法, 网络编程框架和开源消息队列,mysql,redis等数据库; 有大数据系统开发经验优先,如深入掌握jstorm、hadoop、zookeeper、druid等大数据套件; 有较强的技术钻研能力、逻辑思维能力、沟通和执行力; 有良好的合作精神和保持好学热情。 
  • 社交 / 上市公司 / 2000人以上
    岗位职责 : 1、负责腾讯云监控产品中后台架构开发、优化; 2、大数据流处理相关开发、智能算法实现。 3、数字化运营,用户体验后台优化。 岗位要求 : 1、本科及以上学历,计算机软件或相关专业,3年及以上开发工作经验; 2、熟悉Linux开发环境,精通C/C+、Golang、Java其中一种语言,熟练API/CGI/后台服务等程序开发和性能优化; 3、有大数据处理、AI、时序存储、流处理相关能力优先。 4、有海量数据业务开发项目经验者优先。
  • 20k-30k 经验5-10年 / 本科
    物流平台 / C轮 / 2000人以上
    自研+双休!! 工作职责: 1、负责基础监控、调用链、业务监控及网络监控系统的开发; 2、负责异常检测、根因分析、故障自愈、告警收敛策略的研究与落地; 任职资格: 1.3~7年Java后端开发经验,精通Spring框架、Mybatis,熟悉分布式服务系统开发; 2.具有扎实的Java编程基础,对并发、多线程要求深入理解,对JVM调优有丰富经验者优先; 3.精通微服务架构,熟悉微服务运行、监控、安全等相关知识,具备springcloud全家桶项目经验优先; 4.熟练常用的中间件,能在项目中熟练运用rabbitmq、activemq、kafka、redis等; 5.熟练常用的开发工具idea、git、svn、maven、Jenkins等,熟悉gitflow优先; 6.熟悉Mysql、oracle等常见数据库,具备一定的SQL优化经验者优先; 7.具备良好的系统分析能力、抽象思维能力,能结合业务场景抽象业务模型,独立分析和解决复杂问题; 8.擅于沟通和解决问题,乐于总结分享,有想法,有冲劲,有团队精神和主人翁意识和责任感。
  • 30k-50k·15薪 经验3-5年 / 本科
    IT技术服务|咨询 / B轮 / 150-500人
    职位诱惑:云原生技术团队 CMDB/DevOps/Flink/低代码职位描述:岗位背景该岗位隶属于公司技术研发部门,目标是为研发团队开发云原生应用管理平台提供专业的运维指导和最佳实践。具体职责1. 负责公司Kubernetes集群日常运维工作;2. 负责公司基于Kubernetes应用服务的持续交付;3. 负责公司基于Kubernetes应用服务的监控观测;4. 协助产品研发团队开发容器云管理平台,提供容器化应用基于Kubernetes的最佳实践经验;5. 协助产品研发团队开发应用服务监控平台,提供线上应用监控的最佳实践经验;任职要求1. 本科及以上学历,3~5年或者以上工作经验,熟悉容器平台的管理维护,例如集群扩缩容、插件管理、证书管理;2. 熟悉Kubernetes的设计理念,了解各个模块的基本实现;3. 熟悉Docker容器引擎的使用,了解底层实现原理,并对容器网络、存储架构比较了解,例如知道Flannel和Calico的适用场景,分布式存储的选型等;4. 有生产环境 Prometheus/ELK/Grafana 等任意一项的容器监控、日志方案的实战经验;5. 有钻研新技术的热情和能力,善于交流和表达,富有团队精神。岗位亮点1. 直接参与研发团队云原生应用管理平台的开发需求评审、特性验收以及容器平台运维实战实践;2. 可学习到企业关于IT管理相关的其他核心平台的设计理念和最佳实践,例如CMDB、DevOps系统、大数据监控平台、低代码开发平台等等。附加信息:工作时间:周末双休
  • 10k-20k 经验3-5年 / 本科
    金融 / 不需要融资 / 2000人以上
    工作职责: 1、负责监控系统平台研发,涵盖从应用层/服务层/基础设施层基础指标监控,日志/异常/链路信息监控;以时间序列的形式展示指标,在海量日志/异常/链路数据上发现问题,实时告警; 2、负责系统全链路异常检测、根因分析、故障自愈、告警收敛策略的研究与落地。 任职要求: 1、 本科及以上学历,熟悉Linux系统、常用Linux命令,熟练掌握Java/Go/Python任意一种语言; 2、掌握企业级分布式监控系统部署,熟悉高可用设计架构,用技术创新提升研发效率; 3、熟悉监控系统如pinpoint,skywalking,zabbix、Prometheus等部署和应用,具备开源软件功能定制和二次开发能力; 4、 熟悉Mysql、Oracle等关系型数据库,具有一定SQL书写功底、优化经验; 5、 熟悉大数据批/流计算领域包括hadoop、spark、flink等分布式框架优先; 6、参与过业界先进的监控系统 或者擅长 故障分析和排查解决问题优先; 7、负责或参加过金融保险整套监控项目开发和实施经验优先; 8、责任心强,积极主动,有良好的学习、沟通能力和协作能力。 【在大家信科你可以得到】 食:餐补月月发放,早中晚三餐味美价廉。 行:通勤有班车,七条线路覆盖北京城! 休闲:畅享足球场、激情篮球场、挥汗健身房、静心瑜伽室! 福利:工会传统佳节慰问,生日慰问,冬送温暖夏送清凉,成为工会会员更有观影及丰富的团建活动让你乐在其中! 薪酬:我们提供具有市场竞争力的money。 保障:全额缴纳五险一金,更有补充医疗、意外保险、重疾关爱等。 【其他事项】 本岗位工作地点为燕郊,七条班车线路覆盖北京城
  • 25k-45k·15薪 经验5-10年 / 本科
    人工智能服务 / 上市公司 / 500-2000人
    岗位职责: 1. 负责云平台多款监控产品的运维工作,包括部署发布、故障处理、容量规划等 2.负责ELK集群的运维运营和优化 3.参与Kubernetes集群的建设与运维管理 任职要求: 1.熟悉linux操作系统的运维管理,对tcp网络协议,磁盘io性能有一定的了解 2.熟悉prometheus,zabbix等开源监控系统,掌握shell或python等脚本语言 3.熟悉ELK技术栈,对集群架构,性能优化有一定的经验 4.了解TSDB,Kafka,Redis,ElasticSearch,Mysql等常用中间件 5.了解Kubernetes的架构和设计以及日常排障 6. 本科及以上,至少3年以上互联网产品或者云平台相关运维经验
  • 人工智能服务 / 上市公司 / 500-2000人
    岗位职责: 1.面向全公司产品的监控数据收集,参与公司级监控系统需求的设计和开发。 2.参与监控相关数据/告警平台建设,为海量数据提供可靠的基础设施保障。 3.参与或负责衍生产品的设计和开发,如自动化运维开发、网络、短信包、消息订阅、告警管理和通知平台等。 任职要求: 1.本科及以上学历,3以上工作经验。 2.2年以上Golang后台开发经验,具备大数据、高并发场景的分布式系统开发经验优先。 3.有运维开发,网管开发,监控和告警开发经验者优先。 4.熟悉一项或多项流式处理相关工具,如:hadoop, influxdb, spark, kafka, rabbitMQ, flink等。 5.熟悉一项或多项常用中间件,如:mysql, redis, zookeeper, etcd等。 6.具备大规模docker集群管理的能力,从CPU, 内存,网络传输等方面持续提升系统的可用性,数据的可靠性能力。 7.有浓厚的技术追求,能够快速融入团队的技术氛围中,对未知技术和领域能快速掌握并实践 。 8.对云计算行业产品化敏感度高,善于思考,乐于发现,对解决具有挑战性问题充满激情。 9.性格开朗,和善,具备较强的团队合作和沟通能力。
  • 20k-35k·15薪 经验3-5年 / 本科
    物联网,智能硬件 / 上市公司 / 2000人以上
    负责涂鸦监控体系的建设,包括指标监控体系,指标报警平台的开发和维护工作。能够结合目前业务场景,改进现有的监控链路以及报警链路,为业务的稳定性保驾护航。 岗位要求 1. 三年以上工作经验,一年以上的监控系统的开发和维护经验,擅长java,golang等 2. 有jvm调优的经验,熟悉常用的数据库如mysql、redis的使用,熟悉常用的中间件(kafka、zookeeper等)的使用 3. 熟悉监控领域常用的技术组件,对时序数据有一定的理解 4. 熟悉网络协议,数据传输优化,熟悉常用的分布式算法以及原理 5. 熟悉复杂事件处理引擎(如esper), 时序数据库(如influxdb、victoria metrics),流处理引擎(如flink、storm)优先 6. 有较强的学习能力,具备较强的团队沟通协作能力、自驱力和技术热情,具备实际的项目落地经验 注:开发经验丰富、技术基础扎实的同学可以适当放宽以上条件
  • 15k-30k·15薪 经验3-5年 / 本科
    物联网,智能硬件 / 上市公司 / 2000人以上
    负责涂鸦监控体系的建设,包括指标监控体系,指标报警平台的开发和维护工作。能够结合目前业务场景,改进现有的监控链路以及报警链路,为业务的稳定性保驾护航。 岗位要求 1. 三年以上工作经验,一年以上的监控系统的开发和维护经验,擅长java,golang等 2. 有jvm调优的经验,熟悉常用的数据库如mysql、redis的使用,熟悉常用的中间件(kafka、zookeeper等)的使用 3. 熟悉监控领域常用的技术组件,对时序数据有一定的理解 4. 熟悉网络协议,数据传输优化,熟悉常用的分布式算法以及原理 5. 熟悉复杂事件处理引擎(如esper), 时序数据库(如influxdb、victoria metrics),流处理引擎(如flink、storm)优先 6. 有较强的学习能力,具备较强的团队沟通协作能力、自驱力和技术热情,具备实际的项目落地经验
  • 电商平台 / 未融资 / 15-50人
    岗位职责: 1、协助做好个贷资产质量运行监测、分析和检查监督。 2、对网贷业务、线下个贷业务开展在线监测和检查监督,定期提交监测报告。 3、提出报表优化需求、开展测试等。 技术要求: 本科以上学历,学信网可查,了解个人信贷业务,有资产质量管理经验、报表工作经验。