• 20k-30k 经验5-10年 / 本科
    企业服务,数据服务 / B轮 / 50-150人
    岗位职责: 1. 根据公司发展方向,带领运维团队完成公司各产品线的运维工作; 2. 负责SaaS平台的CI平台以及监控预警平台; 3. 支持售前在项目上的技术要求,协助完成客户私有化部署计划方案; 4. 收集、分析、整理用户需求,协助研发产品改进; 5. 协助开发人员进行内部版本测试环境的搭建及维护; 6. 梳理运维部署、事故响应等各类需求,完善SOP与自动化运维系统。 任职要求: 1. **本科以上学历,计算机相关专业优先; 2. 5年以上Devops经验,2年以上运维管理经验; 3. 精通Linux、Windows操作系统及计算机网络协议; 4. 精通Shell、Python等脚本语言,有研发经历的人员优先; 5. 熟练使用K8S、配置管理工具、CI工具及各类流行的服务器基础应用软件; 6. 优秀问题定位能力,沟通能力以及团队协作能力,可以适应工作压力及偶尔出差。
  • 12k-18k·14薪 经验1-3年 / 本科
    移动互联网,企业服务 / 不需要融资 / 150-500人
    工作职责: 1.协助商务经理接入新合作伙伴,包括处理合同,协助技术对接等; 2.分析账户数据,维系与合作伙伴的日常业务沟通,挖掘合作潜力; 3.调研国内开发者相关信息及行业趋势信息。 任职要求: 1. 本科以上学历,对互联网广告行业热爱,条件优秀可放宽至应届; 2.有一定数理基础,数据分析能力强,善于发现问题并提出解决方案; 3.出色的商务沟通协调能力和团队协作精神,细心踏实; 4.良好的学习能力,强烈的责任感,使命必达。 备注:投递简历时请附带个人近期证件/生活照。
  • 25k-40k·14薪 经验5-10年 / 本科
    电商,硬件 / D轮及以上 / 2000人以上
    岗位职责 1.主攻国内和海外语音方向技术规划、需求分析,架构设计,方案评审,牵头落地语音平台整体性的技术规划、设计和产品落地; 2.充分了解语音技术行业的发展和动向、公司对语音业务的产品需求等信息,牵头语音技术平台的技术规划;包含信号处理、应用框架、NLP、ASR、TTS等方面; 3.通过技术规划和落地实施,逐步引导公司语音技术和产品竞争力达到行业领先; 4.支持并指导语音方向开发工程师的开发、调试、代码审材等工作;负责关键模块或者核心部分的代码编写; 5.参与Android 系统其他应用相关的设计、开发、调试、测试等; 6.参与Android系统其他应用的优化和系统稳定性维护; 任职要求: 1.计算机相关专业本科及以上学历,至少6年Android系统/应用/云端开发工作经验;主导过原厂语音开发,或参与过语音平台开发的经验者尤佳; 2.熟悉应用开发,Android系统,熟悉常用数据结构和算法,具有优秀的软件开发习惯; 3.精通C/C++语言或Java语言; 4.深入理解语音产品系统各模块框架; 5.有带团队经验者优先。
  • 25k-50k·14薪 经验3-5年 / 本科
    硬件 / 上市公司 / 2000人以上
    岗位职责: 1. 负责集团基础设施的运维管理与维护,包含资源交付,硬件管理,集群管理,存储管理,监控管理,云资源管理,SLA管理 2. 负责linux/windows操作系统的维护管理,包含登录与权限管理,系统基线,系统服务(ntp,syslog,dns),系统安全 3. 负责运维管理标准化和运维自动化的开发, 部署,管理 4. 负责服务器,存储,备份的日常维护,监控配置,巡检管理,操作变更,升级补丁,安全加固等 5. 负责基础设施稳定性建设,包括系统/硬件/网络故障的预防,发现,排查,定位, 处理。 任职要求 1. 本科及以上,计算机相关专业 2. 5年以上系统运维管理经验, 有大规模运维架构管理经验优先 3. 熟悉常见linux和windows运维管理,包含不限于安装,系统配置,监控,自动化运维,系统服务,系统安全,变更管理 4. 熟悉主流云厂商及产品,能够基于云产品进行运维架构设计与管理 5. 有运维自动化开发经验,熟练使用shell/powershell/sed/awk/python/go/java/c 一种或多种开发能力 6. 能够熟练管理常见的服务器,网络,存储等,并具有对其监控配置与管理能力 7. 熟悉常见的运维管理架构, 有故障预防,监控,发现,排查与处理经验 8. 积极主动,认真负责,有安全意识,有良好的沟通协调能力
  • 25k-50k·14薪 经验3-5年 / 本科
    硬件 / 上市公司 / 2000人以上
    岗位职责: 1. 负责集团基础设施的运维管理与维护,包含资源交付,硬件管理,集群管理,存储管理,监控管理,云资源管理,SLA管理 2. 负责linux/windows操作系统的维护管理,包含登录与权限管理,系统基线,系统服务(ntp,syslog,dns),系统安全 3. 负责运维管理标准化和运维自动化的开发, 部署,管理 4. 负责服务器,存储,备份的日常维护,监控配置,巡检管理,操作变更,升级补丁,安全加固等 5. 负责基础设施稳定性建设,包括系统/硬件/网络故障的预防,发现,排查,定位, 处理。 任职要求 1. 本科及以上,计算机相关专业 2. 5年以上系统运维管理经验, 有大规模运维架构管理经验优先 3. 熟悉常见linux和windows运维管理,包含不限于安装,系统配置,监控,自动化运维,系统服务,系统安全,变更管理 4. 熟悉主流云厂商及产品,能够基于云产品进行运维架构设计与管理 5. 有运维自动化开发经验,熟练使用shell/powershell/sed/awk/python/go/java/c 一种或多种开发能力 6. 能够熟练管理常见的服务器,网络,存储等,并具有对其监控配置与管理能力 7. 熟悉常见的运维管理架构, 有故障预防,监控,发现,排查与处理经验 8. 积极主动,认真负责,有安全意识,有良好的沟通协调能力
  • 20k-40k 经验3-5年 / 本科
    文娱丨内容 / D轮及以上 / 2000人以上
    职位职责: 1、负责字节跳动OLAP产品的SLA体系,容灾体系的建设,故障的自愈等,保障业务的持续可用; 2、为字节跳动使用数仓产品的团队负责,持续提升服务质量,提升用户体验;和产研团队直接合作,推进客户问题的解决,以及产品的持续优化; 3、负责字节跳动大数据产品的SRE平台的研发、自动化建设与持续迭代,引导产品的运维模式向数字化,智能化方向发展演进; 4、参与toB体系的建设,核心客户交付,项目POC等。 职位要求: 1、本科及以上学历,计算机相关专业; 2、熟悉linux、网络等系统运维的技能;熟悉clickhouse/hadoop/doris/k8s等开源或商用技术,有实际的大数据商业应用开发经验者优先; 3、熟练掌握常用开源组件的配置,故障排查,解决问题的能力; 4、热爱计算机科学和互联网技术,精通至少一门脚本或开发语言,包括但不仅限于:Python,Shell,Java,Go 等; 5、良好的沟通表达呈现与逻辑思维能力,良好的服务意识与协作意识,责任心强、抗压能力强,愿意挑战技术极限。
  • 20k-30k·14薪 经验1-3年 / 本科
    数据服务,软件开发 / 上市公司 / 2000人以上
    岗位职责: 1.日常维护动作:故障处理;问题跟踪及时通报、系统巡检及系统优化、应用系统安全加固、及时发现/处理平台问题; 2.监控告警支撑:收集整理主机和业务监控项需求,接入统一监控平台实现自动监控告警;故障告警的跟进和处理; 3.系统优化:对所维护服务进行脚本编写自动的巡检、自动化故障分析及服务恢复; 4.其他支撑工作:根据项目安排做好其他运维支撑工作。 任职资格: 知识: 1)有大型系统的运维管理经验,熟悉SRE的主要职责,对可用性保障工作有深刻理解和认同; 2)熟悉Linux系统常用工具(Git、Nginx、tcpdump、LVS、DNS等)、熟悉ShellPython等编程语言、IPv4IPv6协议、MySQL数据库等; 3)熟悉监控系统(Prometheus、Grafana、APM)、中间件(ES、Redis、Kafka等)优先考虑 ; 4)有大型云计算公司从业经验,有安全行业从业经验者优先; 5)有抗压能力,能够在压力下完成任务者优先。 技能素质: 1)具备良好的学习能力,责任心,服务意识,性格乐观主动,较强的心理素质和综合抗压能力; 2)较强的逻辑思维能力,对于各类异常信息有高度敏感性。 经验: 1)具有3年及以上运维管理相关工作经验; 2)具有运营商、大型互联网IT系统运维管理等相关工作经验者优先; 3)具有SRE工程师从业经验优先。
  • 50k-100k 经验不限 / 本科
    文娱丨内容 / D轮及以上 / 2000人以上
    职位职责: 1、负责超大规模的语音服务系统的在线运维,推动提升服务的可靠性、可扩展性以及优化成本、性能,保障系统 SLA; 2、基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析、业务问题定位排障、推进系统高可用架构改造升级等; 3、负责引导语音服务运维向自动化、平台化和智能化方向演进,提升团队运维效率; 4、管理部门SRE团队,制定SRE团队技术路线,与部门研发协同推进线上服务运维建设,参与在线服务架构决策。 职位要求: 1、五年以上运维开发项目经验; 2、熟练掌握 Linux 环境下的 Go/Python/Shell 等1至2种以上语言; 3、对网络协议和相关服务有较深入理解,如TCP/IP、DNS、NAT、负载均衡等; 4、有丰富的大型业务系统运维经验,熟悉业务运维的流程、标准和相关规范,对常见的系统隐患、系统故障有系统性总结和实际处理经验; 5、能够承受较高的工作压力,有强烈的工作责任心,具备系统化的问题分析、排查、解决和沟通协调能力; 6、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。 加分项: 1、熟悉互联网通用的组件,对消息中间件、分布式缓存、数据库有较深入的理解; 2、有 GPU 服务器的运维经验; 3、一年及以上的团队管理经验。
  • 35k-50k·14薪 经验5-10年 / 本科
    旅游|出行 / D轮及以上 / 150-500人
    岗位职责:1. 负责嘀嗒出行生产系统的稳定性和可用性保障工作;2. 建设监控指标, 建立7*24快速响应告警的机制;3. 进行资源部署和容量规划, 确保系统的扩展性;4. 对问题进行分析,复盘, 协调并推动跨团队问题的解决;5. 分析并推动应用性能和服务架构的优化, 推动系统多中心高可用方案落地;6. 负责SRE团队的搭建和管理;职位要求:1.计算机相关专业,5年以上互联网平台运维/研发/SRE相关工作经验, 有相关团队管理经验;2.熟悉至少一门编程语言, 有实际的工具或应用开发经验;3.技术栈: Linux,网络知识,公有云,ROCKETMQ, REDIS, MYSQL;4.要求具有良好的沟通协作能力, 强烈责任感, 分析问题解决问题的能力;加分项:1.具有大型互联网公司服务稳定性保障, 多活建设相关经验;2.具有自动化运维工具开发经验;3.熟悉Java Spring Cloud, 微服务架构;
  • 20k-40k·16薪 经验5-10年 / 本科
    金融 / 上市公司 / 2000人以上
    岗位职责 1. 负责公司业务系统运维工作,提升业务稳定性和工程效率,与业务方保持高效沟通,建立良好合作关系; 2. 参与业务服务端架构的高可用设计和性能优化,保证高效、可靠的业务迭代。 3. 负责线上重大问题排查,紧急事故处理,后续事故分析与优化; 4. 负责应用故障演练、应急预案、SOP手册编写工作,确保故障时业务能快速恢复 5. 负责应用高可用建议及管理,包括限流、降级,容错、容灾,同城多活,确保应用质量 6. 建立SLA评估标准,计算故障对SLA影响,并对SLA后续改进措施进行跟进 7. 负责运维规范、流程文档编制,并将其工具化、平台化,确保运维安全,提升运维效率 任职要求 1. 计算机相关专业毕业,本科学历及以上 2. 熟悉JVM虚拟机的内存机制、GC机制,能进行JAVA进程异常的故障定位及排查 3. 熟悉Nginx,Zookeeper, Kafka, RocketMQ,Redis等常用中间件的维护与使用; 4. 熟悉K8S、Docker基本原理; 4. 熟悉常见监控系统,如Zabbix,Grafana,Prometheus等 5. 有丰富的系统故障排查和解决经验,突出的分析和解决问题的能力 6. 良好的troubleshooting思路与经验,能够快速解决线上事故 7. 至少能掌握Python/Shell/GO等一至两种语言,有项目开发经验者优先 8. 熟悉SRE运维体系者优先 9. 有云原生相关开发运维经验者优先 10. 熟悉高并发、高可用、微服务系统架构运维者优先; 11. 有良好的沟通协作能力、学习能力、团队精神
  • 15k-25k·13薪 经验3-5年 / 本科
    游戏 / 不需要融资 / 500-2000人
    岗位职责: 1、负责运维自动化体系建设,包含:分布式监控系统、CMDB、作业系统、日志系统等; 2、负责自动化运维工具开发,提高运维、开发协作效率,规范操作流程; 3、负责发布和变更相关管理系统开发; 4、负责新技术研究,技术文档编写及推广。 任职要求: 1、本科及以上学历,计算机相关专业; 2、2年及以上运维相关经验,有运维平台、分布式系统或自动化运维工具开发经验者优先; 3、熟悉Linux系统维护,lnmp、lvs、zabbix等配置、调优; 4、熟练掌握后端语言中(PHP/nodejs/python)至少其中一种,以及常用web开发框架; 5、熟悉常用数据库如Mysql、MongoDB、redis; 6、熟悉前端开发语言javascript及框架vue、react等,能够独立完成前后端分离项目的开发优先; 7、善于从问题出发,对新技术、中间件有较好的敏感度,快速利用到业务中解决问题; 8、具备良好的学习、沟通和业务能力,有强烈的责任心和和团队合作精神。
  • 15k-30k·14薪 经验3-5年 / 本科
    金融 软件开发 / 不需要融资 / 2000人以上
    职责描述: 1、负责公司大数据平台的运维保障工作,保障平台的正常运行和相应数据服务的稳定高效; 2、对接数据开发侧团队,主动优化和完善服务巡检、监控工具、脚本等,减少人工操作提高运维效率;负责数据平台的故障处置、推动性能优化。如平台产品技术问题,提交给平台产品技术组进行后台处理,并及时反馈. 3、负责数据平台二线运维支撑保障,响应运维/服务台一线请求:处置生产事件,跟踪问题处理; 4、定期组织团队人员开展大数据平台的技术知识积累和移交; 5、负责设计日常运维相关的自动化工具或系统,并完成相应需求收集和需求管理 ; 任职要求: 1. 具有1年以上金融行业数据类项目运维经验,熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员,或长期在类似的运维项目上承担运维工作优先; 2. 具备较强的数据开发分析能力,熟练掌握SQL等技能,熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先; 3. 具备较强的数据分析,问题分析,逻辑思维能力,团队协作能力,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 4. 强烈的自驱力和责任感,面对复杂业务问题,可以从业务和技术多角度推进,最终达成目标。
  • 25k-40k·15薪 经验5-10年 / 本科
    金融 / 上市公司 / 2000人以上
    【岗位职责】: 1.国际化互联网保险科技输出,海外互联网保险科技业务支持,海外保险自有业务支持,海内外技术同行项目交流。 2.和一线运维团队的同学、Infrastructure as Code的同学以及DevOps的同学,讨论并制定稳定性保障方案,监控及故障恢复方案等,对Infrastructure as Code及DevOps的同学提出更好地保障生产环境的自动化及监控的需求。 3.on-call轮值。 4.紧急事件响应及紧急事故管理。在生产发生P0及P1级故障的时候,**时间作为**介入,进行故障分析和定位,并准确找到相关团队进行故障修复。对于疑难杂症的P2及以下故障,帮助一线运维团队共同分享和定位,并跟进解决。 5.事后总结,跟踪故障。故障复盘会的组织及相应Actions的跟进。 6.数据完整性问题及数据泄露等问题的发现及解决。 7.与各相关团队协同,实现生产环境99.99%的高可用保证。生产环境的高效监控及快速故障恢复能力的保障。 8.跟随国际化团队不断成长,突破自我,为海外客户项目团队提供技术支持。 【任职资格】: 1.计算机相关专业,本科或以上学历。3年以上SRE或运维保障工作经验。 2.良好的OS及网络协议栈知识。 3.良好的编程基础,熟悉JAVA开发、JVM原理、IO/NIO、多线程/多进程等。 4.熟悉至少3种业界常用的数据、消息或缓存中间件。 5.对算法设计、数据结构有深刻的理解。 6.有高可用保障经验,有负载均衡、DNS、过载、热点、降级、缓存雪崩等故障的处理经验,具备连锁故障的处理能力。 7.熟悉mysql数据库。 8.清晰的逻辑思维,良好的学习能力,具备团队协作精神。 9.乐于接受挑战,视快速解决线上问题为非常exciting的事情
  • 数据服务|咨询,人工智能服务 / 上市公司 / 500-2000人
    职位描述: 1、负责监控/运维/日志平台的底层设计及研发工作。 2、负责对接业务开发人员,推动工程最佳实践; 3、参与公司的架构优化与性能优化。 职位要求: 1、*****本科及以上学历,计算机类专业优先; 2、五年及以上软件研发经验; 3、熟悉TCP/IP协议,熟练掌握高并发Linux网络编程和多线程编程技术; 4、熟练掌握Linux环境下的Java/C/C++/Go/Python/Shell/PHP等一种以上编程语言; 5、有较强的系统问题分析经验和能力,能够解决复杂的系统问题; 6、有大中型监控或日志系统研发经验,熟悉Elastic、Lucene、Prometheus、loki、Clickhouse底层原理,阅读过部分源码; 7、熟悉流计算,有Spark/Flink开发经验优先;有检索系统开发经验(PB级)经验优先; 8、诚实守信、作风踏实严谨、责任心强,具备良好团队协作能力精神,学习能力强,善于解决复杂问题; 9、过往工作业绩优秀,或有知名互联网/IT、云服务头部企业工作经验者,年龄、工作年限可适当放宽。
  • 金融,移动互联网 / 不需要融资 / 50-150人
    岗位职责: 1.参与线上应用系统的运营管理、性能提升、异常处理、技术创新等工作 2.参与制定并完善系统日常安全运行管理制度及流程 3.执行应用运维相关规范及流程 任职要求: 1.教育背景:大学本科及以上学历,计算机相关专业 2.专业技能:掌握1至2门主流开发语言,如Java、Python等;了解运维开发、自动化运维、网络和数据库等基础知识;具备在Linux、Windows下的系统管理和操作技能;具备Shell、Perl脚本的编写能力;掌握中间件技术、容器技术;掌握证券行业技术相关标准;具备对应用系统异常进行分析的能力 3.个人素质:工作积极主动,具有良好的团队协作能力和责任心 4.工作经验:3年及以上相关工作经验优先