• 25k-50k·15薪 经验3-5年 / 本科
    电商平台 / 上市公司 / 500-2000人
    团队简介:STO-SRE Shopee Tech Ops SRE(Site Reliabilitiy Engineering)团队的使命是确保Shopee 24/7的高效和可持续性运转,从系统的可用性和效能出发,组建和维护大规模、高可用、高效能的分布式系统,是结合传统软件工程与系统运维形成的新体系。SRE团队需要深入Shopee各业务线,在于确保基础设施在快速演进的同时,具备高可用性以及扩展性,并从稳定性和效能的角度切入到业务研发,基础平台各部分组件(中间件、容器调度、缓存、对象存储等)的设计,OS的优化,数据中心和网络的优化,通过工程化和服务化手段来优化传统运维模式中低效,繁复的操作,并致力于建设完善的监控体系以提高故障处理效率。 岗位描述: 1. 负责应用系统资源(包括云和非云环境的系统、网络、存储等资源)的统筹规划和管控,提供稳定高效持续的应用系统资源交付能力,提高整体研发的效率,降低成本; 2. 负责海量系统高可用体系建设,如故障自动定位、自动恢复、自适应容灾等,保障业务持续可用 3. 参与应用系统架构规划和设计,推动或主导关键技术演进,提升资源的弹性、可扩展和质量; 4.负责各业务线的全链路压测,确保无单点,确保各组件的性能和可靠性; 5. 深入业务线,理解客户需求和业务需求,推动产品的可扩展性、稳定性和效能; 6.自动化运维平台个组件的设计和开发 岗位要求: 1. 本科及以上,2年以上工作经验,大型互联网公司或者大型IT企业应用运维经验者优先; 2.熟悉Python、Shell或Go,熟练编写各种日常工具,熟悉Django、Flask或GIN框架; 3.精通linux/unix操作系统,熟悉TCP/HTTP协议,熟悉性能调优,熟悉使用相关压测,监控等工具; 4.熟悉多种开源组件:Ansible、SaltStack、KVM、Nginx、LVS、Jenkins、Git、Memcached、Redis、Mysql/SQL等; 5. 熟悉Docker技术和对应的PaaS体系架构。有容器、调度相关经验或了解Mesos、Docker、Kubernetes、等相关技术者优先。 6.了解PaaS平台建设者或熟悉运维自动化体系建设; 7. 有单元化,异地多活容灾系统架构演化落地经验者优先; 8.熟悉阿里云,腾讯云,AWS,GoogleCloud 运维者优先; 9. 优秀的沟通、表达与组织协作团队合作能力,适应多元化国际化工作环境,具备一定的创新能力。
  • 15k-25k 经验3-5年 / 本科
    数据服务|咨询 / B轮 / 150-500人
    岗位描述:1、负责平台及应用的自动化部署及维护;2、负责平台相关的自动化流程开发和持续改进,包括流程的开发、测试和运维;3、研究、设计运维自动化技术方案,建设和优化构建、测试、发布流程,提升系统运维能力和运维效率;任职资格:1、熟悉linux操作系统、TCP/IP等网络知识,了解基本的数据结构;2、熟悉Docker、Kubernetes、Etcd、Kafka, Zookeeper, Prometheus, Nginx等开源组件的架构及应用;3、熟悉运维相关系统工具与流程,熟悉DEVOPS/CI/CD,具备系统维护的二次开发能力;4、熟练掌握Python或GO编程,熟练使用Django、Tornado,Flask,Beego等开发框架;5、学习能力强,具备良好的问题分析与解决能力,良好的沟通协调能力和团队合作精神。
  • 20k-40k 经验3-5年 / 本科
    360
    信息安全 / 上市公司 / 2000人以上
    职责: 1、负责大数据分布式平台的运维和管理工作,包括集群部署、扩容、监控、故障分析等; 2、负责平台的管理,维护平台的稳定,保障公司内海量数据的流转和大规模离/在线作业正常运转; 3、支撑公司各条业务线,负责通用大数据平台组件的疑难问题定位、分析和沉淀; 4、通过持续的运维系统改进,来降低大规模集群的运维成本,提升平台的运营效率;   要求: 1.      本科以上学历,熟悉Linux操作系统,熟练掌握一门脚本语言(shell/perl/python等);熟悉常见开源运维工具和监控系统; 2. 了解Hadoop/HBase/Spark/Hive/Presto/Impala/Druid/Flink/Storm等其中的一种或者多种,具有相关维护经验者优先; 3. 具有云平台和大数据相关的分布式系统运维经验者优先; 4. 具有较强的抗压能力和上进心,良好的沟通意识和团队协助能力;
  • 25k-45k 经验3-5年 / 本科
    消费生活 / 上市公司 / 2000人以上
    WE:基础技术部肩负研发和运维公司统一的稳定、高性能,安全、低成本的基础技术平台。 我们持续构建完整的云计算技术体系,产品覆盖全公司业务。每天,亿级用户和百万级商户的每一个订单都依赖基础技术平台完成闭环。我们团队拥有优秀的人才,前瞻的技术,成熟的机制,坚持以客户为中心,协同综效,卓越运营的理念。 YOU:我们需要你热爱自己的专业,有扎实的基础和经验,以及很强的学习能力。 我们需要你热爱生活,拥抱变化,充满创造性。我们期待世界将会因你的创造而改变。期待你的加入,共建业界先进的基础技术平台! 岗位职责 1.负责公司CDN服务的日常保障工作,包括需求处理、故障响应、故障排查、故障复盘等; 2.通过持续的全方位数据运营(包括可用性指标、历史事故、用户行为分析等),找到系统薄弱点,跟进改进项的落地; 3.持续打磨CDN监控运维工具,建设调度自愈、资源优化、质量运营的综合平台; 4.探索业界CDN技术发展趋势,推动新技术方案的输出与建设落地; 5.积累CDN使用最佳实践,为业务接入提供帮助,输出解决方案。 岗位基本需求 1. 具有5年工作经验,其中具有3年以上互联网CDN质量保障经验; 2. 深入理解DNS、TCP/IP、HTTP/HTTPS等协议,精通CDN服务的架构原理和流量模型; 3. 至少熟练掌握Python/Go语言中的一种,有相关框架实战经验; 4. 有良好的数据运营意识,能够对服务运营的关键指标进行量化,并从量化数据中挖掘出优化建设点; 5. 具备强烈的Ownership、客户服务意识和团队协作意识。热爱技术,主动思考,自我驱动,有不断钻研和探索的精神。 具备以下者优先 1. 具有大型互联网公司CDN保障工作经验者优先; 2. 对CDN网络调优、缓存优化、分发调度有实践经验者; 3. 具有边缘计算相关经验者优先; 4. 有完整自动化运维工具开发经验者优先; 岗位亮点 1. 突破传统CDN运维,深入实践大规模互联网流量通信的质量感知与自愈能力建设; 2. 结合完备的运维体系建设与方法沉淀,全局视角思考美团流量通信的稳定性建设; 3. 基于资源评估与流量场景分析,实现资源效率与资源成本的更优解;
  • 25k-40k 经验3-5年 / 本科
    消费生活 / 上市公司 / 2000人以上
    WE:基础技术部肩负研发和运维公司统一的稳定、高性能,安全、低成本的基础技术平台。 我们持续构建完整的云计算技术体系,产品覆盖全公司业务。每天,亿级用户和百万级商户的每一个订单都依赖基础技术平台完成闭环。我们团队拥有优秀的人才,前瞻的技术,成熟的机制,坚持以客户为中心,协同综效,卓越运营的理念。 YOU:我们需要你热爱自己的专业,有扎实的基础和经验,以及很强的学习能力。 我们需要你热爱生活,拥抱变化,充满创造性。我们期待世界将会因你的创造而改变。期待你的加入,共建业界先进的基础技术平台! 岗位职责 1. 负责美团服务体验部互联网业务的稳定性优化工作,包括业务架构优化、故障演练、预案管理、优化故障处理规范、快速响应处理故障等; 2. 参与运维工具的设计开发,包括故障监控工具、变更工具、自动化巡检工具等; 3. 通过精细化数据运营找到系统薄弱点,落地改进项目; 4. 积累运维实践,为业务架构设计与组件选型提供指导,输出运维技术文档; 岗位基本需求 1. 2年以上互联网运维经验,熟悉互联网服务的稳定性、成本、效率相关工作; 2. 熟悉Linux系统,具备扎实的网络、计算机体系结构知识; 3. 良好的跨部门沟通能力和团队协作能力,乐于分享,具备良好的主人翁意识; 4. 工作细致、善于学习和思考,有很强的问题分析和推进解决的能力; 具备以下者优先 1. 具有大型互联网公司运维工作经验者优先; 2. 具有客服系统、通讯系统稳定性保障经验者优先; 3. 有自动化运维工具开发经验者优先; 岗位亮点 1. 一个能深度参与大规模互联网业务稳定性保障工作的机会; 2. 一个能接触和学习大型语音通讯平台领域运维的机会; 3. 一个可以接触公司的所有主流业务,与业务合作提升服务体验的平台;
  • 30k-60k 经验3-5年 / 本科
    文娱丨内容 / D轮及以上 / 2000人以上
    职位职责: SRE 团队参与并改善People服务的整个生命周期 - 启动、设计、部署、运维和优化,职责包括但不限于: 1. 可用性数据采集、统计、监控、报警系统设计、开发与维护 2. 负责灰度发布系统、私有化CICD、容量管理、故障自愈等系统的设计、开发与维护 3. 深入业务了解各业务架构,梳理痛点,推进改进,制定故障应急处理机制,提升总体SLA 职位要求: 1. 本科以上学历,5年以上相关工作经验,熟悉 Go/python/C/C++/Java 等编程语言中的一种或几种,了解数据结构与算法 2. 熟悉 Linux 系统,了解网络TCP/IP协议 3. 熟悉MySQL、ES、Redis、MongoDB 等数据库使用 4. 有较强的系统问题分析经验和能力,能够解决复杂的系统问题 5. 责任心强,追求效率,有良好的对外沟通能力、协作能力、学习能力与抗压能力 6. 有DevOps、CICD、监控系统、运维自动化系统开发经验者优先
  • 30k-60k 经验不限 / 本科
    文娱丨内容 / D轮及以上 / 2000人以上
    职位职责: 1、保障技术中台业务系统和中间件服务的可靠性与正常运行,同时关注系统容量与稳定性; 2、为大型系统构建自动化运营解决方案,从系统设计到上线的整个生命周期内保障系统可靠性; 3、通过全方位的数据运营(包括系统组件可用性、性能指标等)提升系统可见性,帮助系统开发以及团队快速定位故障; 4、推动提升服务的可靠性、可扩展性以及性能优化,保障系统 SLA; 5、基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析、业务问题定位排障、推进系统高可用架构改造升级等; 职位要求: 1、本科及以上学历,计算机相关专业, 并有2年以上互联网运维工作经验; 2、扎实的计算机软件基础知识,了解 Linux 操作系统、存储、网络 IO等相关原理; 3、熟悉一种或多种编程语言,如 Python/Go/Java/Shell/C++等; 4、具备系统化解决问题的能力,良好的沟通技巧和主人翁责任感; 5、具有接入/计算/存储等相关系统经验优先(Nginx/Kubernetes/Docker/Redis/Mysql/RMQ 等)。
  • 14k-22k·14薪 经验在校/应届 / 本科
    科技金融 / 不需要融资 / 2000人以上
    岗位职责: 1、负责云计算平台、linux、计算机网络、数据库、信息安全等关键系统的建设、管理、运维及为用户提供技术支持; 2、负责全行智能运维平台的AI算法与复杂事件规则引擎的设计与实现; 3、负责全行相关计算机信息系统的规范制定与完善; 4、负责对分行提供技术支持和指导。 5、未来发展方向:云计算工程师、安全管理工程师、网络运维工程师、数据分析工程师、DBA等。 职位要求: 1、本科及以上学历,计算机、软件工程、信息系统安全、电子信息工程等相关专业应届毕业生; 2、计算机基础知识扎实,熟悉Java/C++中至少一门编程语言,有具体项目设计、开发经验者优先; 3、了解SDN体系体系架构原理,有pandas、scikit-learn、Tensorflow等工具使用经验,大数据处理经验者优先; 4、性格开朗,诚实守信,具有良好的沟通能力和团队合作精神; 5、思想品德端正,身体健康,无重大病史。
  • 13k-20k·14薪 经验在校/应届 / 本科
    科技金融 / 不需要融资 / 2000人以上
    岗位职责: 1、负责云计算平台、linux、计算机网络、数据库、信息安全等关键系统的建设、管理、运维及为用户提供技术支持; 2、负责全行智能运维平台的AI算法与复杂事件规则引擎的设计与实现; 3、负责全行相关计算机信息系统的规范制定与完善; 4、负责对分行提供技术支持和指导。 5、未来发展方向:云计算工程师、安全管理工程师、网络运维工程师、数据分析工程师、DBA等。 职位要求: 1、本科及以上学历,计算机、软件工程、信息系统安全、电子信息工程等相关专业应届毕业生; 2、计算机基础知识扎实,熟悉Java/C++中至少一门编程语言,有具体项目设计、开发经验者优先; 3、了解SDN体系体系架构原理,有pandas、scikit-learn、Tensorflow等工具使用经验,大数据处理经验者优先; 4、性格开朗,诚实守信,具有良好的沟通能力和团队合作精神; 5、思想品德端正,身体健康,无重大病史。
  • 30k-50k 经验5-10年 / 本科
    电商平台 / 上市公司 / 500-2000人
    工作职责: 1.负责相关业务平台的容量管理、监控、发布、故障处理等日常运营事项,保障业务稳定性; 2.参与技术方案和系统设计方案评审,掌握相关的技术架构和原理,能够从运维角度主动识别方案风险,并给出专业的解决方案 3.负责相关业务的运营数据分析、运营质量分析、预算制定等运营工作; 4.和项目组及研发沟通,对业务运营环境中存在的问题进行定期反馈和推动改善; 5.参与自动化运维平台规划设计、实现及优化工作。 6.根据日常反馈以及业务发展需要,不断推动系统/流程迭代升级,快速响应业务需求; 7.负责团队内部的技术培训与人才培养。 任职要求: 1.本科及以上学历,计算机及相关专业,至少5年以上大型互联网相关工作经验 2.精通Shell编程,熟练掌握Python或go编程为佳, 3.有良好的网络、存储、安全、计算机体系结构方面的知识; 4. 熟练掌握如nginx、lvs、redis、kafka、mysql等常见中间件的工作原理、部署和使用 5. 熟悉Jenkins、Gitlab等,对CI/CD流程制定与集成有实践经验 6. 熟悉Docker/k8s容器平台及相关的底层技术和原理者优先 7.能够胜任7*24小时故障响应及处理,抗压性强,良好的服务意识和团队合作精神。 8.工作细致、善于思考,有很强的数据分析和问题解决能力
  • 20k-35k·15薪 经验3-5年 / 本科
    360
    信息安全 / 上市公司 / 2000人以上
    岗位职责: 1、 负责编写运维相关的文档,手册,流程,制定安全,备份,统计策略。 2、 负责应用、管理、监控等平台搭建 3、 负责改进运维流程,优化运维架构,提高运维效率。 4、 负责突发性事件的快速响应和处理,解决服务器和网络故障。 5、 负责与开发部门进行需求沟通并共同梳理系统构架。 6、 负责协助开发业务部署及业务优化。 7、 负责协助业务部门资源及流程协调 8、 负责公司内部容器生态、云原生相关项目的实施和优化 9、 负责K8S集群在多机房、多云环境中资源管理调度规划 任职要求: 1、 本科以上学历,计算机相关专业毕业,3年以上大中型互联网运维经验。 2、 精通Linux主流操作系统,熟练部署及维护 。 3、 精通Linux下主流应用服务软件的安装配置,管理及优化 。 4、 精通Linux下数据库软件的安装配置,管理优化MySQL、MongoDB等数据库 。 5、 精通负载均衡技术。 6、 精通No-SQL相关技术 7、 了解虚拟化技术。 8、 熟悉Kubernetes/Docker生态,了解Kubernetes核心的组件原理 9、 参与过容器云平台项目落地实施 10、 熟悉Python语言,能够熟练使用python进行平台开发。 11、 熟悉Shell或批处理,能够熟练编写各种脚本文件。 12、 精通TCP/IP协议。 13、 精通系统安全、能够设定基本的安全控制策略,理解信息安全大概框架。 14、 逻辑思维能力强,做事有条理,具备较强的分析问题和解决问题的能力。 15、 性格开朗,责任感强,工作积极主动,有良好的团队协作意识。 16、 具备高度激情,快速学习能力,充满想象力和创造力,热爱事业,勇于接受挑战。 17、 敬业,富有责任心,有吃苦耐劳精神。 18、 有Go语言开发经验及对K8S和Docker等社区有贡献者优先
  • 40k-80k 经验5-10年 / 本科
    金融,软件开发 / 不需要融资 / 2000人以上
    1.负责智能运维工具和产品能设计、开发和实现,撰写相关文档; 2.负责对已有工具和产品的代码持续进行重构和优化; 3.负责新工具和产品的可行性研究及相关技术方案的研究和技术选型 ; 4.对产品实施交付过程中遇到的技术问题提供支持; 5.关注并研究智能运维新兴技术,推动技术革新;1.负责智能运维工具和产品能设计、开发和实现,撰写相关文档; 2.负责对已有工具和产品的代码持续进行重构和优化; 3.负责新工具和产品的可行性研究及相关技术方案的研究和技术选型 ; 4.对产品实施交付过程中遇到的技术问题提供支持; 5.关注并研究智能运维新兴技术,推动技术革新;1.计算机相关专业,且3年以上研发工作经验或2年运维经验; 2.熟悉 Linux 操作系统,熟悉HTTP协议、TCPIP协议; 3.具备分布式系统开发经验,熟悉多线程编程技术,熟悉常见数据结构和算法,熟练掌握shell脚本语言,Python、JAVA开发语言,熟悉devops工具链; 4.熟悉 MySQL、MongoDB、ElasticSearch、Redis 等常见数据库或缓存技术,熟悉Nginx、WebLogic等中间件; 5.了解并会使用 Hadoop、Spark、Livy、HBase 等常见大数据组件和数据分析工具; 6.良好的沟通能力和团队协作精神,严谨的工作态度与高质量意识; 7.善于学习新的知识,热爱技术,动手能力强,有进取心; 8.具备大企业运维开发、业务设计经验,有大型互联网工作经验者优先;
  • 金融,软件开发 / 不需要融资 / 2000人以上
    1、参与运维工具平台产品的研发工作,制定开发计划; 2、负责对已有工具和产品的代码持续进行重构和优化; 3、负责工具产品相关技术方案的研究和技术选型; 4、对产品实施交付过程中遇到的技术问题提供支持;1、本科及以上学历,计算机相关专业,3年以上工作经验; 2、2年以上云管理平台或云平台或运维平台和工具开发经验,深刻理解大型分布式系统平台的架构设计并参与研发和落地; 3、熟悉主流的软件开发技术框架,比如Java、Python、Go等; 4、系统开发类需对SpringCloud、Dubbo等常用微服务框架应用经验丰富,对框架本身的体系有较深理解和应用经验;对RabbitMQ、RocketMQ、MySQL、PostgreSQL、ELK、K8S等云原生软件应用经验丰富; 5、运维开发类需熟悉数据中心的主要运维业务,如资源分配、变更发布等;熟悉云平台API(如Vmware、Openstack及主流公有云等);熟悉Terraform、Ansible、K8S等技术平台的脚本编写; 7、了解Tosca规范,基于Tosca规范丰富的产品或平台开发经验或者具有Cloudify框架开发及使用管理经验者优先; 8、分析问题思路清晰、条理性好; 9、沟通、表达能力较强,工作积极主动,学习能力强。
  • 10k-20k 经验在校/应届 / 本科
    移动互联网,人工智能 / 不需要融资 / 2000人以上
    工作职责: 基础设施系统集成运维 任职资格: 计算机类、电子类、通信类、自动化类、控制类及相关专业
  • 20k-40k·16薪 经验不限 / 本科
    短视频 / 上市公司 / 2000人以上
    岗位职责:1、负责快手大规模分布式系统及在线服务可靠、稳定、高效运行;2、制定和优化运维解决方案,包括但不限于柔性容灾、智能调度、弹性扩容与防攻击;3、设计及开发包括网站加速、持续交付、容量管理、弹性计算、故障分析、流量分配、性能调优等系统;4、关注业界前沿接入技术动态,负责超大规模流量接入系统的优化,演进和新接入技术探索和应用;5、参与在线系统和各类产品架构设计及自动化系统的实现,满足严格的质量与效率要求。任职要求:1、本科及以上学历,3年以上运维开发或应用运维经验;2、熟悉RedHatCentOSFedora操作系统原理,TCPIP以及常用的网络协议;3、熟悉shell,python,php,java至少一种开发语言,有相关开发经验;4、熟悉MySQL,Redis,Memcache等系统的操作和维护(或者擅长其中一项);5、或者有日志处理及分析相关经验,熟悉相关的组件,如:kafka,elk,flume,hive,storm,HDFS等;6、熟悉自动化运维管理工具(puppet/saltstack/ansible)。