-
职位职责: 1、负责字节跳动数据中心网络P4网关产品交付和线上运维工作,提供超大集群网关服务能力和保证线上稳定运行; 2、负责网关类产品稳定性方案设计和能力建设,包括监控、告警、应急响应、运维数据分析,风险治理等; 3、负责网关类产品运维流程和规划的制定和优化,持续提升交付、变更、运维效率。 职位要求: 1、计算机相关专业,本科以上学历,具备扎实的计算机体系知识; 2、熟悉常见网络协议,比如TCP/IP、BGP、VXLAN、GRE等; 3、熟悉VPC、负载均衡、云企业网、专线连接等公有云网络产品优先; 4、具备良好的现网意识,持续提升现网的稳定性,有运维或稳定性相关经验优先; 5、具备良好的沟通表达能力和团队合作意识,责任心强,有较强的自我驱动能力; 6、掌握Golang、C++、Python等开发语言中的一门。
-
职位说明: 1、 负责搭建和维护业务系统的运行环境,包括服务器架设、应用软件安装、配置以及优化; 2、 负责业务系统的管理与维护,包括性能监控、性能调优和故障诊断等; 3、 负责相关业务线的发布和数据同步的工作; 4、 日常运维文档的撰写整理工作; 5、 及时响应并协助解决公司应用相关的IT风险事件。 任职资格: 1、深入理解linux系统、Windows系统; 2、熟悉服务器硬件故障的简单处理; 3、熟悉交换机、路由器、软硬件防火墙和TCP/IP原理等网络设备及技术应用; 4、精通一门以上脚本语言(shell/go/python等),有java/c++开发经验更佳; 5、精通lvs、nginx、haproxy等组件运维体系; 6、精通持续集成,持续发布的管理流程和工具,熟悉jenkins; 7、掌握主流开源监控软件的配置使用,如:Zabbix、Open-Falcon等。
-
职位职责: 关于我们: 我们是国际支付的Global SRE团队,通过业务稳定性保障、SRE技术风险平台建设,来保证国际支付业务高质量服务水平。 主要工作是,解决国际支付在稳定性、运维效率上的痛点问题,并从国际支付稳定性需要的角度,持续提升可观测性、应急响应水平以及技术风险保障的质量和效率。 业务挑战: 国际支付业务在高速增长期,上游业务也在高速增长,业务复杂度、迭代速度、数据规模同样在快速增长。随着业务国际化进程加快,我们需要在全球各地提供业务稳定性保障。 技术挑战: 国际支付在全球各地构建机房,基础设施、团队协作、不同时区和文化、权限管控,多种因素叠加在一起,需要我们从复杂业务稳定性、全球机房稳定性两个视角来构建业务和技术SRE体系,保障业务服务水平。 1、业务稳定性保障,构建并优化可观测性大盘,积极参与响应和应急,持续提升MTTR和SLA; 2、参与SRE技术平台研发,提升运维效率,推动风险治理,不限于监控告警、变更管控、风险巡检、预案演练等能力; 3、参与建站及日常运维工作,积极响应各子域相关诉求,确保运维交付水平。 职位要求: 1、本科及以上学历,计算机相关专业; 2、3年及以上相关SRE平台建设、复杂业务运维经验, 3、扎实的计算机软件基础知识,了解 Linux 操作系统、存储、网络 IO等相关原理; 4、熟悉一种或多种编程语言,如 Python/Go/Java/Shell/C++等; 5、善于沟通协作,积极响应解决问题,善于发现运维痛点,并提出方案进行优化。
-
环境管理: 1. 负责SaaS系统的运维保障,确保全年稳定运行服务质量达标,为系统的稳定运行负责,为业务提供稳定、高效运行环境; 2. 负责网络和服务器资源的管理和优化,持续集成; 发版管理: 1. 负责部署架构审核优化、系统监控、持续交付、应急响应、容量规划等; 2. 深入理解大型信息化系统,发现并解决重大故障及性能瓶颈,设计自动化运维方案,制定管理策略; 对内管理: 1. 持续的创新和优化能力,提升系统的整体质量,改善控制系统成本; 2. 负责运维相关规范,流程的制定及推进实施; 3. 负责整个运维部门的管理和建设工作,对运维的质量、效率、成本及安全负责 对外服务: 1. 负责SaaS在落地端的运维保障工作,建立顺畅有效的运维巡检机制,能够及时响应并改善客户方运维体验; 2. 能够积极推进运维在客户端的工作,通过改善部署、方案、流程、机制等提升运维效率
-
职位描述: 1.制定应用运维管理相关标准规范并落地实施,包括性能容量、应急处置、投产交付、高可用和连续性管理等; 2.根据应用系统运行特点及状态,对难点技术进行攻坚,响应并解决业务服务在部署、运维稳定性、高可用方面的技术难题; 3.借助人工智能、机器学习、数据模型等技术,有效推进运行体系向智慧运行方向发展; 4.参与DevOps开发运维一体化流程体系建设,跟踪、研究业界SRE新技术的发展方向,推动新技术落地实施,提升团队技术水平。 职位条件: 1.5年及以上运维相关经验,有大规模运维下的稳定性建设、容量规划、变更控制等工作经验; 2.精通传统基础架构或云平台、分布式架构下相关应用高可用部署标准,对在上述架构下的容量规划、稳定性管理有深刻理解和实践经验; 3.熟悉分布式部署架构下的基础技术,包括云原生(包括国产容器云)等技术和理念,熟悉掌握WAS、Tomcat、Redis、Kaflka、Elasticsearch等技术应用,对持续集成和持续交付(CI/CD)有深入了解和实践,熟悉Jenkins等DevOps工具,熟悉自动化运维体系,具备较强的应用运维效能提升能力; 4.具备较强的理解沟通、协调组织和问题解决能力; 5.有大中型银行或大型公司运维团队管理经验者优先。
-
10+岗位等着你,有软件开发、运维、技术支持、产品经理等经验的同学都可以来试试看。 1. 你有3年以上软件开发经验,会写代码,做过项目,语言不限,js, java, python, 客户端开发等都行。 2. 你做过软件系统运维,搞过k8s、openstack、cicd等。 3. 你做过技术支持、写过答疑文档,懂产品技术。 4. 有互联网产品设计调研经验,对市场敏感。 诚云科技的文档工程师岗位很需要你的加入。和我们一起去学习使用阿里云产品,一起建设阿里云产品的文档。
-
1、计算机相关专业,具有2年以上计算机系统运维工作经验,了解网络、操作系统、数据库、中间件、存储、服务器等基本概念; 2、具有一定综合管理经验,了解事件问题、性能容量、变更、发布、配置、监控等基础运维管理的概念; 3、具有较好的口头和书面表达能力; 4、熟练掌握办公软件使用技能,包括但不限于excel表格及其宏、思维导图工具、PPT等。
-
岗位职责: 1、协助客户解决线上产品使用问题,问题包含但不限于BUG与故障的排除、数据的查询、分析与比对; 2、对客户日常使用中的常见问题进行汇总并提出合理的优化建议; 3、负责系统运营期间与用户交流,收集、分析用户需求信息,整理出规范的需求技术文档; 4、积极配合部门其他同事的工作,以提高团队的综合业务能力; 5、与内部团队和外部客户建立协作关系,协调各方资源,推进解决问题; 任职要求: 1、熟练掌握linux、类unix系列操作系统的部署和调试,熟练掌握Python、shell等脚本语言 2、熟悉F5、nginx、LVS、haproxy等项目的工作原理和调试 3、熟悉ZooKeeper、kafka、elasticsearch等开源项目的使用、熟悉高可用、负载均衡等架构模式。 4、熟悉MySQL、Redis 等数据存储组件 5、熟悉TCP/IP、DNS、HTTP、IPSec等网络协议以及主流的防火墙工作原理 6、善于思考,乐于发现,对解决具有挑战性问题充满激情,具有主人翁意识,良好的沟通和团队合作精神,沟通解决内合作单位的技术运维问题
-
职位描述: 1、负责公司线上系统运维,提升业务稳定性,制定和优化运维解决方案,包含容灾/弹性扩容等; 2、配合各研发方向合作,提供高效的监控、故障快速处理的手段和能力,提升运维工作效率; 3、参与业务系统容量测算和规划设计,优化资源运维成本; 4、负责运维工作持续向自动化,标准化方向迭代优化,不断提升线上服务整体质量; 5、负责 Kubernetes 核心组件的扩展与维护,保障 Kubernetes 系统稳定性; 6、负责 Kubernetes 组件性能优化,分析各组件性能瓶颈,提升 Kubernetes 单集群规模,保障稳定性; 7、探索、研究新的运维技术方向。 职位要求: 1、大学本科以上学历,计算机相关专业,2年以上的应用运维实战经验,熟悉软件开发和系统架构; 2、熟悉Linux系统和Shell,对网络、存储等基础设施领域有一定的了解和知识储备 ,具备很强技术敏感度和故障排查经验; 3、有良好的沟通,团队协作能力,熟悉DevOps流程; 4、具有linux 下python、golang其中之一的研发经验优先 ; 5、强烈的责任心、良好的沟通和协调能力、极强的业务推动能力、勇于接受挑战; 6、精通Docker技术,具有kubernetes容器集群的实际运维或开发经验;
-
岗位职责: 1.全面管理运维工作,包括应用配置管理、系统监控、容量评估、扩容、容灾、架构改造等;处理系统故障,缩短故障影响时长,跟进、推动重大事件改进措施实施,保障SaaS和专有云稳定高效的部署及运行 ; 2.深入研究运维相关技术及团队业务,设计、规划以及完善现有运维业务体系及平台建设,支撑团队在资源管理、部署、监控、日志、容灾切换、弹性伸缩、故障分析处理等运维领域能力提升; 3.参与业务的长期规划,把握业界devops运维领域的方向和趋势,具有较强的运维平台产品规划能力,保障产品运维能力业界领先; 4.保障运维安全,建立运维安全防护能力,主动探索、研究新的运维技术方向。 任职要求: 1.本科及以上学历,5年以上运维相关工作经验; 2.了解Devops理念、熟悉devops前沿技术、有主导DevOps工具链产品交付经验者优先; 3.熟悉Prometheus、Grafana、skywalking等常用监控组件的监控系统管理与调优; 4.具有公有云(阿里云腾讯云华为云等)运维经验,有大规模集群操盘经验者优先; 5.有大数据运维系统架构经验者优先。
-
岗位职责: 1、负责数据库产品交付上线、运维保障、故障诊断、问题处理工作; 2、负责分布式数据库产品运维平台和工具的设计、开发工作; 3、用自动化、智能化的方法解决超大规模集群、分布式应用及复杂系统运维中的问题; 4、负责监控系统的设计、评审、发布并推动产品改进; 岗位要求: 1、熟悉Linux操作系统,具备常见故障的诊断、分析和处理能力; 2、熟悉Java、C/C++、Shell、Python等任一编程语言; 3、有业界领先的运维平台设计、开发、维护、SRE等经验者优先; 4、责任心强,沟通能力好,适应团队工作,善于思考、总结和改进。
-
工作职责: 1. 规划并优化系统部署架构,带领运维团队保障平台持续稳定可靠; 2. 根据业务发展需要和平台整体运行状况,持续提升团队运维效率和保障水平; 3. 关注和预研运维方面的新技术,有效创新; 4. 负责人员搭建、人才培养、考核激励等运维团队管理建设。 岗位要求: 1. 本科及以上学历,计算机、软件工程等相关专业; 2. 5年以上运维团队管理经验,有互联网行业从业经历,熟悉SaaS领域,有ACP、CISP等证书优先; 3. 精通Python/Shell/Java/Golang等1种以上开发语言,掌握Linux/Windows系统管理和各类运维开源工具; 4. 有中大型平台规划、建设和持续优化的经验,熟悉常规运维管理体系,能够搭建运维规范、标准和流程,具备各类运维故障分析和处理能力; 5. 学习能力强,自驱,有责任心,有高度的团队管理意识和客户服务理念。
-
岗位职责: "(1)2年以上相关工作经验; (2)熟悉TCP/IP协议及基础网络知识; (3)精通Linux、Windows系统管理与维护; (4)精通MySQL、oracle等主流数据库运维; (5)熟悉SLB、LVS、HAProxy等负载均衡技术; (6)熟悉主流云平台、容器平台操作。 (7)熟悉k8s、Jenkins等自动化部署平台。 2.优选条件: (1)熟悉 Nginx , Apache ,MySQL,Redis ,Tomcat,Memcache 等开源软件; (2)有相关认证证书优先。" 专业技能: "1. 负责部门服务器、数据库、应用底层架构服务等日常维护及管理; 2. 系统环境平台和业务应用系统部署、性能调优、问题分析和故障处理; 3. 保障数据库、中间件、基础软件服务、应用服务统、监控系统软件环境等的安全稳定运行; 4. 定期进行数据备份、服务器性能、应用服务等日常检查; 5. 根据相关工作流程及时响应公司各系统平台紧急事件; 6. 系统运行维护(系统监控,资源调整)。 7. 负责生产环境基础组件搭建及部署工作。"
-
【岗位职责】 1. 负责梳理和规划IT运维相关的数据模型、业务模型; 2. 梳理各种IT资源的监控、自动化运维管理的实现方案并指导开发人员完成脚本开发; 3. 协助完成运维产品发展规划、需求分析和开发实现; 4. 参与重要项目的实施,指导开发人员完成脚本开发。 【职位要求】 1. 至少6年以上IT运维相关实际工作经验; 2. 熟悉网络设备配置管理,有Linux、Windows、各种Unix系统实际管理经验; 3. 精通各种常用企业级中间件、数据库的功能特性、安装部署和运维管理; 4. 精通Shell、PowerShell等运维管理脚本语言; 5. 了解Puppet、SaltStack、Ansible、Zabbix或Datadog等运维工具; 6. 熟悉Python/Perl、Java或有过运维平台的分析设计经验优先考虑。
-
• 工作职责: 1、负责事业部运维产品的总体技术选型,架构设计以及落地实施,为运维产品技术领先性 负责; 2、深入发掘和分析业务需求,核心功能的架构与代码模板编写; 3、制定接口规范,编码规范以及对应技术文档的输出; 4、善于学习和分享,能够持续提高团队整体技术水平; 5、参与异常分析和复盘,解决架构相关疑难问题,通过架构优化,提升产品质量和研发效率; 6、关注运维新技术动态,做好产品技术的技术规划,提升产品技术竞争力; • 任职要求: 任职资格: 1、 8年以上Java/J2EE开发的经验及1年以上go语言开发经验,JAVA基础扎实,深入理解SpringCloud、Dubbo等微服务框架并有一定的实操经验; 2、精通Kubernetes, 容器、Serverless、Istio等容器和云原生技术,熟悉微服务架构; 3.精通分布式、存储、缓存(如Redis)、消息(如RocketMQ、Kafka)、搜索(如Elasticsearch)、日志分析(如ELK)等中间件,熟悉高并发、高可靠性系统的设计 4、精通高并发、高可靠性系统的设计、熟悉性能优化、故障排查、日志收集和分析等 5.、熟悉运维相关技术和具备业务架构能力,能够根据业务设计技术架构; 6、至少参与过两个以上大型系统的架构设计和架构落地,有监控运维经验者优先; 7、具备良好的团队协同.沟通交流及抗压能力,能够带领研发团队分析和解决问题


