-
岗位职责: 1. 监控和处理线上环境服务突发故障,保障服务稳定运行; 2. 排查和解决系统层面导致的业务软件运行问题,采用自动化手段监控和预防类似的情况; 3. 开发完善运维所需工具,支撑业务并持续优化改进用户网络游戏加速体验; 4. 通过对业务的深入理解,持续优化改进业务系统及产品,提升系统性能和服务效率。 任职要求: 1. 本科及以上学历,计算机/电子/通信等专业毕业,四年及以上Linux运维经验; 2. 熟悉Linux操作系统的基础运维; 3. 系统了解TCP/IP网络协议栈,熟悉网络问题分析; 4. 掌握其中一种(python,Golang)进行运维工具开发; 5. 良好的团队合作精神,认真负责的工作态度,良好的沟通能力,热爱技术擅专研。 根据工作安排,会有早晚班的轮排,1个月大概6-8天晚班 1.早班:9:00-18:00,晚班:14:30-22:30; 2.晚班回家可实报实销车费。 俊云收入结构: 月薪+年终奖金+绩效奖金+合伙年终分红+各类补贴+俊云特色福利包,全年累计14-16个月月薪。 俊云各类福利: 1. 社保&公积金&商业保险为你保驾护航,助你安居乐业有保障。 2.公司自有食堂营养双餐&餐后水果&丰盛零食,让你元气满满,能量加倍。 3.N天带薪年假&团建基金&团队出游&花式聚餐,助你快速融入团体,默契协作。 4.专项学习发展基金&各类学习资源与补贴,帮你技能提升,快速成长。 5.各类贺礼、慰问、节庆、纪念日,花式宠你,让你倍感温暖与惊喜。 期待我们共同努力,成为一家有用户规模、有社会责任担当的企业,为团队成员提供物质及精神的幸福保障,为玩家带来更好的游戏体验,还在等什么,一起追梦吧~
-
职位职责: 关于我们: 我们是业务中台-SRE团队,我们正在负责字节跳动多个业务线如抖音搜索、抖音生活服务、今日头条、教育等多个应用的稳定性工作,通过MTTR治理、故障预防、容灾演练、机房建设等多个技术手段,保证多款核心业务高质量服务水平。 业务挑战: 我们团队需要支撑多个不同阶段的业务线,抖音搜索、抖音生活服务在业务复杂度、迭代速度、数据规模同样在快速增长,需要逐一突破每个业务不同的稳定性痛点,逐步成为字节中国业务稳定性优秀团队。 技术挑战: 在横向方面,我们要面向多个业务线探索通用的SRE解决方案,主导SRE技术方向在不同阶段的业务落地; 在纵向方向,我们要深入到业务中,深挖业务的痛点,面向多机房容灾等难题,为业务量身定制不同的稳定性解决方案。 1、持续支撑抖音搜索、抖音生活服务、今日头条等多条业务日常稳定性保障,构建并优化可观测性大盘,积极参与响应和应急,持续提升MTTR和SLA; 2、参与SRE技术平台研发,提升运维效率,推动风险治理,不限于监控告警、变更管控、风险巡检、预案演练、资源管理、成本优化等方向,强化通用化SRE技术能力; 3、参与热点流量、春节活动、营销活动稳定性保障,引导 SRE 运维工作朝着自动化、平台化、智能化方向演进,提升基础架构各组件体系整体运维管理效率。 职位要求: 1、本科及以上学历,计算机相关专业, 并有2年以上互联网运维工作经验; 2、扎实的计算机软件基础知识,了解 Linux 操作系统、存储、网络 IO等相关原理; 3、熟悉一种或多种编程语言,如 Python/Go/Java/Shell/C++等; 4、具备系统化解决问题的能力,良好的沟通技巧和主人翁责任感; 5、具有接入/计算/存储等相关系统经验优先(Nginx/Kubernetes/Docker/Redis/Mysql/RMQ 等)。
-
(一)岗位职责 1、负责项目实施过程中项目基础设施的架构设计、规划和实施等相关工作; 2、负责项目中DevOps工具开发已提高整体业务运维效率,保障DevOps系统持续高效稳定运行,持续了解调研及学习业界先进开发模型及框架,应用与优化当前DevOps流程; 3、承担所负责项目的云平台相关问题定位和问题处置; 4、协助进行项目立项采购及配套的商务工作; 5、完成上级领导安排的其他工作。 (二)任职要求 1、本科及以上学历; 2、具有2年及以上DevOps工作经验,有腾讯、阿里、华为等云的开发和运维经验者优先; 3、熟练掌握Spring Cloud、Dubbo等主流微服务框架,熟悉Docker、Kubernetes等相关容器技术,熟悉Redis 、ELK、Jenkins、Nexus、Zoookeeper等工具; 4、熟练掌握Java/Python等主流语言,掌握Mysql、MongoDB、Oracle、DB2等主流数据库相关技术; 5、熟练掌握Linux等系统下环境系统集成技术; 6、具有较强的责任心和抗压能力,良好的团队沟通协作能力。
-
1、负责运维项目的管理、实施、沟通等工作,确保项目达标 2、对系统中数据和业务流程进行全面监控,包括自动化监控系统的搭建和使用,并对出现的异常现象进行定位、处置与预防; 3、参与系统的安保工作,确保系统正常运行; 4、和公司研发人员及客户系统负责人进行协同沟通,将客户的需求进行有效传达; 5、负责处理客户的投诉、咨询和答疑; 6、负责版本的迭代更新、上线验证; 1、本科及以上学历,三年以上运维经验。 2、熟悉Java、C/C++、go 中至少一种语言 ; 3、精通shell脚本、精通Python语言; 4、熟练使用 ansible 等自动化运维工具; 5、具备丰富的linux服务器操作和管理经验 ; 6、精通 mysql/postgres/高斯数据库的部署、管理、配置、调优、维护和高可用集群的搭建,擅长编写SQL; 7、精通常见大数据框架,包括:hdfs yarn hive hbase spark flink 等,具备独立规划、搭建、维护、调优大数据集群的能力 ; 8、精通 k8s 、docker、CI/CD 的部署、管理、配置、调优、维护; 9、具备丰富的运维管理经验; 10、to G 或 to 大B的从业经验优先考虑,例如:运营商行业、政府行业、金融行业、公安行业等;
-
岗位职责: 1、负责各公有云资源和基础服务的运维管理,保障服务系统的稳定、安全可靠的运行,处理突发事件、对疑难问题进行跟踪并最终解决,保障业务连续性; 2、参与公司Kubernetes集群架构规划、设计、运维和管理; 3、参与运维体系建设,实现分布式与高可用的集群运维,确保集群稳定性运维,制定业务相关的运维技术方案,确保业务高效稳定的运行。 4、参与云原生技术解决方案的制定、验证及落地;重要特性及核心功能的创新和技术攻关; 5、参与自动化运维平台的建设,提升运维效率; 6、应用相关技术实现运维成本控制,优化并提升资源利用率,通过技术手段完成高效运维服务支持。 岗位要求: 1、**本科及以上学历,4年以上运维相关运维;具有3年以上公有云大规模资源的运维和实践管理经验; 2、熟悉操作系统、容器技术、Kubernetes架构,熟悉相关网络和存储解决方案,可以独立处理复杂的k8s集群问题; 3、熟悉业界主流容器云平台的架构设计,熟悉公有云AWS/阿里云/GCP/Azure等; 4、熟悉至少一门脚本语言(shell/python/Go均可),具备底层脚本开发能力; 5、良好的沟通和协调能力、极强的业务推动能力、强烈的责任心
-
岗位职责: 1、负责智能化运维平台的规划设计、实现及优化⼯作,带领研发团队研发先进的智能运维产品; 2、AIOps、SRE⽅向的前沿性研究、探索和落地; 3、参与核⼼系统的设计和编码; 4、主导技术⽅案和系统运维架构评审,掌握相关的技术架构和原理,能够从运维⻆度主动识别⽅案⻛; 险,并给出专业的解决⽅案; 5、对研发团队的质量和效率负责; 6、团队内部的技术培训与⼈才培养; 7、跨团队的沟通、协调和协作。 工作要求: 1、深⼊理解计算机体系架构、linux内核、分布式系统架构、虚拟化技术、⽹络通信与系统编程⾄少2个 ⽅向以上技术; 2、精通python和java语⾔,有⼤型项⽬开发经历; 3、熟悉Docker/k8s容器平台及相关的底层技术和原理; 4、熟悉Jenkins、Gitlab等,熟悉CI/CD流程制定与集成; 5、有良好的⽹络、存储、安全等计算机体系结构⽅⾯的知识; 6、具备丰富的⼤规模服务集群的运维经验和⼤型运维系统的设计能⼒和落地经验,⾼并发架构经验, 熟悉⾼可⽤集群、负载均衡集群的规划与搭建; 7、熟练掌握Redis、Kafka/RabbitMQ、Ceph/ElasticSearch等主流中间件(⾄少2个以上)的原理和使 ⽤; 8、了解Hadoop/Spark/Filnk/Hive等⼤数据主流技术(⾄少2个以上); 9、熟悉数据库技术(MySQL); 10、技术领导⼒; 团队协调⼒和执⾏⼒; 有下⾯经历会有加分项: 负责过运维体系层⾯的系统性规划和建设,有实践经验; Django使⽤和开发经验; Saltstack使⽤和开发经验; airflow使⽤和开发经验; AIOps系统设计研发经验。
-
岗位职责: 1、负责运维室出入审核、授权,根据值班计划进行值班 2、负责机房视频监控与现场巡检。 任职要求: 1、本科及以上学历,计算机及相关专业; 2、有 Linux、网络、数据中心维护经验; 3、熟练掌握office等办公类应用软件; 4、具备较好的沟通能力和执行力,工作责任心强,抗压力强; 5、能适应夜间及周末值班要求。
-
工作职责: 1、负责推动安全基线标准和各类安全管理规范的制定和实施。对基础设施/网络/业务系统等进行安全评估、安全问题推动跟进,并提供相关安全解决方案; 2、负责基础安全系统的设计和维护,方案落地; 3、参与基础安全系统或相关工具开发,安全规范修订等; 4、在出现安全事件时,积极应急响应,进行分析调查取证。 工作要求: 1、本科及以上学历,2年及以上互联网或金融行业信息安全相关经验,有安全管理、业务安全、运维安全等相关经验者优先; 2、熟悉渗透测试,有各大SRC高危漏洞采纳优先; 3、有大型安全产品的研发经验或大型互联网公司安全团队工作经验者优先; 4、良好的英文听说读写交流能力,能使用英语作为工作语言; 5、此岗位需要出差。
-
岗位描述: 1.负责大数据平台调度作业的日常监控、维护及协助优化; 2.负责建立大数据开发规范并持续完善,能够对技术风险、技术交付质量进行管控; 3.负责常规需求中底层数据开发及数据服务封装开发; 4.深入理解数据平台架构,发现并协助解决性能屏障; 5.新技术研究和应用,并推动适合的技术应用于生产。 任职要求: 1.本科及以上学历,计算机及软件工程相关专业; 2.2年以上大数据系统开发或运维经验,熟悉hadoop生态圈、CDH大数据平台; 3.熟悉数据规范流程及数据维度模型,精通sql、shell,了解spark、python、scala、flink; 4.具有较强的计算机网络、系统运维专业基础,熟悉掌握常用linux命令; 5.有体系化大数据平台运维工作经验优先考虑。
-
职责描述: 1、负责公司大数据平台的运维保障工作,保障平台的正常运行和相应数据服务的稳定高效; 2、对接数据开发侧团队,主动优化和完善服务巡检、监控工具、脚本等,减少人工操作提高运维效率;负责数据平台的故障处置、推动性能优化。如平台产品技术问题,提交给平台产品技术组进行后台处理,并及时反馈. 3、负责数据平台二线运维支撑保障,响应运维/服务台一线请求:处置生产事件,跟踪问题处理; 4、定期组织团队人员开展大数据平台的技术知识积累和移交; 5、负责设计日常运维相关的自动化工具或系统,并完成相应需求收集和需求管理 ; 任职要求: 1. 具有1年以上金融行业数据类项目运维经验,熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员,或长期在类似的运维项目上承担运维工作优先; 2. 具备较强的数据开发分析能力,熟练掌握SQL等技能,熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先; 3. 具备较强的数据分析,问题分析,逻辑思维能力,团队协作能力,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 4. 强烈的自驱力和责任感,面对复杂业务问题,可以从业务和技术多角度推进,最终达成目标。
-
工作职责: 1、负责云平台上的各类云服务实例日常维护,包括资源监控、性能调优和故障排查。管理云资源的生命周期,如创建、配置、调整规格、升级操作系统与软件版本等。 2、服务可用性保障,利用监控工具确保业务系统的7x24小时稳定运行,及时响应告警并进行问题处置。实施和优化服务器及应用的服务恢复策略,确保服务高可用性和容灾能力。 3、参与公司各业务线的服务器网络架构设计,协助制定合理的网络拓扑结构和安全防护措施。 配合团队完成服务器之间的网络连接配置、负载均衡设置以及安全组规则的编写与更新。 4、协助开发团队进行项目服务环境的搭建、安装调试,并配合项目的上线与迁移。对项目实施过程中的服务部署进行跟踪管控,确保项目按时交付并满足业务需求。 5、快速响应故障处理,对线上问题进行初步判断与分类,执行相应解决方案。与内部技术团队和其他部门紧密协作,提升故障响应处理时效 6、编写运维操作手册、应急预案及技术文档,记录运维过程中的关键步骤和常见问题解决方案。 参与运维标准化流程建设,持续改进运维效率和服务质量。 7、不断学习了解云平台新产品、新功能以及行业最佳实践,提升自身的云计算运维技术水平。 积极参加培训课程和内部分享活动,通过实际操作不断积累经验,向中级乃至高级运维工程师的角色发展。 任职资格: 1、具备系统维护能力,熟悉linux系统及常见操作命令,了解云计算平台服务,对云平台产品和服务有基本认知 2、理解网络基础知识,包括TCP/IP协议、路由交换原理等 3、具备一定的计算机编程能力,熟练掌握shell脚本语言,熟悉Python编程 4、熟悉常用运维工具及软件,熟练使用Zabbix、Prometheus、open-faclon等监控系统,熟悉Nginx、Haproxy部署配置,熟悉ansible、saltstack 5、熟悉CICD流程,熟练使用git,熟练gitlab、jenkins的操作配置 6、熟悉了解K8S 7、具备较强的沟通能力和团队协作精神、具备较强的学习能力和自我驱动力。
-
*具体薪*ZI面议 岗位职责: 1.负责公司各类服务器和云主机的安装、部署、日常运维 2.负责公司各类云平台和存储等基础设施的日常运维 3.开展日常软硬件设备和服务采购,完成采购项目的公开招标 任职要求: 1.教育背景:大学本科及以上学历,计算机相关专业 2.专业技能:熟练掌握各类主流Linux版本的日常系统运维;具备丰富的Vmware/KVM虚拟化交付/部署/维护经验;具备堡垒机、Ansible、CMDB、zabbix等运维工具的实操能力;有大型网站或互联网公司系统运维经验者优先;具备阿里云、腾讯云等公有云/私有云的运维经验,熟悉云基础设施底层架构,具备从物理机迁移上云的项目实施经验;有国产操作系统使用经验的优先 3.个人素质:工作积极主动,具有良好的团队协作能力和责任心 4.工作经验:3年及以上相关工作经验
-
工作职责: 1、负责直播业务的日常运维、突发异常的应急响应和处理工作; 2、负责直播业务的运行状况和性能监控,及时发现隐患和容量瓶颈并推动优化,提高业务系统的健壮性和服务时效; 3、参与业务系统架构的可运维性设计,推动业务系统按照运维规范开发投产; 5、阿里云,腾讯云,k8s业务支持。 工作要求: 1、本科及以上学历,计算机或相关专业; 2、4年及以上业务系统运维经验,有大型互联网公司运维经验优先。 3、精通Linux系统运维,对Linux操作系统原理有一定的理解; 4、熟悉TCP/IP协议,能够进行网络抓包分析; 5、熟练掌握开发工具,能够写脚本或服务满足业务需求,有开发经验,golang, java优先。 6、熟悉Docker、k8s使用及原理,能定位异常; 7、熟悉常用开源组件nginx/redis/mysql/kafka/etcd/zookeeper/elasticsearch/prometheus等 8、熟悉自动化运维工具如saltstack、ansible等 9、责任心强,具备良好团队合作精神,较强的安全风险意识。 10、对CI/CD、ELK日志监控及调优、全链路监控jaeger/SkyWalking等有深入理解优先 11、熟悉和使用过业界云平台:阿里云、腾讯云、AWS等优先 12、熟悉istio/linkerd等ServiceMesh方案并有实际的应用使用经验优先
-
10k-20k 经验不限 / 本科工具类产品,软件服务|咨询,IT技术服务|咨询 / 不需要融资 / 500-2000人岗位职责 1.利用Docker与Kubernetes等容器技术、业界先进的Serverless技术以及Service Mesh、链路分析等技术,设计及实现蚂蚁集团基于K8S的微服务治理平台 2.能够快速识别并解决运维相关的问题 3.负责对事件、故障的跟踪、剖析、总结与知识库沉淀,设计实现相关运维自动化能力,同时赋能给客户自主运维能力 4.运维产品架构优化,同时梳理产品链路沉淀经验,提升问题终结能力; 5.培养引导新人,使其快速具备运维能力; 岗位要求 1.本科或以上学历,3年以上 运维/devops/研发 等相关经验; 2.至少熟悉shell、python、golang、Java其中一门语言,熟练掌握主流应用服务器架构体系、数据库以及各种中间件技术者优先; 3.有互联网相关运维自动化、持续交付、监控系统、发布系统、运营支撑系统运维经验者优先; 4.熟悉容器化、云计算等虚拟化技术、熟悉Kubernetes、Helm等容器编排技术;有AWS、GCP、阿里云、OpenShift、CloudFounry等相关经验者优先; 5.熟悉DevOps、ELK、Prometheus、Fluentd监控分析等平台者优先; 6.自驱力强;有较强的学习能力和良好的技术视野,快速学习和扩展; 7.有良好的沟通能力和推动能力,有docker,k8s,容器化,云原生,虚拟化相关经验者优先。 8.具备一定的系统架构设计能力,有带团队经验者优先
-
岗位职责: 1、IT安全管理规划及体系建设,完成对系统纵深防御体系建设,部署维护安全检测、监控或阻断系统; 2、保障系统自身业务安全、运维安全、网络安全、数据安全、主机安全等; 3、负责包括WAF、IPS、审计、态势感知、审计、端点检测和响应工具(如防**)等安全设备的配置和管理; 4.负责系统自身安全风险及隐患发现分析,针对存在的安全问题,设计安全策略和解决方案。 岗位要求: 1、本科以上学历,网络通信、信息安全、计算机及其相关专业; 2、具有3年以上的网络和计算机安全方面的工作经验; 3、具有CISSP、CISA、COBIT、CCIE、CCNP、CISP、CIW等认证者优先考虑; 4、熟悉国内外主流的网络安全产品和技术,如防火墙、IPS、WAF、堡垒机、终端产品等,具有使用经验并能熟练操作和配置; 5、熟悉国家信息安全相关政策、法规与标准,熟悉信息安全管理体系与信息安全风险评估的理论、过程和方法; 6、熟悉主流网络设备、操作系统、网络应用系统配置和安全加固,熟悉黑客攻防技术,能够处理突发性安全事件; 7、具有良好的沟通能力和文档撰写能力,能够适应较大的工作压力。