-
职位职责: 1、负责字节跳动数据中心网络P4网关产品交付和线上运维工作,提供超大集群网关服务能力和保证线上稳定运行; 2、负责网关类产品稳定性方案设计和能力建设,包括监控、告警、应急响应、运维数据分析,风险治理等; 3、负责网关类产品运维流程和规划的制定和优化,持续提升交付、变更、运维效率。 职位要求: 1、计算机相关专业,本科以上学历,具备扎实的计算机体系知识; 2、熟悉常见网络协议,比如TCP/IP、BGP、VXLAN、GRE等; 3、熟悉VPC、负载均衡、云企业网、专线连接等公有云网络产品优先; 4、具备良好的现网意识,持续提升现网的稳定性,有运维或稳定性相关经验优先; 5、具备良好的沟通表达能力和团队合作意识,责任心强,有较强的自我驱动能力; 6、掌握Golang、C++、Python等开发语言中的一门。
-
职位职责: 1、负责字节跳动数据中心网络P4网关产品交付和线上运维工作,提供超大集群网关服务能力和保证线上稳定运行; 2、负责网关类产品稳定性方案设计和能力建设,包括监控、告警、应急响应、运维数据分析,风险治理等; 3、负责网关类产品运维流程和规划的制定和优化,持续提升交付、变更、运维效率。 职位要求: 1、计算机相关专业,本科以上学历,具备扎实的计算机体系知识; 2、熟悉常见网络协议,比如TCP/IP、BGP、VXLAN、GRE等; 3、熟悉VPC、负载均衡、云企业网、专线连接等公有云网络产品优先; 4、具备良好的现网意识,持续提升现网的稳定性,有运维或稳定性相关经验优先; 5、具备良好的沟通表达能力和团队合作意识,责任心强,有较强的自我驱动能力; 6、掌握Golang、C++、Python等开发语言中的一门。
-
岗位职责: 1. 大数据平台组件运维及优化,进行必要的二次开发; 2. 数据湖、数据仓库技术研究及落地; 3. 实时、离线数据产品设计及开发。 任职要求: 1. 本科及以上学历,计算机及相关专业; 2. 3-5年Java/Scala开发经验,熟悉多线程编程; 3. 熟悉大数据生态相关技术,有二次开发经验者优先; 4. 熟悉实时及离线数仓架构及开发流程,有Phoenix/StarRocks使用经验优先; 5. 熟悉常见设计模式,熟悉如Spring/SpringMVC/Mybatis等主流框架; 6. 有较强的学习能力与逻辑思维能力,良好的团队合作精神。
-
岗位职责: 1. 负责研发部基建运维,设计、部署并维护可靠、可扩展的基础设施系统,包括云计算、容器、分布式系统等; 2. 负责参与持续交付和自动化建设,制定持续集成和持续交付的流程和工具; 3. 负责事故响应和故障排查,快速定位并解决生产环境中的问题,分析事故原因,制定预防措施,持续改进系统可靠性。 岗位要求: 1.熟悉至少一种主流编程语言,如Python、Go、Java等,熟练进行代码编写、调试和优化; 2.熟悉常见的系统架构模式及常见云计算平台, 如微服务架构、分布式系统等,具备部署架构设计和优化经验及在云环境下构建和优化系统的经验; 3.熟悉SLI/SLO/SLA指标管理,对系统可用性、容错性等进行持续监控和优化,同时具备成本优化意识, 能够通过资源分析、负载预测等手段,优化系统运行成本。
-
岗位职责: 1、IT安全管理规划及体系建设,完成对系统纵深防御体系建设,部署维护安全检测、监控或阻断系统; 2、保障系统自身业务安全、运维安全、网络安全、数据安全、主机安全等; 3、负责包括WAF、IPS、审计、态势感知、审计、端点检测和响应工具(如防**)等安全设备的配置和管理; 4.负责系统自身安全风险及隐患发现分析,针对存在的安全问题,设计安全策略和解决方案。 岗位要求: 1、本科以上学历,网络通信、信息安全、计算机及其相关专业; 2、具有3年以上的网络和计算机安全方面的工作经验; 3、具有CISSP、CISA、COBIT、CCIE、CCNP、CISP、CIW等认证者优先考虑; 4、熟悉国内外主流的网络安全产品和技术,如防火墙、IPS、WAF、堡垒机、终端产品等,具有使用经验并能熟练操作和配置; 5、熟悉国家信息安全相关政策、法规与标准,熟悉信息安全管理体系与信息安全风险评估的理论、过程和方法; 6、熟悉主流网络设备、操作系统、网络应用系统配置和安全加固,熟悉黑客攻防技术,能够处理突发性安全事件; 7、具有良好的沟通能力和文档撰写能力,能够适应较大的工作压力。
-
岗位职责: 1、负责各公有云(AWS/GCP)和基础核心服务的管理和维护,包括各公有云网络、服务器、存储和k8s集群等,确保其安全、高可用和可扩展 2、负责运维团队及运维体系建设,制定并不断优化各项工作流程,完善公司运维管理规范,保障运维质量; 3、负责运维容量管理和稳定性建设,提升服务的可靠性、可扩展性以及高性能优化; 4、负责多云跨平台建设,包括AWS/GCP/阿里云跨云多活架构,以及多云k8s集群管理; 5、深入了解各项业务系统,参与业务方案讨论与设计,并推进优化服务的响应延迟、性能问题,提升服务可用性; 6、不断探索和研究新的运维技术,推动运维自动化、智能化能力建设,提升整体运维水平和风险控制能力; 7、负责推动云原生技术解决方案的制定、验证及落地,以及重要特性和核心功能的创新、技术攻关; 岗位要求: 1、**本科及以上学历,7年以上运维相关运维;具有5年以上AWS/GCP/Azure等公有云大规模资源的运维和实践管理经验;2年以上团队管理经验; 2、熟悉操作系统、容器技术、Kubernetes架构,熟悉相关网络和存储解决方案,可以独立处理复杂的k8s集群问题; 3、具备多云多中心和国际化部署管理经验; 4、具备项目管理能力和小团队管理能力,良好的沟通能力、应变能力和团队协作能力,有重大项目端到端交付经验优先; 5、具有服务意识,善于思考,积极主动、认真负责、具有高度责任感和敬业精神; 6、具有大型电商运维管理经验优先;
-
岗位职责: 1. 负责业务系统基础环境的建设、维护和管理,推动线上服务稳定性建设,提升服务的可靠性、可扩展性,保障系统SLA; 2. 负责持续优化运维解决方案,包括但不限于智能调度、弹性扩容、精细化监控、容灾预案等; 3. 建立和完善规范化的运维体系,保障生产系统可靠,安全,稳定地运行; 4. 不断研发与探索运维自动化及智能化途径,提升运维效率,降低运维成本; 工作要求: 1. 本科及以上学历,计算机软件及相关专业,3年以上工作经验; 2. 熟悉Linux操作系统、计算机网络等,基础知识扎实; 3. 熟悉Docker、K8S容器平台的使用及原理,能定位异常; 4. 熟悉并掌握各种中间件及基础组件的部署和使用,比如etcd/dns/elasticsearch/prometheus/grafana/nginx等; 5. 熟悉和使用过业界云平台:腾讯云、阿里云等优先;熟悉大模型基础架构运维优先 6. 熟悉并擅长Pyhon、shell、go等脚本语言的任意一种,并能使用脚本来完成日常系统运维工作; 7. 具有良好的线上安全意识,有责任感,工作积极进取,乐于持续学习,抗压性强,有良好的服务意识和团队精神;
-
【岗位职责】 1. 负责业务系统运维保障,通过持续优化技术架构,提升系统安全性、稳定性、高效性及易用性,支持业务和数据规模快速增长; 2. 负责建立和完善规范化的运维服务体系; 3. 负责线上问题排查,紧急故障处理,后续故障分析与优化; 4. 持续推动运维质量提升:SLA、多活容灾、故障演练、监控告警、容量管理等; 5. 结合部门需求,规划和管理各类型硬件和服务资源。 【任职要求】 1. 深入理解Linux系统,具备内核及系统参数调优经验; 2. 熟悉云原生 K8s 生态,具备生产环境落地及运维经验,有大规模 K8s 集群设计和管理经验者优先 3. 熟悉 Shell 或 Lua 等运维脚本编程,至少掌握一种脚本语言; 4. 熟悉常见中间件(如 Nginx、Redis、RabbitMQ、Kafka、Prometheus等)及数据库(如Postgres); 5. 熟悉大型分布式系统,微服务架构有日常维护和故障处理经验; 6. 具备网络基础知识,了解常见网络设备(如交换机、路由器等)的配置与优化。 【加分项】 1. 具有较强的责任心、安全意识、抗压能力及优秀的执行力; 2. 持有K8s认证(CKA/CKAD)或云平台专业认证; 3. 熟悉综合布线技术,了解网络组网原理及实施流程。 【工作模式】 - 需参与on-call轮值,处理紧急技术问题
-
岗位职责 1. 负责超大规模服务器集群的交付保障、运行维护及资源退役,保障硬件资源稳定、高效运行; 2. 负责跟踪和处理服务器各类硬件故障,持续优化问题发现-定位-处置闭环机制,提升故障处理效率; 3. 负责AI大模型训练/推理集群相关服务器的运维支持,保障模型稳定性; 4. 负责协同网络、存储、数据中心等团队进行系统级故障协同定位及优化改进; 5. 负责推动新硬件上线适配及运维策略制定,确保平滑演进; 6. 负责运维可视化、自动化能力及故障预测预防能力建设。 任职要求 1. 本科及以上学历,计算机或相关专业; 2. 3年以上服务器硬件运维经验,有IDC实地运维或大规模集群支持经验者优先; 4. 熟悉主流服务器硬件架构,具备GPU服务器运维经验优先; 5. 具备处理AI大模型训练中常见硬件故障的能力; 6. 了解Linux操作系统基本命令,掌握常用日志分析与硬件健康检测工具; 7. 具备良好的开发能力,熟悉至少一种脚本语言(如 Python / Go / Shell),可独立开发或维护日常运维自动化工具; 8. 具备良好的沟通协作能力和问题分析能力,责任心强
-
岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
-
职位说明: 1、 负责搭建和维护业务系统的运行环境,包括服务器架设、应用软件安装、配置以及优化; 2、 负责业务系统的管理与维护,包括性能监控、性能调优和故障诊断等; 3、 负责相关业务线的发布和数据同步的工作; 4、 日常运维文档的撰写整理工作; 5、 及时响应并协助解决公司应用相关的IT风险事件。 任职资格: 1、深入理解linux系统、Windows系统; 2、熟悉服务器硬件故障的简单处理; 3、熟悉交换机、路由器、软硬件防火墙和TCP/IP原理等网络设备及技术应用; 4、精通一门以上脚本语言(shell/go/python等),有java/c++开发经验更佳; 5、精通lvs、nginx、haproxy等组件运维体系; 6、精通持续集成,持续发布的管理流程和工具,熟悉jenkins; 7、掌握主流开源监控软件的配置使用,如:Zabbix、Open-Falcon等。
-
职责描述: 1、负责公有云运维工作,故障处理,日常巡检 2、负责公有云环境搭建及监控,包括处理服务请求异常问题定位及修复等运维操作。 3、对公有云环境进行风险识别和评估,提出改进建议并修复。 4、对公有云环境运维建立运维标准和流程。 5、负责企业应用部署、发布系统、CMDB等相关项目维护。 任职要求: 1、本科及以上学历,计算机及相关专业,有3年以上运维经验。 2、熟悉公有云,具有1~2年以上腾讯云或阿里云运维经验。 3、熟悉防火墙、VPN、DNS、HTTPS、TCP/IP等网络技术, 熟练使用高可用/负载均衡技术。 4、具有一定的K8S运维经验,也具备一定的云上虚拟机或者中间件资源运维经验。 5、具有mysql、redis、rabbitmq、elasticsearch、prometheus等常规业务组件丰富的运维经验。 6、有python/shell脚本编程经验,有devops自动化脚本编写开发经验优先。 7、了解基础网络知识和网络设备工作原理。 8、对于网络安全,运维安全,数据安全有一定的认知和处理经验 8、具备良好的团队合作、沟通表达能力,心态沉稳可靠。
-
岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,3年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
-
岗位职责: 1. 协助系统运维部经理负责数据中心系统运维部的管理工作,制定部门运维战略、管理制度及流程,确保部门工作高效、合规开展。 2. 统筹银行虚拟化环境、阿里云平台、主流存储设备的运维管理,保障底层基础设施稳定运行,支撑上层业务系统正常运转。 3. 主导数据中心系统架构规划与优化,结合业务发展需求,提出合理的架构升级、扩容及技术迭代方案,提升系统整体性能与可靠性。 4. 推动运维工作自动化与智能化转型,引入自动化运维工具、智能化监控与预警平台,减少人工操作,提升运维效率与故障响应速度。 5. 负责团队建设与管理,包括人员招聘、技能培训、绩效考核与职业发展规划,打造专业、高效的系统运维团队。 6. 牵头处理系统运维过程中的重大故障与突发事件,组织技术攻关,制定应急预案并定期演练,降低业务中断风险。 7. 与业务部门、开发部门、云服务商等保持密切沟通,协同推进系统资源调配、技术对接与问题解决,保障业务需求顺利落地。 任职要求: 1. 具备良好的身体素质与抗压能力,能适应数据中心7×24小时运维保障的工作节奏。 2. **本科及以上学历,计算机科学与技术、软件工程、信息工程等相关专业优先。 3. 拥有5年以上银行系统运维相关工作经验,其中至少2年以上团队管理经验,有大型银行数据中心运维管理经验者优先。 4. 核心技能: ◦ 精通银行虚拟化技术(如VMware、KVM)的部署、运维与优化,熟悉虚拟化资源调度与容灾方案。 ◦ 深入了解阿里云平台架构(如ECS、RDS、OSS、VPC等),具备阿里云环境运维、资源管理及故障排查经验。 ◦ 熟悉主流存储设备(如IBM、EMC、华为等品牌)的原理、配置与运维,掌握存储容灾、数据备份与恢复技术。 ◦ 具备数据中心系统架构规划能力,能结合业务需求设计合理的基础设施架构方案,有架构升级或迁移项目经验者优先。 ◦ 熟悉自动化运维工具(如Ansible、Jenkins、Puppet)与智能化监控平台(如Prometheus、Grafana、Zabbix),有相关平台搭建与实践经验者优先。 5. 具备较强的问题分析与解决能力,能快速定位并处理复杂系统故障;拥有出色的沟通协调与团队管理能力,能有效统筹团队工作并推动跨部门协作;具备较强的责任心与创新意识,对运维技术发展趋势有敏锐的洞察力。
-
职责描述: 1、负责公司大数据平台的运维保障工作,保障平台的正常运行和相应数据服务的稳定高效; 2、对接数据开发侧团队,主动优化和完善服务巡检、监控工具、脚本等,减少人工操作提高运维效率;负责数据平台的故障处置、推动性能优化。如平台产品技术问题,提交给平台产品技术组进行后台处理,并及时反馈. 3、负责数据平台二线运维支撑保障,响应运维/服务台一线请求:处置生产事件,跟踪问题处理; 4、定期组织团队人员开展大数据平台的技术知识积累和移交; 5、负责设计日常运维相关的自动化工具或系统,并完成相应需求收集和需求管理 ; 任职要求: 1. 具有1年以上金融行业数据类项目运维经验,熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员,或长期在类似的运维项目上承担运维工作优先; 2. 具备较强的数据开发分析能力,熟练掌握SQL等技能,熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先; 3. 具备较强的数据分析,问题分析,逻辑思维能力,团队协作能力,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 4. 强烈的自驱力和责任感,面对复杂业务问题,可以从业务和技术多角度推进,最终达成目标。


