-
岗位职责: 1. 负责研发部基建运维,设计、部署并维护可靠、可扩展的基础设施系统,包括云计算、容器、分布式系统等; 2. 负责参与持续交付和自动化建设,制定持续集成和持续交付的流程和工具; 3. 负责事故响应和故障排查,快速定位并解决生产环境中的问题,分析事故原因,制定预防措施,持续改进系统可靠性。 岗位要求: 1.熟悉至少一种主流编程语言,如Python、Go、Java等,熟练进行代码编写、调试和优化; 2.熟悉常见的系统架构模式及常见云计算平台, 如微服务架构、分布式系统等,具备部署架构设计和优化经验及在云环境下构建和优化系统的经验; 3.熟悉SLI/SLO/SLA指标管理,对系统可用性、容错性等进行持续监控和优化,同时具备成本优化意识, 能够通过资源分析、负载预测等手段,优化系统运行成本。
-
职位职责: 1、负责大模型相关产品的全链路交付管理,深度参与项目可行性评估,实施方案制定(容量规划、技术选型等),保障产品高效、稳定上线; 2、负责保障客户环境的稳定运行,建立故障预防与应急响应机制,快速定位并解决各类故障与告警; 3、负责对客赋能,为客户定制专业化、场景化的使用及运维培训方案,培养客户技术团队自主运维能力; 4、协同项目经理整合内外部资源,化解项目执行中的技术难题,确保项目按时高质量交付; 5、建立客户问题反馈闭环管理机制,深度分析客户反馈数据,挖掘客户潜在需求,驱动产品功能迭代与用户体验持续优化。 职位要求: 1、计算机相关专业本科以上学历,5年以上云原生运维经验,2年以上大模型部署调优经验; 2、熟悉Docker、Kubernetes等容器技术,了解主流云平台(阿里云/AWS等)的使用,并具备丰富的实操和运维经验; 3、深入理解Linux/Unix系统、网络原理及硬件架构,具备扎实的理论基础与丰富的实践经验,拥有出色的故障排查能力,能够快速定位并解决复杂技术问题; 4、熟悉Golang/Python中至少一种开发语言,有Ansible/Saltstack/Puppet等自动化部署和编排工具开发经验; 5、具备较强的沟通和团队协作能力,能够与技术、产品、销售等不同部门人员进行有效沟通与合作,共同推动项目进展; 6、具有大模型项目落地经验者优先,熟悉大模型训练、推理等业务流程及技术要点;具有交付运维团队管理经验者优先,能够合理分配任务、协调资源,保障团队高效运作。
-
岗位职责: 1. 协助系统运维部经理负责数据中心系统运维部的管理工作,制定部门运维战略、管理制度及流程,确保部门工作高效、合规开展。 2. 统筹银行虚拟化环境、阿里云平台、主流存储设备的运维管理,保障底层基础设施稳定运行,支撑上层业务系统正常运转。 3. 主导数据中心系统架构规划与优化,结合业务发展需求,提出合理的架构升级、扩容及技术迭代方案,提升系统整体性能与可靠性。 4. 推动运维工作自动化与智能化转型,引入自动化运维工具、智能化监控与预警平台,减少人工操作,提升运维效率与故障响应速度。 5. 负责团队建设与管理,包括人员招聘、技能培训、绩效考核与职业发展规划,打造专业、高效的系统运维团队。 6. 牵头处理系统运维过程中的重大故障与突发事件,组织技术攻关,制定应急预案并定期演练,降低业务中断风险。 7. 与业务部门、开发部门、云服务商等保持密切沟通,协同推进系统资源调配、技术对接与问题解决,保障业务需求顺利落地。 任职要求: 1. 具备良好的身体素质与抗压能力,能适应数据中心7×24小时运维保障的工作节奏。 2. **本科及以上学历,计算机科学与技术、软件工程、信息工程等相关专业优先。 3. 拥有5年以上银行系统运维相关工作经验,其中至少2年以上团队管理经验,有大型银行数据中心运维管理经验者优先。 4. 核心技能: ◦ 精通银行虚拟化技术(如VMware、KVM)的部署、运维与优化,熟悉虚拟化资源调度与容灾方案。 ◦ 深入了解阿里云平台架构(如ECS、RDS、OSS、VPC等),具备阿里云环境运维、资源管理及故障排查经验。 ◦ 熟悉主流存储设备(如IBM、EMC、华为等品牌)的原理、配置与运维,掌握存储容灾、数据备份与恢复技术。 ◦ 具备数据中心系统架构规划能力,能结合业务需求设计合理的基础设施架构方案,有架构升级或迁移项目经验者优先。 ◦ 熟悉自动化运维工具(如Ansible、Jenkins、Puppet)与智能化监控平台(如Prometheus、Grafana、Zabbix),有相关平台搭建与实践经验者优先。 5. 具备较强的问题分析与解决能力,能快速定位并处理复杂系统故障;拥有出色的沟通协调与团队管理能力,能有效统筹团队工作并推动跨部门协作;具备较强的责任心与创新意识,对运维技术发展趋势有敏锐的洞察力。
-
工作职责 1、自动化运营脚本或工具平台开发,提升运维工作效率; 2、梳理设计实施基础架构/应用监控,建立完备的监控体系; 3、异常分析处理,快速恢复应用系统故障,确保业务正常进行; 4、7*24h应急响应,紧急情况下执行应急预案快速恢复异常; 5. 响应和处理中间件&计算领域的日常事件,并做好事件的分析和总结,作为事件智能化的知识输入。 任职要求 1、本科及以上学历,计算机相关专业,3年及以上开发或运维工作经验; 2、有kafka/elasticsearch/rocketmq/tomcat/nginx/weblogic等软件运维经验者优先; 3、精通linux/Unix的基本操作和维护以及性能调优,熟悉常见网络配置等操作,熟悉TCP/IP协议的原理; 4、掌握shell,python等开发语言,有运维平台开发经验者优先; 5、了解docker相关技术,有基于kubernetes容器云平台开发或运维经验者优先; 6、有大规模云底座运维、应用集群运维经验者优先; 7、可以接受7*24三班值班。
-
岗位职责: 1. 负责业务系统基础环境的建设、维护和管理,推动线上服务稳定性建设,提升服务的可靠性、可扩展性,保障系统SLA; 2. 负责持续优化运维解决方案,包括但不限于智能调度、弹性扩容、精细化监控、容灾预案等; 3. 建立和完善规范化的运维体系,保障生产系统可靠,安全,稳定地运行; 4. 不断研发与探索运维自动化及智能化途径,提升运维效率,降低运维成本; 工作要求: 1. 本科及以上学历,计算机软件及相关专业,3年以上工作经验; 2. 熟悉Linux操作系统、计算机网络等,基础知识扎实; 3. 熟悉Docker、K8S容器平台的使用及原理,能定位异常; 4. 熟悉并掌握各种中间件及基础组件的部署和使用,比如etcd/dns/elasticsearch/prometheus/grafana/nginx等; 5. 熟悉和使用过业界云平台:腾讯云、阿里云等优先;熟悉大模型基础架构运维优先 6. 熟悉并擅长Pyhon、shell、go等脚本语言的任意一种,并能使用脚本来完成日常系统运维工作; 7. 具有良好的线上安全意识,有责任感,工作积极进取,乐于持续学习,抗压性强,有良好的服务意识和团队精神;
-
岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
-
工作职责: 1.负责数字底座现场部署支持 2.运维方案的制定、设计和实施以及现场问题解决、自动化运维能力的持续提升 任职资格: 1.计算机、软件、数学、自动化、信息技术等相关专业,硕士及以上学历; 2.熟悉K8S,具备K8S集群的部署、扩缩容、监控报警及故障排查经验,熟悉基于K8S的服务部署最佳实践; 3.熟悉Cilium、OpenEBS等云原生网络和存储插件,了解其工作原理,能够构建监控报警能力并快速处理故障; 4.熟悉KubeSphere K8S集群管理套件,能够熟练使用其功能管理和运维K8S集群; 5.熟悉MySQL、Redis、Kafka、Doris、IoTDB、HDFS、HBase、MinIO等存储组件的运维,包括部署、扩缩容、监控、数据备份与恢复; 6.熟悉Flink、Spark等计算引擎的运维,能够基于K8S环境完成部署、扩缩容及监控报警能力构建; 7.具备网络和存储方向的基础知识,知识面广泛; 8.3年及以上云计算、运维或相关领域的工作经验; 9.积极主动,工作细心踏实,责任心强;具有较好的团队协作能力,具有较强的创新精神、组织协调和沟通能力。 10.具备撰写中英技术文档的能力,有良好的英语读写水平,英语通过国家四级;
-
■岗位职责 负责各个业务系统的综合运维维护,实时监控报警、数据备份、日志分析、故障排除、性能调优等工作,保障系统稳定运行与数据安全; 配合开发新项目的环境搭建,与相关部门针对具体的技术点进行沟通、提出架构优化方面的意见和建议并推动实施; 负责突发事件处理,问题跟踪与解决; 负责公司网络、服务器、VMware虚拟化、CND等各种云资源的使用维护; 负责协助安全工程师完成漏洞修复、软件升级等基础网信安全、数据安全相关工作。 ■岗位条件 (1)学历:***普通高招大学本科及以上学历。 (2)年龄:原则上本科生不超过28周岁,硕士研究生不超过30岁,博士研究生不超过32岁,特别优秀者可适当放宽。 (3)专业:计算机科学与技术、软件工程、网络工程、信息与计算科学、信息安全、电子与计算机工程、信息与通信工程、网络空间安全、数据科学与大数据技术、人工智能等相关专业。 (4)基础能力: 掌握Linux安装、配置、日常管理、安全、备份、恢复、故障处理、日志分析以及性能优化; 熟练配置nginx、tomcat、redis、elk、rocketmq、zk、prometheus等软件,熟练集群部署,能够根据实际情况做性能调优; 熟悉Linux/CentOS操作系统;熟悉系统、软件漏洞修复; 熟悉git+jenkins+ansible持续集成; 熟悉Mysql、Mongodb数据库使用,集群部署,备份与恢复和性能调优; 熟悉Prometheus、grafana、zabbix等与监控相关的工具; 熟悉VMware虚拟化,docker容器和k8s编排工具; 熟悉公有云、政务云网络架构;熟悉防火墙、交换机等网络设备的简单配置。 (5)放宽及优先条件: 具有符合本岗位特殊才能的,学历和年龄可适当放宽; 具有算法开发相关经验者优先; 具有计算机高级职称者优先; 其他符合放宽或优先条件的。
-
职位说明: 1、 负责搭建和维护业务系统的运行环境,包括服务器架设、应用软件安装、配置以及优化; 2、 负责业务系统的管理与维护,包括性能监控、性能调优和故障诊断等; 3、 负责相关业务线的发布和数据同步的工作; 4、 日常运维文档的撰写整理工作; 5、 及时响应并协助解决公司应用相关的IT风险事件。 任职资格: 1、深入理解linux系统、Windows系统; 2、熟悉服务器硬件故障的简单处理; 3、熟悉交换机、路由器、软硬件防火墙和TCP/IP原理等网络设备及技术应用; 4、精通一门以上脚本语言(shell/go/python等),有java/c++开发经验更佳; 5、精通lvs、nginx、haproxy等组件运维体系; 6、精通持续集成,持续发布的管理流程和工具,熟悉jenkins; 7、掌握主流开源监控软件的配置使用,如:Zabbix、Open-Falcon等。
-
职责描述: 1、负责公有云运维工作,故障处理,日常巡检 2、负责公有云环境搭建及监控,包括处理服务请求异常问题定位及修复等运维操作。 3、对公有云环境进行风险识别和评估,提出改进建议并修复。 4、对公有云环境运维建立运维标准和流程。 5、负责企业应用部署、发布系统、CMDB等相关项目维护。 任职要求: 1、本科及以上学历,计算机及相关专业,有3年以上运维经验。 2、熟悉公有云,具有1~2年以上腾讯云或阿里云运维经验。 3、熟悉防火墙、VPN、DNS、HTTPS、TCP/IP等网络技术, 熟练使用高可用/负载均衡技术。 4、具有一定的K8S运维经验,也具备一定的云上虚拟机或者中间件资源运维经验。 5、具有mysql、redis、rabbitmq、elasticsearch、prometheus等常规业务组件丰富的运维经验。 6、有python/shell脚本编程经验,有devops自动化脚本编写开发经验优先。 7、了解基础网络知识和网络设备工作原理。 8、对于网络安全,运维安全,数据安全有一定的认知和处理经验 8、具备良好的团队合作、沟通表达能力,心态沉稳可靠。
-
岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,3年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
-
职位职责: 1、参与字节跳动百万级主机运维体系的设计和研发,建设全网主机基础服务变更体系,提升运维管理效率并保证变更安全性; 2、参与主机运维平台、监控平台、安全平台等系统的设计和研发,构建业界领先的运维平台,保障全球数百万主机稳定运行; 3、参与DNS、NTP、DHCP、装机、镜像站等数据中心基础服务的研发和运维,提升服务性能,保障服务稳定性。 职位要求: 1、具备5年以上运维领域工作经验,如稳定性体系建设、运维平台研发等; 2、大学本科及以上学历,计算机软件基础知识扎实,熟悉主流Linux操作系统、存储、网络等技术; 3、熟悉Golang/Python/Shell等一门或多门编程语言,并掌握常见后端Web框架及其设计原理; 4、具有产品和工程思维,以及良好的沟通协作能力,推动跨部门项目的开展; 5、具有较强的学习能力和判断力,积极探索LLM等新技术的应用和落地。
-
IT桌面运维工程师-TME全资子公司腾音
[深圳·西丽] 10:44发布7k-9k·14薪 经验1-3年 / 本科工具类产品,内容社区,音频|视频媒体 / 上市公司 / 2000人以上岗位职责: 1. 为用户提供多渠道(企业微信、现场、自助报障等)的IT桌面服务,包括:Windows/苹果笔记本、Windows台式机、显示器故障诊断与排查、操作系统(Windows/macOS)、常用办公软件的安装、问题故障排除,确保KPI要求; 2. 提供办公室设备的日常服务,包括:打印机、投影仪、无线投屏设备、调音台、门禁; 3. 根据IT设备生命周期制作采购/处置计划,并完成采购入库和实物处置; 4. 管理IT办公设备,严格按照资产管理流程的操作要求,做好IT办公设备的发放与回收,协助配合IT资产管理员的工作,做到帐实匹配; 5. 根据业务的需求,配合完成会议/直播/现场活动的支持; 6. 参与面向用户的标准化服务事项值班,服务事项包括桌面服务和应用运营服务,如:权限配置、消息推送、流程维护、主数据维护等; 7. 维护IT知识库文档,提高用户自助和AI问答能力; 8. 作为项目资源,参与团队内部项目工作,主动完成团队内部分配的其他工作事项; 岗位要求: 1. 优秀的用户服务能力和沟通技术,强烈的责任意识和结果导向; 2. 两年以上相关工作经验,有大型企业内部桌面服务支持经历者优先; 3. 结果导向意识和团结协作精神,能在高压环境下工作; 4. 有一定的问题分析和解决能力; 5. 有一定的Excel数据加工处理能力和PPT制作能力。 岗位签约主体为深圳市腾音管理咨询有限公司(腾讯音乐娱乐集团全资子公司) -
岗位职责 1. 负责超大规模服务器集群的交付保障、运行维护及资源退役,保障硬件资源稳定、高效运行; 2. 负责跟踪和处理服务器各类硬件故障,持续优化问题发现-定位-处置闭环机制,提升故障处理效率; 3. 负责AI大模型训练/推理集群相关服务器的运维支持,保障模型稳定性; 4. 负责协同网络、存储、数据中心等团队进行系统级故障协同定位及优化改进; 5. 负责推动新硬件上线适配及运维策略制定,确保平滑演进; 6. 负责运维可视化、自动化能力及故障预测预防能力建设。 任职要求 1. 本科及以上学历,计算机或相关专业; 2. 3年以上服务器硬件运维经验,有IDC实地运维或大规模集群支持经验者优先; 4. 熟悉主流服务器硬件架构,具备GPU服务器运维经验优先; 5. 具备处理AI大模型训练中常见硬件故障的能力; 6. 了解Linux操作系统基本命令,掌握常用日志分析与硬件健康检测工具; 7. 具备良好的开发能力,熟悉至少一种脚本语言(如 Python / Go / Shell),可独立开发或维护日常运维自动化工具; 8. 具备良好的沟通协作能力和问题分析能力,责任心强
-
岗位职责: 1、负责构建和维护 AWS 云平台的基础设施,并确保其高可用性和灵活性; 2、负责DevOps体系规划与实施,持续交付CI/CD流程设计、研发和实施, 实现自动化和平台化; 3、研究和评估新的技术,提高系统的性能以及可靠性。 岗位要求: 1、本科以上学历,计算机或相关专业毕业,具有良好的技术功底,3年及以上工作经验; 2、具有AWS等云平台运维经验; 3、熟练Docker容器技术,k8s技术,2年以上Kubernetes部署、优化、运维经验; 4、精通CI/CD持续集成与持续交付;熟悉Gitlab、Jenkins、Argocd、Prometheus、Loki、Grafana等工具; 5、具有较强Troubleshooting能力,能够快速定位解决问题; 6、精通至少一门语言 Python,Go等,了解Web 前后端开发和常见框架,如 Django,Vue 等; 7、在运维自动化方面具备一定的开发经验和产品思维; 8、良好的沟通能力和团队协作能力。


