-
职位职责: 1、负责大模型相关产品的全链路交付管理,深度参与项目可行性评估,实施方案制定(容量规划、技术选型等),保障产品高效、稳定上线; 2、负责保障客户环境的稳定运行,建立故障预防与应急响应机制,快速定位并解决各类故障与告警; 3、负责对客赋能,为客户定制专业化、场景化的使用及运维培训方案,培养客户技术团队自主运维能力; 4、协同项目经理整合内外部资源,化解项目执行中的技术难题,确保项目按时高质量交付; 5、建立客户问题反馈闭环管理机制,深度分析客户反馈数据,挖掘客户潜在需求,驱动产品功能迭代与用户体验持续优化。 职位要求: 1、计算机相关专业本科以上学历,5年以上云原生运维经验,2年以上大模型部署调优经验; 2、熟悉Docker、Kubernetes等容器技术,了解主流云平台(阿里云/AWS等)的使用,并具备丰富的实操和运维经验; 3、深入理解Linux/Unix系统、网络原理及硬件架构,具备扎实的理论基础与丰富的实践经验,拥有出色的故障排查能力,能够快速定位并解决复杂技术问题; 4、熟悉Golang/Python中至少一种开发语言,有Ansible/Saltstack/Puppet等自动化部署和编排工具开发经验; 5、具备较强的沟通和团队协作能力,能够与技术、产品、销售等不同部门人员进行有效沟通与合作,共同推动项目进展; 6、具有大模型项目落地经验者优先,熟悉大模型训练、推理等业务流程及技术要点;具有交付运维团队管理经验者优先,能够合理分配任务、协调资源,保障团队高效运作。
-
岗位职责: 1. 协助系统运维部经理负责数据中心系统运维部的管理工作,制定部门运维战略、管理制度及流程,确保部门工作高效、合规开展。 2. 统筹银行虚拟化环境、阿里云平台、主流存储设备的运维管理,保障底层基础设施稳定运行,支撑上层业务系统正常运转。 3. 主导数据中心系统架构规划与优化,结合业务发展需求,提出合理的架构升级、扩容及技术迭代方案,提升系统整体性能与可靠性。 4. 推动运维工作自动化与智能化转型,引入自动化运维工具、智能化监控与预警平台,减少人工操作,提升运维效率与故障响应速度。 5. 负责团队建设与管理,包括人员招聘、技能培训、绩效考核与职业发展规划,打造专业、高效的系统运维团队。 6. 牵头处理系统运维过程中的重大故障与突发事件,组织技术攻关,制定应急预案并定期演练,降低业务中断风险。 7. 与业务部门、开发部门、云服务商等保持密切沟通,协同推进系统资源调配、技术对接与问题解决,保障业务需求顺利落地。 任职要求: 1. 具备良好的身体素质与抗压能力,能适应数据中心7×24小时运维保障的工作节奏。 2. **本科及以上学历,计算机科学与技术、软件工程、信息工程等相关专业优先。 3. 拥有5年以上银行系统运维相关工作经验,其中至少2年以上团队管理经验,有大型银行数据中心运维管理经验者优先。 4. 核心技能: ◦ 精通银行虚拟化技术(如VMware、KVM)的部署、运维与优化,熟悉虚拟化资源调度与容灾方案。 ◦ 深入了解阿里云平台架构(如ECS、RDS、OSS、VPC等),具备阿里云环境运维、资源管理及故障排查经验。 ◦ 熟悉主流存储设备(如IBM、EMC、华为等品牌)的原理、配置与运维,掌握存储容灾、数据备份与恢复技术。 ◦ 具备数据中心系统架构规划能力,能结合业务需求设计合理的基础设施架构方案,有架构升级或迁移项目经验者优先。 ◦ 熟悉自动化运维工具(如Ansible、Jenkins、Puppet)与智能化监控平台(如Prometheus、Grafana、Zabbix),有相关平台搭建与实践经验者优先。 5. 具备较强的问题分析与解决能力,能快速定位并处理复杂系统故障;拥有出色的沟通协调与团队管理能力,能有效统筹团队工作并推动跨部门协作;具备较强的责任心与创新意识,对运维技术发展趋势有敏锐的洞察力。
-
岗位职责 1、架构设计与实施:设计和实施可扩展的DevOps架构,支持持续集成、持续交付和自动化部署,以提高产品的交付速度和质量。 2、自动化工具与流程:评估、选择并实施适当的自动化工具和流程,包括配置管理、容器化、监控、日志收集等,以提高开发、测试和部署效率。 3、持续集成与交付:建立和维护持续集成和持续交付流水线,确保代码变更的快速、可靠地发布到生产环境。 4、云基础设施管理:使用云平台(如AWS、Azure、Google Cloud)管理和优化基础设施,包括虚拟机、容器、中间件、存储、网络等,以实现可扩展性和高可用性。 5、监控与故障排除:建立有效的监控系统,监测应用程序和基础设施的性能,并进行故障排除和问题解决。 6、安全和合规性:确保系统和数据的安全性,实施适当的访问控制、漏洞管理和合规性措施。 7、团队培训与支持:提供团队成员的培训和技术支持,分享最佳实践,并提供关于DevOps领域的专业指导和建议。 岗位要求: 1、具备丰富的DevOps工作经验,熟悉软件开发生命周期和敏捷开发方法。 2、熟悉各种DevOps工具和技术,如配置管理工具(例如Ansible、Chef、Puppet)、容器化平台(例如Docker、Kubernetes)、持续集成和交付工具(例如Jenkins、GitLab CI/CD)等。 3、熟悉操作系统、网络和云基础设施,具备良好的Linux环境和云平台(如AWS、Azure、Google Cloud)使用和管理能力。 4、具备编程和脚本语言的知识,如Python、Bash等,能够编写自动化脚本和工具。 5、良好的沟通和团队合作能力,能够与不同部门的团队成员合作,解决问题并推动项目进展。 6、解决问题和故障排除能力强,能够快速识别和解决系统或应用程序的性能问题。 7、具备学习能力和持续改进的意识,关注新技术和行业趋势,并能够将其应用到实际工作中。
-
*参与客户环境的运维,包括但不限于健康检查,问题优化,系统升级等 *接收需求分析,制定变更方案,及时实施变更 *参与7*24 生产运行的应急响应和处置 *轮流参与7*24小时现场值班、节假日值班K 重要保障期间值班等 招聘要求: *本科及以上学历: *和计算机、通讯、自动化相关的理工科专业; *4年以上的工作经验: *具有良好的操作系统基础,熟悉linux系统,能够熟练的使用Linux中常见得分析工具,如:top,iostat, tcpdump等; *熟悉Puppet/Ansible等自动化运维工具 *良好的沟通能力和团队合作能力; *良好的学习能力,优秀的文档编写能力; 加分项: *拥有3年以上运维OpenStack环境的工作经验; *参与过1个或1个以上大型金融公司的一线运维工作; *拥有Ceph相关运维经验者
-
岗位职责: 1) 负责云基础设施平台的规划、建设和运维管理,保障云平台的稳定高效运行。 2) 负责云标准服务能力的构建,承担云管理平台的开发与迭代,提升平台的易用性和扩展性。 3) 参与云平台的可观测体系和智能运维体系建设,提升运维效率与平台稳定性。 4) 参与云服务的运营支撑工作,包括但不限于资源容量规划、用户体验改进、安全合规管理等,助力云服务的落地与推广。 岗位要求: 1) 大学本科及以上学历,计算机相关专业; 2) 三年以上云计算领域相关工作经验,有云管理平台开发或云服务运维运营经验者优先; 3) 良好的计算机体系结构知识,熟悉操作系统、数据库、中间件技术,具备操作系统故障处理和运维开发能力; 4) 深入理解云计算基础架构和云原生架构,熟悉至少一个主流的云平台,精通 Kubernetes 架构、原理,有 PaaS 平台建设和运维经验者优先; 5) 具备较强的编程开发能力,熟练使用 Python、Shell 等脚本语言,掌握 Go 语言者优先,能独立完成工具和平台模块的开发工作; 6) 熟练使用自动化运维工具(如 Ansible、Puppet、Chef、Terraform 等),并能根据实际需求进行二次开发和定制; 7) 具备云服务业务理解与策略规划能力,数据驱动的服务优化能力; 8) 具备良好的逻辑思维能力、沟通能力、协调能力、解决问题能力。
-
岗位职责: 1、通过现状评估调研,研发流程设计、最佳实践宣导、实施方案制定等协助客户完成DevOps平台落地; 2、协调内部研发团队资源,共同应对客户的需求、解决客户提出的问题; 3、配合项目经理,根据客户的业务场景需求进行沟通与引导,保障项目交付效率; 4、赋能项目团队的交付工程师,持续提升交付团队的整体技术能力; 5、总结过程经验,形成DevOps行业解决方案; 6、提供专家指导,负责辅导客户完成DevOps成熟度过级需求; 任职资格: 1. 至少5年及以上开发、测试、运维或咨询等领域的实际工作经验; 2. 对DevOps/持续交付/敏捷/ITSM概念及其实践有一定理解和实战经验; 3. 熟悉DevOps相关工程实践与工具技术,熟悉软件开发流程,有应用发布配置管理方面的工作经验者优先考虑; 4. 具备2个及以上中大型相关DevOps平台建设或咨询项目经验,具备独立完成咨询规划报告能力; 5. 具备良好的沟通协调能力、矛盾解决能力和团队合作意识,具备学习和自我管理能力; 6. 拥有DOM、DEC等相关认证者优先考虑。 7.有强烈的自我驱动力,能够承担压力,适应快速变化的工作环境。 额外加分项: 1. 有微服务、大数据、人工智能等相关领域经验。 2. 有项目管理经验者优先。 3. 熟悉CI/CD pipeline中使用的各种工具和库(如Docker, Ansible, Puppet等)。
-
岗位职责: 1.完成数据中心基础设施建设,保证数据中心和基础设施的稳定性,高效以及可伸缩性。 2.参与实现平台服务的持续集成和持续部署,完成平台服务的部署上线,监控,根据项目业务需求,保证产品部署的稳定性和可伸缩性。 3.对基础设施,网络,产品服务运行情况7*24小时监控,保证基础设施,网络和业务的连续性和性能。 4.有一定工程产品开发经验,参与工程部分功能模块代码的编写。 岗位要求: 1.计算机相关专业本科及以上学历,4年以上公司开发运维经验,对运维有深刻理解。 2.对以AWS、Azure为基础的数据中心建设或SAAS服务部署运维有实际经验。 3.有持续集成和持续部署经验,能够独立完成持续集成和持续部署设计和实施,熟悉Jenkins等工。 4.熟练运用运维相关常用工具,能够通过脚本或代码(如Python/Shell/Java)实现对运维工作的自动化控制,如chef, puppet, ansible等。 5.熟悉性能监控软件的维护和使用,熟悉K8S容器编排的基本组件,包括不限于Prometheus,Grafana,efk,jenkins,helm等。 6.熟练进行日志管理运营、维护、监控。 7.熟练具备nodejs、Python、Golang等其中一种或多种语言工程开发经验。 8.具备良好的协作能力与沟通能力。 9.书面工作语言:英语为主 成都重庆周边都可
-
工作描述: 1. 负责设计、落地各类业务的运维保障体系,包含但不局限于:线上问题管理、全维度全链路的监控管理、线上生产变更管理、故障容灾演练管理、大促重大活动管理以及稳定性文化建设等; 2. 负责云机房、微服务管理、单元部署、自动扩容等运维系统建设,负责软硬件基础建设和效能提升相关工作; 3. 主导并推进标准运维保障解决方案落地到产品工具中,通过产品工具降低成本,提升服务效率,实现高效自动化且可扩展的技术服务运行模式; 4. 深入生态伙伴保障体系的建设,包括应急响应、应急调度、协同处理和整体业务的保障,并持续优化该体系的质量、效率、成本,提升整体服务品质; 任职要求: 1. 有强烈的技术热情,工作责任感; 计算机软件或相关专业,大专或以上学历; 2. 熟悉golang/C/Java/Python/Shell中的任意一种以上; 3. 熟悉常见的配置管理和运维工具,如:Ansible、Puppet、SaltStack等; 4. 熟悉nginx、lvs、envoy、service mesh等技术,对ngx_lua有实践者优先; 5. 掌握Linux操作系统的配置,管理及优化,对网络、存储等基础设施领域有一定的了解和知识储备,能够独立排查及解决系统层的各类问题,熟悉公有云基础设施(AWS, 阿里云, Azure)更佳; 6. 有 Docker、k8s 及资源调度经验者优先; 7. 热爱技术,自我驱动,主动思考,不断钻研和探索新领域,有较好的技术敏感度、风险识别能力和全局意识; 8. 高度的责任心,良好的沟通能力和团队协作精神,有较强的跨团队协调能力且抗压能力强; 9. 有很强的分析复杂问题和解决复杂问题的能力,有强烈的责任心和使命感; 10. 对运维保障有丰富的实战经验,如复杂业务场景下的流程优化和过程改进、组织的稳定性意识提升等; 11. 有从0到1运维保障体系的建设和运营经验(流程化、规范化、标准化、工具化、产品化、持续改进); 12. 流利的英语能力
-
岗位描述: 1、挖掘日常工作中的痛点,根据实际情况推进运维自动化,通过工具和系统提升运维效率; 2.负责云的日常维护,包括K8S、ECS、中间件等; 3.负责容器镜像仓库、CICD系统、Kubernetes 相关前沿技术规划和落地工作; 4.处理线上发生的紧急故障 任职条件: 1.计算机相关专业本科学历,5年+相关工作经验; 2.熟悉Linux操作系统和Shell脚本,熟悉Saltstack、Puppet、Ansible任一软件; 3.熟悉Linux下常用开源软件的安装、配置、管理及基本故障排查,如Nginx、PHP、MySQL等; 4.有docker和k8s系统的维护和使用经验(必须); 5.熟悉常用的中间件(Kafka、MQ、ELK等); 6.熟悉Prometheus/Graphite/Zabbix等任一常见监控系统; 7.熟悉任一CI/CD工具; 8.具备基础的的开发能力(Python、php等任一门语言)优先;
-
岗位职责: 1.参与自动化运维平台产品功能落地,提高运维、开发协作效率,规范操作流程; 2.参与需求调研、需求落地设计、配置研发、部署等相关工作; 3.参与研发基础服务组件,解决共性需求,减少重复开发与运维; 4.参与部分生产系统维护工作,解决生产系统问题及进行系统调优; 5.新技术研究和应用,并推动适合的技术应用于生产; 6.对现有系统提出优化建议,并组织实施; 7.配合研发部门人员进行深度测试工作,协助构建测试场景与排查问题原因; 8.基于平台化产品的配置研发成果物管理工作,以及平台产品自动化管理脚本编写; 9.二线技术支持; 任职要求: 1.熟练掌握linux操作系统,具备较强的环境搭建能力; 2.熟悉数据库基本sql语法,增删改查sql编写能力 3.熟悉自动化运维工具如 ansible、puppet、saltstack 等; 4.掌握常用的运维开发语言 /Python/JS/Shell/Java 等语言,有相关语言的开发框架的使用经验有开发经验优先; 5.熟悉svn、github、jira等软件/项目版本管理工具,具有较强的版本管理能力与意识; 6.熟悉 redis、rabbitmq、kafka、消息队列等基础技术; 7.有较强的学习能力,能够熟练阅读涉及产品和技术的英文文档; 8.能够承受较高的工作压力;有强烈的工作责任心;有较好的沟通能力;有良好的团队合作精神; 9.能够独立完成工作,具有较强的综合分析问题及解决问题的能力; 10.有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档; 11.**本科及以上学历,计算机相关专业者优先; 12.三年以上运维开发项目经验
-
运维开发工程师岗位JD如下: 一、岗位职责: 1. 负责公司服务器及应用系统的部署、监控、维护和优化,确保系统稳定可靠运行; 2. 负责公司数据中心基础设施的规划、建设、维护和管理,确保数据中心的正常运行; 3. 负责运维自动化工具的开发和维护,提高运维效率; 4. 参与公司项目的技术支持,提供技术方案和优化建议,确保项目顺利实施; 5. 负责运维团队的技术培训和知识分享,提高团队技术水平; 6. 参与制定运维策略和标准,确保运维工作的规范化和标准化; 7. 跟踪业界新技术和行业动态,为公司运维工作提供有益借鉴和改进建议。 二、任职要求: 1. 本科及以上学历,理工科类专业; 2. 熟悉Linux操作系统,熟悉常用服务器软件的安装、配置和管理; 3. 熟悉网络基础知识,具备网络设备配置和管理能力; 4. 熟悉数据库的安装、配置和管理,熟悉SQL语言,具备一定的数据库优化能力; 5. 熟悉常见的自动化运维工具,如Ansible、Puppet等; 6. 熟悉脚本语言,如Shell、Python等,能编写自动化脚本; 7. 熟悉容器技术,如Docker、Kubernetes等; 8. 具备良好的沟通和团队协作能力,能承受工作压力; 9. 具有强烈的责任心和敬业精神,工作积极主动,善于学习新知识。
-
岗位职责: 1、负责公司服务器的运维管理,进行系统性能分析和故障排查; 2、负责私有云和公有云主机系统的交付和生命周期管理; 3、负责OS基础服务和工具的管理,例如NTP/SMTP/IPTABLE/Ansible/Saltstack。 4、基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析。 5、数据中心服务部署、权限管控,资源管控等工作。 6、完成线上物理机的硬件监控,部署各厂家硬件监控平台,有DELL服务器运维经验优先。 7、系统内核升级,调整系统参数解决,硬件固件升级,解决系统异常问题。 8、数据中心机房健康管理,定期检查机柜用电巡检、机房温湿度巡检。 任职要求: 1、计算机相关专业,5年以上工作经验; 2、精通Linux/UNIX操作系统运维, 熟悉Linux平台上各类常见服务(如DNS、LDAP、NTP、SSHD等)的配置; 3、具备5000以上主机规模的运维管理经验,有较强服务器硬件的故障定位和排查能力; 4、熟悉配置管理软件ansible、puppet、saltstack其中之一; 5、有较好的脚本开发能力,有python、php、java等开发经验者优先; 6、有大规模容器化生产环境运维经验者优先; 7、熟悉zabbix、openfalcon、grafana其中之一; 8、具有监控系统、流程工具、自动化运维工具与平台相关开发经验者优先; 9、积极主动,责任心强,有团队精神,有良好的沟通能力和学习能力者优先。
-
岗位职责: 1、负责公司服务器的运维管理,进行系统性能分析和故障排查 2、负责私有云和公有云主机系统的交付和生命周期管理 3、负责OS基础服务和工具的管理,例如NTP/SMTP/IPTABLE/Ansible/Saltstack 4、基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析 5、数据中心服务部署、权限管控,资源管控等工作 6、完成线上物理机的硬件监控,部署各厂家硬件监控平台,有DELL服务器运维经验优先 7、系统内核升级,调整系统参数解决,硬件固件升级,解决系统异常问题 8、数据中心机房健康管理,定期检查机柜用电巡检、机房温湿度巡检 任职要求: 1、***本科及以上学历,计算机相关专业,5年以上工作经验 2、精通Linux/UNIX操作系统运维, 熟悉Linux平台上各类常见服务(如DNS、LDAP、NTP、SSHD等)的配置 3、具备5000以上主机规模的运维管理经验,有较强服务器硬件的故障定位和排查能力 4、熟悉配置管理软件ansible、puppet、saltstack其中之一 5、有较好的脚本开发能力,有python、php、java等开发经验者优先; 6、有大规模容器化生产环境运维经验者优先 7、熟悉zabbix、openfalcon、grafana其中之一 8、具有监控系统、流程工具、自动化运维工具与平台相关开发经验者优先 9、积极主动,责任心强,有团队精神,有良好的沟通能力和学习能力者优先
-
岗位职责: 1. 负责平台服务的搭建、部署、监控、调优、升级、日常维护和管理工作; 2. 负责处理系统方面日常变更、控制突发情况,对疑难问题进行分析并解决; 3. 支持服务器系统部署、应用调整,提高操作效率,增强系统可用性; 4. 保障服务器与数据库的稳定运行,检查并消除系统安全隐患; 5. 负责数据备份、数据监控、应急响应、故障排除、编写数据分析报告等。 6. 能够独立搭建开源运维工具并在运维中熟练使用,负责带领团队优化提升自动化运维能力 1.本科及以上学历,计算机、通信或相关专业; 2.3年以上大型互联网工作经验,熟悉运维整体工作,对业务和技术手段有自己的理解; 3.主导设计或参与设计,运维平台整体技术架构,能够把握关键难点和核心技术; 4.掌握业界主流监控技术,如Zabbix,Prometheus,Nagios,Cacti; 5.掌握业界主流自动化技术,如Saltstack,Ansible,Puppet; 6.熟悉业界主流数据处理和日志分析技术,如ELK,Hadoop, Spark, Storm等; 7.掌握脚本编写技能,如Shell, Python等; 8.了解虚拟化和容器化技术,具有Kubernetes,docker实战经验者优先; 9.能够独立搭建开源运维工具并在运维中熟练使用; 10.熟悉网络领域相关技术,熟悉TCP/IP,广域网和局域网。
-
岗位职责: 1、负责设计、开发各种运维工具、平台,包括引入开源工具并在其上进行二次开发,一起推动标准化、自动化、智能化; 2、负责现有运维平台及运维工具的优化和完善工作,提升用户体验和可用性; 3、协助完善CICD流程,提升整个产线效率、质量(如发布成功率); 4、协助探索运维新技术和工具,对其进行研究、评估、POC,提升团队运维能力; 5、协助建设运维分析平台,量化指标,以数据为导向帮助提升团队效率、质量。 职位要求: 1、本科及以上学历,计算机及相关专业,5年以上运维开发经验; 2、习惯在Linux环境工作,熟练掌握Shell脚本编写; 3、精通Python脚本语言,掌握Django等框架更佳; 4、熟悉至少一个公有云,有过利用其API完成运维工具、平台开发的经历,深刻理解云原生; 5、熟悉容器、K8S,熟悉其上的监控告警指标; 6、能熟练使用MySQL、Redis、Kafka、Nacos等组件,并理解其底层原理(HA、持久化等); 7、熟悉Zabbix/Prometheus等监控工具,有自定义脚本开发经历; 8、使用过Saltstack/Puppet/Ansible等自动化工具,有插件开发经历更佳; 9、善于沟通,有较强的执行力、团队合作能力以及开拓创新精神。


