-
1.支撑一线运维相关故障问题处理,并完善相关经验库 2.负责云产品部署定制和实施 3.能很好的完成上级安排的其他相关工作 4.值班时能够处理线上报警问题 要求: 1.精通ansible。 2.熟悉docker。 3.熟悉shell或go 4.有kolla-ansible经验的优先
-
职责: 1、开发Ansible playbook和模块 2、管理Ansible基础架构,执行维护和配置,并提供SME级支持 3、提供建议和建议,以改进平台环境的标准和政策(如命名约定等) 4、围绕自动化解决方案的使用,为IT基础架构和运营提供技术支持 5、为IT基础架构DevOps团队提供助理,以开发、配置和管理整体DevOps和iAutomation解决方案要求: 要求: 1、计算机科学、信息系统或相关学科学位 2、2年以上Ansible playbook创作经验 3、有丰富的Ansible playbook开发和Ansible Tower部署经验。 4、Python中的中级脚本 5、有PL/SQL方面的经验,最好使用PowerShell。 6、使用Splunk的日志挖掘和分析 7、精通SUSE Linux、Windows server 8、熟悉Jenkin、Git、Artifictory、IBM城市代码部署和发布 9、了解容器管理和编排工具 10、熟悉频繁的增量代码、测试和部署 11、较强的问题解决、分析和故障排除能力 12、熟练掌握Ansible playbook开发和存储库 13、Ansible自动化基础设施知识 14、管理、应用程序部署、CI/CD、服务编排 15、自我激励,独立工作 16、良好的中英文听说读写能力 17、有IT基础设施技术知识 18、能够在压力下工作,管理多项优先事项,按时完成任务
-
职位职责: 1、负责大模型相关产品的全链路交付管理,深度参与项目可行性评估,实施方案制定(容量规划、技术选型等),保障产品高效、稳定上线; 2、负责保障客户环境的稳定运行,建立故障预防与应急响应机制,快速定位并解决各类故障与告警; 3、负责对客赋能,为客户定制专业化、场景化的使用及运维培训方案,培养客户技术团队自主运维能力; 4、协同项目经理整合内外部资源,化解项目执行中的技术难题,确保项目按时高质量交付; 5、建立客户问题反馈闭环管理机制,深度分析客户反馈数据,挖掘客户潜在需求,驱动产品功能迭代与用户体验持续优化。 职位要求: 1、计算机相关专业本科以上学历,5年以上云原生运维经验,2年以上大模型部署调优经验; 2、熟悉Docker、Kubernetes等容器技术,了解主流云平台(阿里云/AWS等)的使用,并具备丰富的实操和运维经验; 3、深入理解Linux/Unix系统、网络原理及硬件架构,具备扎实的理论基础与丰富的实践经验,拥有出色的故障排查能力,能够快速定位并解决复杂技术问题; 4、熟悉Golang/Python中至少一种开发语言,有Ansible/Saltstack/Puppet等自动化部署和编排工具开发经验; 5、具备较强的沟通和团队协作能力,能够与技术、产品、销售等不同部门人员进行有效沟通与合作,共同推动项目进展; 6、具有大模型项目落地经验者优先,熟悉大模型训练、推理等业务流程及技术要点;具有交付运维团队管理经验者优先,能够合理分配任务、协调资源,保障团队高效运作。
-
岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
-
职位职责: 1、参与字节跳动百万级主机运维体系的设计和研发,建设全网主机基础服务变更体系,提升运维管理效率并保证变更安全性; 2、参与主机运维平台、监控平台、安全平台等系统的设计和研发,构建业界领先的运维平台,保障全球数百万主机稳定运行; 3、参与DNS、NTP、DHCP、装机、镜像站等数据中心基础服务的研发和运维,提升服务性能,保障服务稳定性。 职位要求: 1、大学本科及以上学历,计算机相关专业,3年以上运维平台项目开发经验; 2、扎实的计算机软件基础知识,熟悉Linux操作系统、存储、网络技术; 3、精通Python/Golang等至少一门编程语言,熟悉Grafana、Ansible等常用开源软件; 4、具有产品和工程思维,良好的项目沟通、数据结构和系统设计能力; 5、有较强的学习力和自驱力,能熟练阅读涉及产品和技术的英文文档。
-
岗位职责: 1. 协助系统运维部经理负责数据中心系统运维部的管理工作,制定部门运维战略、管理制度及流程,确保部门工作高效、合规开展。 2. 统筹银行虚拟化环境、阿里云平台、主流存储设备的运维管理,保障底层基础设施稳定运行,支撑上层业务系统正常运转。 3. 主导数据中心系统架构规划与优化,结合业务发展需求,提出合理的架构升级、扩容及技术迭代方案,提升系统整体性能与可靠性。 4. 推动运维工作自动化与智能化转型,引入自动化运维工具、智能化监控与预警平台,减少人工操作,提升运维效率与故障响应速度。 5. 负责团队建设与管理,包括人员招聘、技能培训、绩效考核与职业发展规划,打造专业、高效的系统运维团队。 6. 牵头处理系统运维过程中的重大故障与突发事件,组织技术攻关,制定应急预案并定期演练,降低业务中断风险。 7. 与业务部门、开发部门、云服务商等保持密切沟通,协同推进系统资源调配、技术对接与问题解决,保障业务需求顺利落地。 任职要求: 1. 具备良好的身体素质与抗压能力,能适应数据中心7×24小时运维保障的工作节奏。 2. **本科及以上学历,计算机科学与技术、软件工程、信息工程等相关专业优先。 3. 拥有5年以上银行系统运维相关工作经验,其中至少2年以上团队管理经验,有大型银行数据中心运维管理经验者优先。 4. 核心技能: ◦ 精通银行虚拟化技术(如VMware、KVM)的部署、运维与优化,熟悉虚拟化资源调度与容灾方案。 ◦ 深入了解阿里云平台架构(如ECS、RDS、OSS、VPC等),具备阿里云环境运维、资源管理及故障排查经验。 ◦ 熟悉主流存储设备(如IBM、EMC、华为等品牌)的原理、配置与运维,掌握存储容灾、数据备份与恢复技术。 ◦ 具备数据中心系统架构规划能力,能结合业务需求设计合理的基础设施架构方案,有架构升级或迁移项目经验者优先。 ◦ 熟悉自动化运维工具(如Ansible、Jenkins、Puppet)与智能化监控平台(如Prometheus、Grafana、Zabbix),有相关平台搭建与实践经验者优先。 5. 具备较强的问题分析与解决能力,能快速定位并处理复杂系统故障;拥有出色的沟通协调与团队管理能力,能有效统筹团队工作并推动跨部门协作;具备较强的责任心与创新意识,对运维技术发展趋势有敏锐的洞察力。
-
岗位职责 1. 平台架构与模块开发:主导或参与自动化运维平台架构设计,运用 Java 及 Spring Boot、Spring Cloud 等框架构建稳固后端体系。开发服务器管理、任务编排、配置分发等核心模块,确保系统高效承载运维业务流程,满足扩展性与灵活性需求。 2. 系统集成与对接:对接各类运维工具(如 Ansible、SaltStack)与基础设施(物理机、虚拟机、容器),编写适配接口实现无缝集成;打通监控、告警系统,实时采集、同步运维数据,为自动化操作提供精准信息支持。 3. 自动化脚本与任务实现:编写 Java 程序生成自动化运维脚本,涵盖批量部署、软件升级、日常巡检;利用 Quartz 等框架定制定时任务,保障运维流程按时、精准执行,降低人工操作失误率。 4. 数据处理与存储:设计数据库架构,选用 MySQL、PostgreSQL 存储运维数据;优化数据查询、写入性能;借助 Redis 缓存关键数据,加速系统响应;对海量运维日志做清洗、分析,助力故障排查、性能调优。 5. 故障排查与性能优化:快速定位、解决平台运行时的异常与故障;剖析性能瓶颈,从代码、架构、资源利用维度优化,运用多线程、异步处理提升并发能力;监控 JVM 运行参数,防止内存溢出、卡顿。 6. 团队协作与技术提升:协同运维、前端团队,依需求迭代平台功能;参与代码评审,保障代码质量;关注新技术趋势,引入合适理念、工具优化平台;沉淀技术文档,分享经验助力团队技术进阶。 任职要求 1.本科及以上学历,计算机类、电子信息类、自动化类等相关专业优先,3年及以上相关工作经验。 2.熟悉计算机基础架构、操作系统,熟悉Linux操作系统,精通Java编程语言。 3.具备高度的责任心和上进心、良好的沟通表达能力和团队合作精神。
-
岗位职责: 1.负责生产系统环境部署,监控/日志采集维护,保障服务正常稳定运行; 2.负责突发事件管理,问题工单跟踪与管理,运维文档编写; 3.推进日常运维工作自动化,规范操作流程,提高日常运维工作效率; 4.负责CI/CD可持续集成部署研究与实践。 任职要求: 1.计算机专业毕业,1-3年IT运维支撑工作经验,善于接受新事物及学习能力强的应届毕业生也可考虑; 2.精通Linux操作系统,掌握Linux操作命令,了解nginx/apache调优; 3.熟悉一门以上脚本语言,如shell/Perl/Python,有Python开发经验者优先; 4.了解SQL语言的基本操作,具有良好文档编写和文字表达能力; 5.有自动化运维实施配置管理经验,熟悉ansible自动化工具部署及使用,或熟悉Nginx/Zabbix/Grafana模式开源监控部署及使用; 6.工作责任感强,具备良好的客户服务意识,良好的沟通能力; 7.有阿里云平台产品使用经验者,或有学习过ACP课程者优先考虑。
-
岗位职责 1、架构设计与实施:设计和实施可扩展的DevOps架构,支持持续集成、持续交付和自动化部署,以提高产品的交付速度和质量。 2、自动化工具与流程:评估、选择并实施适当的自动化工具和流程,包括配置管理、容器化、监控、日志收集等,以提高开发、测试和部署效率。 3、持续集成与交付:建立和维护持续集成和持续交付流水线,确保代码变更的快速、可靠地发布到生产环境。 4、云基础设施管理:使用云平台(如AWS、Azure、Google Cloud)管理和优化基础设施,包括虚拟机、容器、中间件、存储、网络等,以实现可扩展性和高可用性。 5、监控与故障排除:建立有效的监控系统,监测应用程序和基础设施的性能,并进行故障排除和问题解决。 6、安全和合规性:确保系统和数据的安全性,实施适当的访问控制、漏洞管理和合规性措施。 7、团队培训与支持:提供团队成员的培训和技术支持,分享最佳实践,并提供关于DevOps领域的专业指导和建议。 岗位要求: 1、具备丰富的DevOps工作经验,熟悉软件开发生命周期和敏捷开发方法。 2、熟悉各种DevOps工具和技术,如配置管理工具(例如Ansible、Chef、Puppet)、容器化平台(例如Docker、Kubernetes)、持续集成和交付工具(例如Jenkins、GitLab CI/CD)等。 3、熟悉操作系统、网络和云基础设施,具备良好的Linux环境和云平台(如AWS、Azure、Google Cloud)使用和管理能力。 4、具备编程和脚本语言的知识,如Python、Bash等,能够编写自动化脚本和工具。 5、良好的沟通和团队合作能力,能够与不同部门的团队成员合作,解决问题并推动项目进展。 6、解决问题和故障排除能力强,能够快速识别和解决系统或应用程序的性能问题。 7、具备学习能力和持续改进的意识,关注新技术和行业趋势,并能够将其应用到实际工作中。
-
岗位职责 1,主要进行自动化运维工具系统,和公司相关内部系统的开发 2,监控体系优化和开发,配置相关监控面板 3,Linux环境服务器调优,故障处理,日常巡检,Linux为主 4,协助处理腾讯云/阿里云等公共云上的运维工作 任职资格 1,**专科以上学历,能使用VUE/React开发简单的前端界面 2,较深度掌握linux操作系统,shell达到非常熟悉程度 3,python开发熟练,有至少一个以上项目开发经验,熟悉flask web、sqlalchemy优先 4,安全/数据库(mysql)/虚拟化和容器/自动化运维, 具备在海量环境下的独立运维能力优先 5,了解ansible,saltstack自动化运维工具优先 6. 具备良好的团队合作、沟通表达能力,心态沉稳可靠。
-
职位概览: 我们正在寻找一位精通数据库架构设计与云原生管理的开发DBA,负责业务系统的数据库表结构优化、性能调优及云数据库全生命周期管理。将深度参与业务需求分析,确保数据库设计的高可用性、扩展性与业务适配性,同时推动云原生数据库技术的落地与实践。 职责描述: 1.数据库架构与表结构设计 主导业务系统数据库表结构设计,评估并优化现有表结构的合理性(如范式化/反范式化、索引策略、字段类型选择)。 结合业务场景设计高性能SQL方案,解决复杂查询性能问题,规避慢查询与锁竞争。 制定数据分库分表、读写分离策略,支撑高并发与大数据量场景。 2.云原生数据库管理 负责云数据库(如AWS RDS、阿里云PolarDB、腾讯云TDSQL等)的监控、备份恢复与容灾设计。 优化云数据库成本(如自动扩缩容、存储分层、冷热数据分离),实现资源利用率最大化。 熟悉向量数据库、分布式数据库(如TiDB等)的技术选型与落地。 3.开发支持与规范制定 为开发团队提供数据库设计评审、SQL代码审核,制定企业级数据库开发规范。 设计数据迁移方案(如异构数据库同步、零停机迁移),保障业务连续性。 4.运维与安全 建立数据库监控体系(Prometheus/Grafana等),实现性能瓶颈预警与自动化处理。 制定数据安全策略(权限管控、敏感数据脱敏、审计日志)。 技术要求: 1.必备技能 5年以上DBA或数据库开发经验,精通MySQL/PostgreSQL/Oracle等主流数据库。 扎实的数据库理论基础,熟悉ER模型、事务隔离级别、锁机制、执行计划优化。 有云数据库(AWS/阿里云/腾讯云)管理经验,熟悉云厂商数据库服务特性与API。 掌握至少一种自动化运维工具(Ansible/Terraform)及脚本语言(Python/Shell)。 2.优先条件 主导过大型业务系统数据库从设计到上线的全流程,有亿级数据表优化经验。 熟悉云原生数据库架构。 云原生技术栈的持续学习能力。 任职要求: • 教育背景:计算机相关专业**本科及以上学历。 • 工作经验:至少5年以上数据库设计及优化相关工作经验。 • 会粤语者优先。
-
岗位职责: 1. 负责 TDengine TSDB 等产品的构建和发布; 2. 负责各产品 CI/CD 流水线的搭建; 3. 负责公司基础平台的维护和开发; 4. 负责云服务的运维。 任职要求: 1. 扎实的计算机基础,熟悉数据结构、算法、操作系统、网络等; 2. 至少熟练掌握一门编程语言,包括但不限于:Python, Java, Go, Rust, JavaScript/TypeScript; 3. 有较强的学习能力,能够快速学习掌握新技术; 4. 有独立分析和解决问题的能力; 5. 有好奇心和技术热情。 加分项: 1. 有开源项目经验,请提供 Github ID; 2. 有公有云的使用经验; 3. 有 K8s, Docker, Terraform, Ansible 等相关经验; 4. 有提效工具或平台的前后端开发经验; 5. 熟悉 Github Action 等 CI/CD 工具; 6. 熟悉企业级应用的构建、发布流程。
-
Job Responsibilities • Build and maintain cloud-based Big Data and Analytics Platforms, including Enterprise Data Lake, Data Governance and Management Platforms, Self-service BI and Augmented Analytics Platform, etc. • Proactively manage production services and data pipelines to ensure service availability and overall system healthiness • Responsible for building and maintaining CI/CD tools, solutions and micro services to ensure that all meet our customer service standards and reduce errors. • Responsible for Release management and deploy applications in Production environment following with enterprise standard. • As requested, need to work on weekend or non-business hours for Production release or urgent change. • Responsible for Release procedure and quality control, including but not limited to book preparation, stakeholder and business communication etc. • Incident troubleshooting based on ITIL structure and incident management lifecycle. • Test system integrity, implemented designs, application developments and other processes related to infrastructure, making improvements as needed. • Manage code deployments, fixes, updates and related processes. Job Qualifications: • Degree in Computer Science, Information System or IT related disciplines. • Experience in design and implementation experience in different Cloud Service Providers such as AWS, Microsoft Azure, Huawei etc. • Experience in providing application SME knowledge to support cloud-based system. i.e. Provisioning, Automation, Monitoring, Security, Resilience, Backup and Recovery, etc. • Understand cloud native application infrastructure, e.g. Server less, Kubernetes (K8S), etc. • Experience on DevOps and SRE tools, such as Terraform, Ansible, Git, Jenkins, etc. • Experience on Cloud and on-premise single sign-on and authentication e.g. LDAP, Azure Active Directory and ADFS. • Hands-on scripting experience in Java and Python. • Experience in mission critical, high availability, high performance and large-scale systems infrastructure. • Strong analytical, problem solving, interpersonal and presentation skills. • Good command of written and spoken English and Chinese.
-
【岗位职责】 1. 运维云端产品(域名、负载均衡、云主机、Mysql、Redis、Es、RabbitMQ、CDN,云原生K8S等)、内部CI/CD平台(Git、Jenkins),保障系统正常运行 2. 推动有信云产品自动化运维建设,通过脚本或工具提升部署、监控及故障处理效率。 3. 负责私有化场景下运维解决方案的设计与实施,包括高可用架构优化、部署、变更迭代、监控及应急预案建设 【必备技能】 1. 3年以上互联网或大型企业运维工作经验,2年以上Kubernetes生产环境运维经验 2. 熟悉Linux系统(CentOS/Ubuntu),熟练使用Shell/Python 3. 熟悉Kubernetes、Docker及生态工具,以及有云原生K8s实践经验(阿里云、腾讯云、AWS等) 4. 熟悉常用运维工具链的搭建与配置,包括Git、Jenkins、Ansible、Prometheus、Zabbix等 5. 熟悉数据库(MySQL/Redis等)的运维 6. 具备运维开发能力,能使用Python编写脚本或调用云厂商API实现自动化运维 【能力素质】 1. 具备较强的技术问题分析和解决能力,能快速定位并处理复杂故障 2. 逻辑清晰,责任心强,注重数据驱动的决策方式 3. 具备良好的项目管理与跨团队协作能力,能高效推动任务落地 4. 3年以上互联网或大型企业运维工作经验 5. 2年以上Kubernetes生产环境运维经验 【有以下经验者优先】 1. SpringCloud微服务框架及运维治理方案 2. 大型私有化项目交付经验
-
主要职责: 1. 负责日常CRM系统的监控和维护。 2. 参与设计和实施高可用性、可扩展的系统架构。 3. 监控并优化系统性能,解决系统故障和问题。 4. 实施和应用安全最佳实践,包括网络安全、数据加密和漏洞管理。 5. 与开发团队和业务部门紧密合作,确保系统的高效运行。 基本要求: 1. 计算机科学、信息系统或相关领域的本科学历。 2. 1-3年相关工作经验,熟悉Linux环境,有Oracle知识、主机网络知识者优先。 3. 优秀的分析和解决问题的能力。 4. 良好的沟通技巧和团队协作能力。 5. 强烈的责任心和敬业精神。 6. 熟悉基本的数据中心设施和网络基础架构。 优先条件: 1. 有大型IT环境管理经验,包括多云环境或混合云环境。 2. 熟悉容器化和云原生技术,如Docker和Kubernetes。 3. 有使用自动化工具(如Ansible,SaltStack)进行部署和配置管理的经验。 4. 有网络安全和加密经验。 我们提供具有竞争力的薪酬和福利,包括健康保险、退休计划和远程工作机会。我们欢迎所有符合以上条件并热爱这个职位的人士申请。


