-
职位职责: 1、负责大模型相关产品的全链路交付管理,深度参与项目可行性评估,实施方案制定(容量规划、技术选型等),保障产品高效、稳定上线; 2、负责保障客户环境的稳定运行,建立故障预防与应急响应机制,快速定位并解决各类故障与告警; 3、负责对客赋能,为客户定制专业化、场景化的使用及运维培训方案,培养客户技术团队自主运维能力; 4、协同项目经理整合内外部资源,化解项目执行中的技术难题,确保项目按时高质量交付; 5、建立客户问题反馈闭环管理机制,深度分析客户反馈数据,挖掘客户潜在需求,驱动产品功能迭代与用户体验持续优化。 职位要求: 1、计算机相关专业本科以上学历,5年以上云原生运维经验,2年以上大模型部署调优经验; 2、熟悉Docker、Kubernetes等容器技术,了解主流云平台(阿里云/AWS等)的使用,并具备丰富的实操和运维经验; 3、深入理解Linux/Unix系统、网络原理及硬件架构,具备扎实的理论基础与丰富的实践经验,拥有出色的故障排查能力,能够快速定位并解决复杂技术问题; 4、熟悉Golang/Python中至少一种开发语言,有Ansible/Saltstack/Puppet等自动化部署和编排工具开发经验; 5、具备较强的沟通和团队协作能力,能够与技术、产品、销售等不同部门人员进行有效沟通与合作,共同推动项目进展; 6、具有大模型项目落地经验者优先,熟悉大模型训练、推理等业务流程及技术要点;具有交付运维团队管理经验者优先,能够合理分配任务、协调资源,保障团队高效运作。
-
岗位职责: 1. 协助系统运维部经理负责数据中心系统运维部的管理工作,制定部门运维战略、管理制度及流程,确保部门工作高效、合规开展。 2. 统筹银行虚拟化环境、阿里云平台、主流存储设备的运维管理,保障底层基础设施稳定运行,支撑上层业务系统正常运转。 3. 主导数据中心系统架构规划与优化,结合业务发展需求,提出合理的架构升级、扩容及技术迭代方案,提升系统整体性能与可靠性。 4. 推动运维工作自动化与智能化转型,引入自动化运维工具、智能化监控与预警平台,减少人工操作,提升运维效率与故障响应速度。 5. 负责团队建设与管理,包括人员招聘、技能培训、绩效考核与职业发展规划,打造专业、高效的系统运维团队。 6. 牵头处理系统运维过程中的重大故障与突发事件,组织技术攻关,制定应急预案并定期演练,降低业务中断风险。 7. 与业务部门、开发部门、云服务商等保持密切沟通,协同推进系统资源调配、技术对接与问题解决,保障业务需求顺利落地。 任职要求: 1. 具备良好的身体素质与抗压能力,能适应数据中心7×24小时运维保障的工作节奏。 2. **本科及以上学历,计算机科学与技术、软件工程、信息工程等相关专业优先。 3. 拥有5年以上银行系统运维相关工作经验,其中至少2年以上团队管理经验,有大型银行数据中心运维管理经验者优先。 4. 核心技能: ◦ 精通银行虚拟化技术(如VMware、KVM)的部署、运维与优化,熟悉虚拟化资源调度与容灾方案。 ◦ 深入了解阿里云平台架构(如ECS、RDS、OSS、VPC等),具备阿里云环境运维、资源管理及故障排查经验。 ◦ 熟悉主流存储设备(如IBM、EMC、华为等品牌)的原理、配置与运维,掌握存储容灾、数据备份与恢复技术。 ◦ 具备数据中心系统架构规划能力,能结合业务需求设计合理的基础设施架构方案,有架构升级或迁移项目经验者优先。 ◦ 熟悉自动化运维工具(如Ansible、Jenkins、Puppet)与智能化监控平台(如Prometheus、Grafana、Zabbix),有相关平台搭建与实践经验者优先。 5. 具备较强的问题分析与解决能力,能快速定位并处理复杂系统故障;拥有出色的沟通协调与团队管理能力,能有效统筹团队工作并推动跨部门协作;具备较强的责任心与创新意识,对运维技术发展趋势有敏锐的洞察力。
-
岗位职责: 1. 负责研发部基建运维,设计、部署并维护可靠、可扩展的基础设施系统,包括云计算、容器、分布式系统等; 2. 负责参与持续交付和自动化建设,制定持续集成和持续交付的流程和工具; 3. 负责事故响应和故障排查,快速定位并解决生产环境中的问题,分析事故原因,制定预防措施,持续改进系统可靠性。 岗位要求: 1.熟悉至少一种主流编程语言,如Python、Go、Java等,熟练进行代码编写、调试和优化; 2.熟悉常见的系统架构模式及常见云计算平台, 如微服务架构、分布式系统等,具备部署架构设计和优化经验及在云环境下构建和优化系统的经验; 3.熟悉SLI/SLO/SLA指标管理,对系统可用性、容错性等进行持续监控和优化,同时具备成本优化意识, 能够通过资源分析、负载预测等手段,优化系统运行成本。
-
岗位职责: 1. 负责业务系统基础环境的建设、维护和管理,推动线上服务稳定性建设,提升服务的可靠性、可扩展性,保障系统SLA; 2. 负责持续优化运维解决方案,包括但不限于智能调度、弹性扩容、精细化监控、容灾预案等; 3. 建立和完善规范化的运维体系,保障生产系统可靠,安全,稳定地运行; 4. 不断研发与探索运维自动化及智能化途径,提升运维效率,降低运维成本; 工作要求: 1. 本科及以上学历,计算机软件及相关专业,3年以上工作经验; 2. 熟悉Linux操作系统、计算机网络等,基础知识扎实; 3. 熟悉Docker、K8S容器平台的使用及原理,能定位异常; 4. 熟悉并掌握各种中间件及基础组件的部署和使用,比如etcd/dns/elasticsearch/prometheus/grafana/nginx等; 5. 熟悉和使用过业界云平台:腾讯云、阿里云等优先;熟悉大模型基础架构运维优先 6. 熟悉并擅长Pyhon、shell、go等脚本语言的任意一种,并能使用脚本来完成日常系统运维工作; 7. 具有良好的线上安全意识,有责任感,工作积极进取,乐于持续学习,抗压性强,有良好的服务意识和团队精神;
-
工作职责 1、自动化运营脚本或工具平台开发,提升运维工作效率; 2、梳理设计实施基础架构/应用监控,建立完备的监控体系; 3、异常分析处理,快速恢复应用系统故障,确保业务正常进行; 4、7*24h应急响应,紧急情况下执行应急预案快速恢复异常; 5. 响应和处理中间件&计算领域的日常事件,并做好事件的分析和总结,作为事件智能化的知识输入。 任职要求 1、本科及以上学历,计算机相关专业,3年及以上开发或运维工作经验; 2、有kafka/elasticsearch/rocketmq/tomcat/nginx/weblogic等软件运维经验者优先; 3、精通linux/Unix的基本操作和维护以及性能调优,熟悉常见网络配置等操作,熟悉TCP/IP协议的原理; 4、掌握shell,python等开发语言,有运维平台开发经验者优先; 5、了解docker相关技术,有基于kubernetes容器云平台开发或运维经验者优先; 6、有大规模云底座运维、应用集群运维经验者优先; 7、可以接受7*24三班值班。
-
工作职责: 1.负责数字底座现场部署支持 2.运维方案的制定、设计和实施以及现场问题解决、自动化运维能力的持续提升 任职资格: 1.计算机、软件、数学、自动化、信息技术等相关专业,硕士及以上学历; 2.熟悉K8S,具备K8S集群的部署、扩缩容、监控报警及故障排查经验,熟悉基于K8S的服务部署最佳实践; 3.熟悉Cilium、OpenEBS等云原生网络和存储插件,了解其工作原理,能够构建监控报警能力并快速处理故障; 4.熟悉KubeSphere K8S集群管理套件,能够熟练使用其功能管理和运维K8S集群; 5.熟悉MySQL、Redis、Kafka、Doris、IoTDB、HDFS、HBase、MinIO等存储组件的运维,包括部署、扩缩容、监控、数据备份与恢复; 6.熟悉Flink、Spark等计算引擎的运维,能够基于K8S环境完成部署、扩缩容及监控报警能力构建; 7.具备网络和存储方向的基础知识,知识面广泛; 8.3年及以上云计算、运维或相关领域的工作经验; 9.积极主动,工作细心踏实,责任心强;具有较好的团队协作能力,具有较强的创新精神、组织协调和沟通能力。 10.具备撰写中英技术文档的能力,有良好的英语读写水平,英语通过国家四级;
-
■岗位职责 负责各个业务系统的综合运维维护,实时监控报警、数据备份、日志分析、故障排除、性能调优等工作,保障系统稳定运行与数据安全; 配合开发新项目的环境搭建,与相关部门针对具体的技术点进行沟通、提出架构优化方面的意见和建议并推动实施; 负责突发事件处理,问题跟踪与解决; 负责公司网络、服务器、VMware虚拟化、CND等各种云资源的使用维护; 负责协助安全工程师完成漏洞修复、软件升级等基础网信安全、数据安全相关工作。 ■岗位条件 (1)学历:***普通高招大学本科及以上学历。 (2)年龄:原则上本科生不超过28周岁,硕士研究生不超过30岁,博士研究生不超过32岁,特别优秀者可适当放宽。 (3)专业:计算机科学与技术、软件工程、网络工程、信息与计算科学、信息安全、电子与计算机工程、信息与通信工程、网络空间安全、数据科学与大数据技术、人工智能等相关专业。 (4)基础能力: 掌握Linux安装、配置、日常管理、安全、备份、恢复、故障处理、日志分析以及性能优化; 熟练配置nginx、tomcat、redis、elk、rocketmq、zk、prometheus等软件,熟练集群部署,能够根据实际情况做性能调优; 熟悉Linux/CentOS操作系统;熟悉系统、软件漏洞修复; 熟悉git+jenkins+ansible持续集成; 熟悉Mysql、Mongodb数据库使用,集群部署,备份与恢复和性能调优; 熟悉Prometheus、grafana、zabbix等与监控相关的工具; 熟悉VMware虚拟化,docker容器和k8s编排工具; 熟悉公有云、政务云网络架构;熟悉防火墙、交换机等网络设备的简单配置。 (5)放宽及优先条件: 具有符合本岗位特殊才能的,学历和年龄可适当放宽; 具有算法开发相关经验者优先; 具有计算机高级职称者优先; 其他符合放宽或优先条件的。
-
岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
-
岗位职责: 1. 独立负责公有云(Azure, AWS)上多个系统运维,快速定位及解决生产系统异常及故障。 2. 负责公有云上K8S建设和维护; 3. 负责公司CICD建设及优化, 负责监控系统建设及优化; 4. 负责公有云上数据库管理维护和优化; 5. 负责公有云上网络和安全相关的运维工作; 6. 配合外部和内部团队进行PenTest和信息安全认证及审计; 7. 建设公司整体的运维流程体系,并指导组内年轻员工推广实施; 岗位要求: 1.4年以上运维工作经验,精通主流的操作系统与虚拟化软件,例如Linux,Windows; 2.拥有管理海外云服务(Azure,AWS)经验; 3.精通Shell及Python语言;熟悉jenkins pipeline及groovy语法,具备cicd开发能力。 4.熟悉k8s及k8s cni :flannel和calico,有ASK,ACK,EKS使用经验优先。 5.熟悉主流厂家交换机、路由器以及防火墙等网络设备的配置以及排障; 6.有主流数据库数据的调优、监控、备份恢复、安全审计处理经验为加分项; 7.有云上数据库管理经验为加分项; 8.拥有审计或数据安全标准(ISO,等保,PCI)经验优先考虑。 9.有一定的英文文档读写能力,良好的技术文档编写能力 10.其他常规的运维技能 期待您的加入哟,我们为您准备丰厚福利待遇: 【法定福利】:公司按国家规定购买五险一金+带薪年假; 【节日关怀】:节日福利礼品,以及节日礼金; 【公司福利】: 1、 商业保险:员工本人及子女商业保险; 2、 龙腾员工卡权益: 2.1 休息室服务:全年本人无限次,用于全国机场/高铁休息室; 2.2 礼宾车服务:6次/年,用于机场/高铁接送机; 2.3 饭票服务:300元/年,用于机场/高铁合作餐厅餐食; 2.4 健康体检服务:年度员工健康体检; 2.5 健康360服务:在线问诊、三甲医院VIP挂号、重疾入院安排服务; 2.6 超声波洁牙服务:2次/年; 3、主题活动:定期主题下午茶、年度旅游及团建等; 4、节气福利:新年元旦礼金、新春粮油礼盒、开年利是、端午/中秋礼盒; 5、其他福利:加班餐、加班打车、生育补贴等。 【学习与培训】:助力职业发展与提升,内外训双引擎发力助你高速发展。 【晋升机会】:公司设立良好的晋升机制和广阔的发展空间。
-
工作职责 1.异常分析处理,快速恢复应用系统故障,确保业务正常运行; 2.主动预防,分析应用的运行趋势找出潜在问题并防止其发生; 3.从运维角度评估应用架构可用性,变更风险,确保系统运行稳定; 4.有自动化理念,不断优化运维规范,搭建配置标准化及运维自动化平台建设; 5.探索前沿AI技术在运维领域的创新应用,推动新技术在运维场景中的落地应用。 任职要求 1、本科及以上学历,计算机相关专业,3年以上系统运维(SRE)或开发经验; 2、深入理解运维体系架构,具备扎实的运维专业知识,有故障排查、性能优化、容量规划等运维实战经验; 3、熟悉容器、微服务等云原生技术,有运维大规模服务架构应用经验; 4、熟悉主流AI框架,具备运维模型训练、调优和部署经验; 5、有良好的逻辑思维和分析能力,热衷于解决实际问题、追求极致 6、强烈的责任心、进取心、团队合作精神; 7、有知名互联网公司工作经历优先,有AI应用运维经验优先。
-
运维工程师 工作职责: 1、负责公司服务器、网络设备等硬件设施的安装、配置、维护和管理,确保其稳定运行。 2、设计、开发和维护自动化运维脚本和工具,提高运维工作效率和质量。使用脚本语言(如 Python、Shell)编写自动化部署脚本,实现服务器软件的快速部署和配置更新。建立和完善运维自动化平台,集成监控、部署、配置管理等功能。 3、搭建和维护服务器及网络的监控系统,使用开源或商业监控工具(如 Zabbix、Prometheus 等)对系统资源(CPU、内存、磁盘 I/O、网络流量等)、服务状态(Web 服务、数据库服务等)进行实时监控并配置合理的告警机制。 4、负责 Kubernetes 集群的规划、部署和初始化配置。根据业务需求,搭建高可用、高性能的 K8s 集群,包括但不限于选择合适的节点数量、配置网络插件(如 Calico、Flannel)和存储插件(如 Ceph、NFS)。 5、负责公司外部项目部署交付(需能接受短期出差),包括自建k8s集群以及各种私有容器云平台上部署公司项目,编写和维护项目相关文档,包括但不限于集群架构图、部署手册、运维手册、故障处理指南等。 6、快速响应和处理各种系统、K8s集群和应用出现的故障。在发生故障时,能够迅速定位问题的根源,如网络故障、存储故障、应用代码问题等,并采取有效的解决措施,尽快恢复业务正常运行。制定和演练应急响应计划,包括灾难恢复、故障转移等场景。 任职要求: 1、本科及以上学历,计算机科学、信息技术或相关专业背景。 2、熟悉 Linux 常用命令和服务(如 Apache、Nginx、MySQL、Redis 等)的部署和优化。 3、熟悉网络基础知识,包括 TCP/IP 协议、路由交换技术、VLAN、VPN 等,具备网络故障排查能力。 4、深入理解 Kubernetes 的架构、原理、核心组件和资源对象(如 Pod、Deployment、Service、Ingress 等),具备丰富的 K8s 集群部署和运维经验。 5、熟悉容器技术,如 Docker,包括容器的创建、运行、网络和存储配置等。 6、掌握至少一种监控工具(如 Prometheus)和可视化工具(如 Grafana)的使用,能够构建有效的监控体系。 7、熟悉网络和存储相关知识,如 IPV4/IPV6、TCP/IP 协议、分布式存储原理等,能够解决 K8s 集群中的网络和存储问题。 8、具备一定的编程能力,熟练掌握至少一种脚本语言(如 Shell、Python),用于自动化运维任务。 9、具备良好的沟通能力和团队协作精神,能够与不同部门的人员有效沟通和协作。 10、具备较强的问题解决能力和抗压能力,能够在紧急情况下迅速、有效地解决问题。 11、具有较强的学习能力和自我提升意识,能够及时掌握新的运维技术和工具。 12、具有丰富的toB项目部署交付经验优先。
-
岗位职责: 1、负责构建和维护 AWS 云平台的基础设施,并确保其高可用性和灵活性; 2、负责DevOps体系规划与实施,持续交付CI/CD流程设计、研发和实施, 实现自动化和平台化; 3、研究和评估新的技术,提高系统的性能以及可靠性。 岗位要求: 1、本科以上学历,计算机或相关专业毕业,具有良好的技术功底,3年及以上工作经验; 2、具有AWS等云平台运维经验; 3、熟练Docker容器技术,k8s技术,2年以上Kubernetes部署、优化、运维经验; 4、精通CI/CD持续集成与持续交付;熟悉Gitlab、Jenkins、Argocd、Prometheus、Loki、Grafana等工具; 5、具有较强Troubleshooting能力,能够快速定位解决问题; 6、精通至少一门语言 Python,Go等,了解Web 前后端开发和常见框架,如 Django,Vue 等; 7、在运维自动化方面具备一定的开发经验和产品思维; 8、良好的沟通能力和团队协作能力。
-
职责描述: 1、负责公有云规划及运维工作。 2、负责公有云环境搭建及监控,包括处理服务请求异常问题定位及修复等运维操作。 3、对公有云环境进行风险识别和评估,提出改进建议并修复。 4、对公有云环境运维建立运维标准和流程。 5、负责企业应用部署、发布系统、CMDB等相关项目维护。 任职要求: 1、本科及以上学历,计算机及相关专业,有3年以上运维经验。 2、熟悉公有云,具有2年以上腾讯云/阿里云网络规划及运维经验。 3、熟悉防火墙、VPN、DNS、HTTPS、TCP/IP等网络技术, 熟练使用高可用/负载均衡技术。 4、有mysql、redis、rabbitmq、elasticsearch、prometheus等常规业务组件运维经验。 5、有python/shell脚本编程经验,有devops自动化脚本编写开发经验优先。 6、了解基础网络知识和网络设备工作原理。 7、具备良好的团队合作、沟通表达能力。
-
岗位职责 搭建区块链节点以提供高可用服务 维护节点及服务的高可用性 确保产品与服务访问的可用性与可靠性 搭建稳定多云高可用架构 任职要求 211院校计算机相关专业本科及以上学历 1-3年运维工作经验 精通云平台(AWS,GCP,Azura等) 精通常见编程架构语言(Python, Golang, Shell) 英文可作为工作语言 符合以下条件者优先 了解区块链,或运行过区块链节点
-
岗位职责: 1.负责CDH大数据平台的安装和部署; 2.负责CDH大数据平台各组件的性能优化; 3.负责CDH大数据平台各组件的运行维护和状态监控; 4.负责新技术调研,并能在团队内进行推广应用。 任职资格: 1.理解大数据计算原理,精通Hadoop/Spark体系,了解大数据平台运营基本思路; 2.熟悉HDFS、HBASE、KUDU、SPARK、HIVE等hadoop核心组件,具有两年以上hadoop/Spark技术的运维经验; 3.理解MapReduce计算框架的思想,熟悉分布式计算模型; 4.至少精通一种大数据开发语言,如JAVA、scala等; 5.至少熟练使用一种脚本语言,如Shell、Python等; 6.热爱技术,工作认真、严谨,有团队精神。


