-
职位职责: 1、负责大模型相关产品的全链路交付管理,深度参与项目可行性评估,实施方案制定(容量规划、技术选型等),保障产品高效、稳定上线; 2、负责保障客户环境的稳定运行,建立故障预防与应急响应机制,快速定位并解决各类故障与告警; 3、负责对客赋能,为客户定制专业化、场景化的使用及运维培训方案,培养客户技术团队自主运维能力; 4、协同项目经理整合内外部资源,化解项目执行中的技术难题,确保项目按时高质量交付; 5、建立客户问题反馈闭环管理机制,深度分析客户反馈数据,挖掘客户潜在需求,驱动产品功能迭代与用户体验持续优化。 职位要求: 1、计算机相关专业本科以上学历,5年以上云原生运维经验,2年以上大模型部署调优经验; 2、熟悉Docker、Kubernetes等容器技术,了解主流云平台(阿里云/AWS等)的使用,并具备丰富的实操和运维经验; 3、深入理解Linux/Unix系统、网络原理及硬件架构,具备扎实的理论基础与丰富的实践经验,拥有出色的故障排查能力,能够快速定位并解决复杂技术问题; 4、熟悉Golang/Python中至少一种开发语言,有Ansible/Saltstack/Puppet等自动化部署和编排工具开发经验; 5、具备较强的沟通和团队协作能力,能够与技术、产品、销售等不同部门人员进行有效沟通与合作,共同推动项目进展; 6、具有大模型项目落地经验者优先,熟悉大模型训练、推理等业务流程及技术要点;具有交付运维团队管理经验者优先,能够合理分配任务、协调资源,保障团队高效运作。
-
岗位职责: 1.负责CDH大数据平台的安装和部署; 2.负责CDH大数据平台各组件的性能优化; 3.负责CDH大数据平台各组件的运行维护和状态监控; 4.负责新技术调研,并能在团队内进行推广应用。 任职资格: 1.理解大数据计算原理,精通Hadoop/Spark体系,了解大数据平台运营基本思路; 2.熟悉HDFS、HBASE、KUDU、SPARK、HIVE等hadoop核心组件,具有两年以上hadoop/Spark技术的运维经验; 3.理解MapReduce计算框架的思想,熟悉分布式计算模型; 4.至少精通一种大数据开发语言,如JAVA、scala等; 5.至少熟练使用一种脚本语言,如Shell、Python等; 6.热爱技术,工作认真、严谨,有团队精神。
-
岗位职责 搭建区块链节点以提供高可用服务 维护节点及服务的高可用性 确保产品与服务访问的可用性与可靠性 搭建稳定多云高可用架构 任职要求 211院校计算机相关专业本科及以上学历 1-3年运维工作经验 精通云平台(AWS,GCP,Azura等) 精通常见编程架构语言(Python, Golang, Shell) 英文可作为工作语言 符合以下条件者优先 了解区块链,或运行过区块链节点
-
岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,一年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
-
运维工程师 工作职责: 1、负责公司服务器、网络设备等硬件设施的安装、配置、维护和管理,确保其稳定运行。 2、设计、开发和维护自动化运维脚本和工具,提高运维工作效率和质量。使用脚本语言(如 Python、Shell)编写自动化部署脚本,实现服务器软件的快速部署和配置更新。建立和完善运维自动化平台,集成监控、部署、配置管理等功能。 3、搭建和维护服务器及网络的监控系统,使用开源或商业监控工具(如 Zabbix、Prometheus 等)对系统资源(CPU、内存、磁盘 I/O、网络流量等)、服务状态(Web 服务、数据库服务等)进行实时监控并配置合理的告警机制。 4、负责 Kubernetes 集群的规划、部署和初始化配置。根据业务需求,搭建高可用、高性能的 K8s 集群,包括但不限于选择合适的节点数量、配置网络插件(如 Calico、Flannel)和存储插件(如 Ceph、NFS)。 5、负责公司外部项目部署交付(需能接受短期出差),包括自建k8s集群以及各种私有容器云平台上部署公司项目,编写和维护项目相关文档,包括但不限于集群架构图、部署手册、运维手册、故障处理指南等。 6、快速响应和处理各种系统、K8s集群和应用出现的故障。在发生故障时,能够迅速定位问题的根源,如网络故障、存储故障、应用代码问题等,并采取有效的解决措施,尽快恢复业务正常运行。制定和演练应急响应计划,包括灾难恢复、故障转移等场景。 任职要求: 1、本科及以上学历,计算机科学、信息技术或相关专业背景。 2、熟悉 Linux 常用命令和服务(如 Apache、Nginx、MySQL、Redis 等)的部署和优化。 3、熟悉网络基础知识,包括 TCP/IP 协议、路由交换技术、VLAN、VPN 等,具备网络故障排查能力。 4、深入理解 Kubernetes 的架构、原理、核心组件和资源对象(如 Pod、Deployment、Service、Ingress 等),具备丰富的 K8s 集群部署和运维经验。 5、熟悉容器技术,如 Docker,包括容器的创建、运行、网络和存储配置等。 6、掌握至少一种监控工具(如 Prometheus)和可视化工具(如 Grafana)的使用,能够构建有效的监控体系。 7、熟悉网络和存储相关知识,如 IPV4/IPV6、TCP/IP 协议、分布式存储原理等,能够解决 K8s 集群中的网络和存储问题。 8、具备一定的编程能力,熟练掌握至少一种脚本语言(如 Shell、Python),用于自动化运维任务。 9、具备良好的沟通能力和团队协作精神,能够与不同部门的人员有效沟通和协作。 10、具备较强的问题解决能力和抗压能力,能够在紧急情况下迅速、有效地解决问题。 11、具有较强的学习能力和自我提升意识,能够及时掌握新的运维技术和工具。 12、具有丰富的toB项目部署交付经验优先。
-
岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,3年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
-
岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
-
岗位职责 1. 负责超大规模服务器集群的交付保障、运行维护及资源退役,保障硬件资源稳定、高效运行; 2. 负责跟踪和处理服务器各类硬件故障,持续优化问题发现-定位-处置闭环机制,提升故障处理效率; 3. 负责AI大模型训练/推理集群相关服务器的运维支持,保障模型稳定性; 4. 负责协同网络、存储、数据中心等团队进行系统级故障协同定位及优化改进; 5. 负责推动新硬件上线适配及运维策略制定,确保平滑演进; 6. 负责运维可视化、自动化能力及故障预测预防能力建设。 任职要求 1. 本科及以上学历,计算机或相关专业; 2. 3年以上服务器硬件运维经验,有IDC实地运维或大规模集群支持经验者优先; 4. 熟悉主流服务器硬件架构,具备GPU服务器运维经验优先; 5. 具备处理AI大模型训练中常见硬件故障的能力; 6. 了解Linux操作系统基本命令,掌握常用日志分析与硬件健康检测工具; 7. 具备良好的开发能力,熟悉至少一种脚本语言(如 Python / Go / Shell),可独立开发或维护日常运维自动化工具; 8. 具备良好的沟通协作能力和问题分析能力,责任心强
-
1、负责按流程和制度协助项目人员完成数据相关实施及运维; 2、负责协助项目人员完成项目实施的推进; 3、负责协助项目经理进行每周或临时的数据统计; 4、负责协助项目经理撰写部分报告; 5、负责协助项目人员进行部分数据整理。 任职要求: 1、有较强的沟通表达协调能力; 2、具备较强的学习能力、逻辑思维能力、归纳总结能力; 3、具有较强的抗压能力、执行力; 4、熟练使用office(excel、word、ppt),掌握xmind,axure优先。 5、每周至少到岗4天。
-
岗位职责 1、跟进大数据平台的规划、部署、维护、管理、优化,包括但不限于HDFS、HBase、YARN、Hive、Spark、Kafka、Zookeeper等组件; 2、保障大数据平台的稳定性、可靠性、安全性及持续可用性;负责大数据集群的性能分析和优化调整; 3、参与大数据平台的日常巡检和定期深度巡检;开发监控报警平台; 任职要求 1、硕士及以上学历,计算机相关专业;有大数据平台运维实习经验优先; 2、了解Hadoop/HBase/Hive/Spark/Kafka/Zookeeper等组件的部署、配置、优化、扩容,了解各组件的内部运行原理; 3、具备较强的沟通技巧、团队合作能力、抗压能力;热爱技术并善于钻研,能主动思考,有解决疑难问题的毅力和决心。
-
岗位职责 (1) 负责团队自动化运维平台的架构设计与开发实现; (2) 负责处理大数据组件以及数据库的性能调优、自动化运维。 包括不限nginx、tomcat、jdk、hadoop、hbase、elk、kafka、spark、mysql、redis等; (3) 负责系统架构的可运维性设计,优化监控运营效率,保障系统的高可用和稳定性负责基础环境资源的运维管理,包括系统维护、节点监控巡检、网络安全保障。 任职要求 (1) 3年以上工作经验。有互联网或云计算TOP公司业务运维或运维架构设计、运维系统设计开发经验优先考虑; (2) 具备一定的开发能力,熟练掌握python、shell、java语言之一; (3) 精通Linux系统和网络知识,精通tomcat、Nginx等公共组件的配置和维护、mysql数据库调优; (4) 精通Hadoop大数据生态圈,熟悉Hadoop各组件的原理,并有实际部署维护经验以及调优经验;包括但不限于HDFS、YARN、Kafka、Spark、Storm、ES、druid、HBase、Kerberos、Hive、Zookeeper等; (5) 熟悉ambari常用功能,部署组件的过程,并了解底层原理; (6) 熟悉主流的监控工具,或者参与过监控系统开发、维护; (7) 具有良好的沟通能力、学习能力、问题分析与解决能力; (8) 具有高度的责任心和团队合作精神。
-
岗位职责: 1. 负责自建大数据计算与调度平台的运维、开发、监控 2. 负责大数据管理平台的运维、开发、监控,包括元数据管理、权限管控、血缘分析等 任职要求: 1. 本科以上学历,计算机相关专业优先,5年以上⼯作经验 2. 精通主流大数据批和流处理技术,如Hive、Spark、Flink、Tez、MapReduce等 3. 精通主流大数据管理与调度处理技术,如Ambari、CDH、Yarn、Atlas、Ranger、Hue、DolphinScheduler、Jenkins等 4: 扎实的计算机基础和算法数据结构功底,掌握Java或Scala,具备并发编程和JVM调优能力 5. 良好的团队沟通协调能力和英文阅读能力 加分项: 1. 对主流大数据中间件组件做过二次开发,参与过某些大数据组件的社区开发,附上Github地址或者Blog地址 2. 有 aws 平台运维经验
-
岗位职责: 1. 负责Linux系统服务部署维护、调优、故障排除,安全加固等; 2. 及时响应并快速定位故障,保证线上业务7x24小时稳定运行; 3. 负责公司运维项目系统组件升级,扩容与资源落实,配合开发需求,测试、调整运维平台; 4. 负责k8s容器集群相关的性能和集群管理自动化工具搭建及维护; 5. 负责容器集群日常运维及性能分析和故障处理; 6. 负责容器集群版本升级和代码发布流程自动化构建等。 任职要求: 1. 精通Linux操作系统维护、常用服务的配置如防火墙配置,磁盘卷管理; 2. 熟悉Docker及k8s等容器管理运维平台技术及kvm虚拟化; 3. 精通Shell脚本,至少熟悉一种语言(Python/PHP/Perl/Go); 4. 熟悉Mysql、Redis、mongodb等服务高可用搭建及日常运维; 5. 熟悉网络、操作系统原理如网络划分,路由设定,抓包分析,NAT转发,了解TCP/IP、HTTP协议; 6. 熟悉阿里云/华为云等主流云服务商的提供的常用功能组件配置; 7. 对技术充满热情,具有较强的学习能力和问题解决能力; 8. 有强烈的责任心,具备较强的沟通协调能力; 9. 熟练使用rancher等运维相关工具; 10.*****本科及以上学历、计算机或网络相关专业。
-
岗位职责: 1.员工IT设备全生命周期管理负责员工电脑、手机、打印机等IT设备的采购、入库、分发、回收、报废等全流程管理。 2.设备配置与安全合规统一配置操作系统和安全策略,部署和维护MDM(移动设备管理)系统,实现设备加密、远程锁定、数据擦除、应用白名单等。 3.日常IT支持与自动化运维负责办公网络、服务器、终端设备的日常巡检、维护和故障处理,及时响应员工IT相关需求。 编写自动化脚本,提升设备部署、巡检和运维流程效率。 4.服务器与云平台运维负责阿里云、AWS、Google Cloud等主流云平台及本地服务器的日常运维,包括实例管理、网络配置、资源优化、成本监控、自动化部与容器化管理(如Docker/Kubemnetes),保障业务系统高可用性和安全性。 5.安全策略与合规审计配置云安全组、IAM权限管理,定期执行安全评估与漏洞扫描,落实FCA及国内相关合规要求,协助内外部审计,完善资产与安全合规文档。 6. 应急响应与灾备 参与IT突发事件应急响应,主导数据备份、恢复、设备更换、跨云平台容灾等工作,确保业务连续性。 7.技术文档与知识库建设 编写和维护设备管理、运维操作手册及常见问题知识库,提升团队整体技术水平。 任职要求: 1.本科及以上学历,计算机、信息安全、网络工程等相关专业优先。 2.3年以上IT运维、IT资产/设备管理及云平台运维相关工作经验,有金融行业或跨国公司背景优先。 3.熟悉Windows、Mac、Linux等主流操作系统及常用办公设备的配置与管理。 4.熟练使用MDM、资产管理系统(如GLPI、Snipe-IT等),掌握自动化脚本(如Shell、Python等)优先。 5.至少精通阿里云、AWS、Google Cloud其中一个平台的核心服务,了解云原生技术(如容器、自动化部署、云安全等)。 6.具备良好的安全意识,了解等保、ISO 27001、FCA等相关IT合规要求。 7.责任心强,沟通能力好,具备较强的服务意识和团队合作精神。 8.英语读写能力良好,能阅读英文技术文档。
-
**岗位职责**: 1. 负责公司云环境的日常维护和管理,包括但不限于网络、服务器、存储、数据库等。 2. 参与Kubernetes集群的配置、管理和优化,确保集群的高可用性和性能。 3. 定期监控和报告系统性能和安全状况,及时发现并处理潜在问题。 4. 协助开发团队解决系统问题,优化系统性能,提高系统可用性。 5. 参与自动化运维工具的开发和使用,提高工作效率。 6. 配合团队完成其他相关的工作任务。 **任职资格**: 1. 计算机相关专业本科及以上学历,有3-5年相关工作经验。 2. 熟悉网络架构,具备相关网络知识和经验。 3. 熟悉Kubernetes(K8s)的原理和使用,有相关实践经验。 4. 熟悉云平台的运维和管理,包括AWS、Azure、Google Cloud等。 5. 熟悉常见的Linux系统操作,能够独立处理系统故障。 6. 具备良好的问题解决和团队协作能力,能够快速响应并处理各种系统故障。 7. 具备良好的文档编写和沟通能力,能够编写清晰、简洁的文档,并与其他团队成员有效沟通。


