• 30k-60k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责大模型相关产品的全链路交付管理,深度参与项目可行性评估,实施方案制定(容量规划、技术选型等),保障产品高效、稳定上线; 2、负责保障客户环境的稳定运行,建立故障预防与应急响应机制,快速定位并解决各类故障与告警; 3、负责对客赋能,为客户定制专业化、场景化的使用及运维培训方案,培养客户技术团队自主运维能力; 4、协同项目经理整合内外部资源,化解项目执行中的技术难题,确保项目按时高质量交付; 5、建立客户问题反馈闭环管理机制,深度分析客户反馈数据,挖掘客户潜在需求,驱动产品功能迭代与用户体验持续优化。 职位要求: 1、计算机相关专业本科以上学历,5年以上云原生运维经验,2年以上大模型部署调优经验; 2、熟悉Docker、Kubernetes等容器技术,了解主流云平台(阿里云/AWS等)的使用,并具备丰富的实操和运维经验; 3、深入理解Linux/Unix系统、网络原理及硬件架构,具备扎实的理论基础与丰富的实践经验,拥有出色的故障排查能力,能够快速定位并解决复杂技术问题; 4、熟悉Golang/Python中至少一种开发语言,有Ansible/Saltstack/Puppet等自动化部署和编排工具开发经验; 5、具备较强的沟通和团队协作能力,能够与技术、产品、销售等不同部门人员进行有效沟通与合作,共同推动项目进展; 6、具有大模型项目落地经验者优先,熟悉大模型训练、推理等业务流程及技术要点;具有交付运维团队管理经验者优先,能够合理分配任务、协调资源,保障团队高效运作。
  • 14k-26k 经验3-5年 / 本科
    金融 / 不需要融资 / 50-150人
    运维工程师   工作职责: 1、负责公司服务器、网络设备等硬件设施的安装、配置、维护和管理,确保其稳定运行。 2、设计、开发和维护自动化运维脚本和工具,提高运维工作效率和质量。使用脚本语言(如 Python、Shell)编写自动化部署脚本,实现服务器软件的快速部署和配置更新。建立和完善运维自动化平台,集成监控、部署、配置管理等功能。 3、搭建和维护服务器及网络的监控系统,使用开源或商业监控工具(如 Zabbix、Prometheus 等)对系统资源(CPU、内存、磁盘 I/O、网络流量等)、服务状态(Web 服务、数据库服务等)进行实时监控并配置合理的告警机制。 4、负责 Kubernetes 集群的规划、部署和初始化配置。根据业务需求,搭建高可用、高性能的 K8s 集群,包括但不限于选择合适的节点数量、配置网络插件(如 Calico、Flannel)和存储插件(如 Ceph、NFS)。 5、负责公司外部项目部署交付(需能接受短期出差),包括自建k8s集群以及各种私有容器云平台上部署公司项目,编写和维护项目相关文档,包括但不限于集群架构图、部署手册、运维手册、故障处理指南等。 6、快速响应和处理各种系统、K8s集群和应用出现的故障。在发生故障时,能够迅速定位问题的根源,如网络故障、存储故障、应用代码问题等,并采取有效的解决措施,尽快恢复业务正常运行。制定和演练应急响应计划,包括灾难恢复、故障转移等场景。   任职要求: 1、本科及以上学历,计算机科学、信息技术或相关专业背景。 2、熟悉 Linux 常用命令和服务(如 Apache、Nginx、MySQL、Redis 等)的部署和优化。 3、熟悉网络基础知识,包括 TCP/IP 协议、路由交换技术、VLAN、VPN 等,具备网络故障排查能力。 4、深入理解 Kubernetes 的架构、原理、核心组件和资源对象(如 Pod、Deployment、Service、Ingress 等),具备丰富的 K8s 集群部署和运维经验。 5、熟悉容器技术,如 Docker,包括容器的创建、运行、网络和存储配置等。 6、掌握至少一种监控工具(如 Prometheus)和可视化工具(如 Grafana)的使用,能够构建有效的监控体系。 7、熟悉网络和存储相关知识,如 IPV4/IPV6、TCP/IP 协议、分布式存储原理等,能够解决 K8s 集群中的网络和存储问题。 8、具备一定的编程能力,熟练掌握至少一种脚本语言(如 Shell、Python),用于自动化运维任务。 9、具备良好的沟通能力和团队协作精神,能够与不同部门的人员有效沟通和协作。 10、具备较强的问题解决能力和抗压能力,能够在紧急情况下迅速、有效地解决问题。 11、具有较强的学习能力和自我提升意识,能够及时掌握新的运维技术和工具。 12、具有丰富的toB项目部署交付经验优先。
  • 15k-20k·15薪 经验3-5年 / 本科
    其他,金融 / 不需要融资 / 2000人以上
    岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
  • 15k-25k·16薪 经验1-3年 / 本科
    区块链 / B轮 / 50-150人
    岗位职责 搭建区块链节点以提供高可用服务 维护节点及服务的高可用性 确保产品与服务访问的可用性与可靠性 搭建稳定多云高可用架构 任职要求 211院校计算机相关专业本科及以上学历 1-3年运维工作经验 精通云平台(AWS,GCP,Azura等) 精通常见编程架构语言(Python, Golang, Shell) 英文可作为工作语言 符合以下条件者优先 了解区块链,或运行过区块链节点
  • 12k-20k 经验1-3年 / 本科
    金融 / 不需要融资 / 2000人以上
    岗位职责: 1.负责CDH大数据平台的安装和部署; 2.负责CDH大数据平台各组件的性能优化; 3.负责CDH大数据平台各组件的运行维护和状态监控; 4.负责新技术调研,并能在团队内进行推广应用。 任职资格: 1.理解大数据计算原理,精通Hadoop/Spark体系,了解大数据平台运营基本思路; 2.熟悉HDFS、HBASE、KUDU、SPARK、HIVE等hadoop核心组件,具有两年以上hadoop/Spark技术的运维经验; 3.理解MapReduce计算框架的思想,熟悉分布式计算模型; 4.至少精通一种大数据开发语言,如JAVA、scala等; 5.至少熟练使用一种脚本语言,如Shell、Python等; 6.热爱技术,工作认真、严谨,有团队精神。
  • 12k-20k 经验1-3年 / 本科
    教育 / 不需要融资 / 50-150人
    岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,一年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
  • 15k-25k 经验5-10年 / 本科
    教育 / 不需要融资 / 50-150人
    岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,3年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
  • 30k-50k 经验3-5年 / 本科
    企业服务,信息安全 / 不需要融资 / 150-500人
    岗位职责 1. 负责超大规模服务器集群的交付保障、运行维护及资源退役,保障硬件资源稳定、高效运行; 2. 负责跟踪和处理服务器各类硬件故障,持续优化问题发现-定位-处置闭环机制,提升故障处理效率; 3. 负责AI大模型训练/推理集群相关服务器的运维支持,保障模型稳定性; 4. 负责协同网络、存储、数据中心等团队进行系统级故障协同定位及优化改进; 5. 负责推动新硬件上线适配及运维策略制定,确保平滑演进; 6. 负责运维可视化、自动化能力及故障预测预防能力建设。 任职要求 1. 本科及以上学历,计算机或相关专业; 2. 3年以上服务器硬件运维经验,有IDC实地运维或大规模集群支持经验者优先; 4. 熟悉主流服务器硬件架构,具备GPU服务器运维经验优先; 5. 具备处理AI大模型训练中常见硬件故障的能力; 6. 了解Linux操作系统基本命令,掌握常用日志分析与硬件健康检测工具; 7. 具备良好的开发能力,熟悉至少一种脚本语言(如 Python / Go / Shell),可独立开发或维护日常运维自动化工具; 8. 具备良好的沟通协作能力和问题分析能力,责任心强
  • 30k-60k 经验5-10年 / 本科
    人工智能服务,IT技术服务|咨询 / 上市公司 / 2000人以上
    工作职责 1、负责公司K8S集群及中间件集群的可靠、稳定、高效运行,对系统中存在的问题进行汇总与分析,提出改进意见与建议; 2、负责SRE体系及规范的建设与落地,在保证用户使用体验和稳定性的前提下,推动运维体系朝着云原生化的方向发展,持续改进整个系统的管理和运行效率,不断提升资源利用率 3、关注业界前沿容器及中间件相关技术动态,探索云原生技术的发展方向,推动新技术在团队中应用落地,提升整体技术水平 任职要求 1、本科及以上学历,计算机及信息等相关专业优先,5年左右运维开发或集群运维经验 2、熟悉shell,python,go至少一种语言,有相关的开发经验 3、对中间件有丰富的运维部署或开发经验,包括分布式数据库、缓存、消息队列等 4、熟悉k8s生态体系产品的管理、调度、运行、安全等原理机制并熟练使用,有大规模集群管理应用经验 5、熟悉operator/CRD/CSI/CNI/CRI等k8s扩展体系,有相关的运维或开发经验 5、下面几个方面应该具备50% a.具备较强的执行力和判断力,能够有效推动事情快速落地;较好的问题分析、归纳总结能力,良好的沟通交流及书面表达水平 b.具备高度的责任心,积极主动的工作态度,良好的团队合作精神,较强的危机意识和服务意识 c.能够深刻理解运维自动化,较强的数据化运营意识,熟悉 SRE 理念,有 Devops 实践经验 d.熟悉运维工作内容和流程,各类型运维工具;对运维工作方向有一定的思考,有运维体系的理念 e.有大数据、推荐系统、机器学习、AI模型训练相关开源系统的使用或优化经验
  • 30k-60k 经验5-10年 / 本科
    人工智能服务,IT技术服务|咨询 / 上市公司 / 2000人以上
    工作职责 1、负责商汤AI云物理网络的规划、设计和建设,支持在公有云、专有云、私有云场景下业务需求,合理规划和部署、日常变更和故障排查; 2、定期分析网络性能,优化网络结构,提高可用性; 3、负责网络运维标准化、自动化、平台化建设; 4、负责网络设备及耗材的测试、选型,和厂商及运营商的沟通; 5、和业务方包括但不限于计算产品、网络产品、存储产品等沟通交流,从客户视角推动数据中心架构和技术演进; 任职要求 1、计算机、通信等专业**本科学历,3年以上工作经验且不少于1年综合技术支持经验; 2、熟悉云计算网络,深入理解TCP/IP、OSPF、HSRP、BGP、MPLS等各种网络协议、路由协议、交换协议,有实际大型网络配置管理、故障排查经验; 3、熟悉网络虚拟化、SDN网络特点和开源控制器、Openflow、linux系统其中任何一项优先考虑; 4、工作思路清晰,具有良好的运维服务意识,承受较大的工作压力。 加分项:有公有云网络架构设计和运维经验者
  • 15k-28k·13薪 经验5-10年 / 本科
    移动互联网,信息安全 / 不需要融资 / 150-500人
    【岗位职责】(5年以上) 1、负责公司业务的运维工作,提升业务稳定性; 2、负责中间件运维,提升基础组件稳定性; 3、负责建立和完善规范化的运维服务体系; 4、负责线上问题排查,紧急故障处理,后续故障分析与优化; 5、持续推动运维质量提升:SLA、多活容灾、故障演练、监控告警、容量管理; 6、业务服务端架构的高可用设计和性能优化,保证高效、可靠的业务迭代。 【任职条件】 1、熟练Linux系统运维及性能优化,精通TCP/IP、HTTP协议原理; 2、熟练掌握Nginx、Tomcat、Apache、LVS、Kafka、keepalived、Openresty等常用中间件的维护与使用; 3、熟悉Golang、Python至少一门编程语言,并实际开发过运维项目优先; 4、熟悉云原生生态,有实际经验者优先; 5、良好的故障排查分析思路与经验,能够快速解决线上故障; 6、具有较强的沟通协调能力、善于跨部门沟通协作; 7、具有较强的责任心、抗压能力及优秀的执行能力; 8、具有较强的学习和创新能力,善于主动思考和自我驱动,具有敏锐的风险意识和良好的风险识别能力。 9、具有5年以上大型互联网公司运维经验,有带团队经验者优先 10、具有高并发场景开源负载软均衡实际维护经验者优先
  • 12k-17k·13薪 经验3-5年 / 本科
    移动互联网 / 不需要融资 / 50-150人
    岗位职责: 1.3年以上系统运维经验,深入理解linux系统或有Linux/Unix系统运维经验优先; 2.喜爱并善于撰写文档(面试时候需要带一至两份文档); 3.有apache、php、nginx、squid、nfs、ceph、redis、mysql、haproxy等软件安装优化和维护经验; 4.至少能熟练使用Shell/Python等脚本语言之一; 5.至少能熟练使用Docker/Kubernetes/Xen之一; 6.能熟练使用MySQL,有生成环境MySQL集群的维护经验,并且能熟练掌握常用SQL语句; 7.在生产环境中使用过ElasticSearch/Hadoop/Spark优先。 任职要求: 1.**本科或以上学历,计算机、电子信息类等理工科相关专业优先; 2.有大型网站服务器架构及运维经验者优先; 3.英语4级及以上,有良好的英文文档阅读能力; 4.热爱编程,对新的知识和新的技术有所涉猎; 5.身体健康,工作时间不抽烟。
  • 25k-45k 经验3-5年 / 本科
    电商,硬件 / 上市公司 / 150-500人
    工作职责: 1.负责自研平台及第三方研发平台的运维统一管理; 2.负责推动建设和完善公司运维管理规范与体系,建章立制,通过工具化和技术化手段提升效率; 3.负责针对运维发现的各类问题,负责同产品、研发、测试等横向团队沟通,确定改进方案; 4.参与运维团队组建,运维系统建设等专项工作; 岗位要求: 1. ***本科及以上学历,5年以上相关工作经验 2. 熟悉常见Linux系统(Centos及Ubuntu)系统管理维护工作,熟练使用Linux操作系统基础命令,了解TCP/IP协议 3. 熟练使用Python及Shell,能编写常用自动化运维工具 4. 掌握docker、Kubernetes基本原理及常用操作,熟悉Kubernetes相关生态组件 5. 熟悉常用中间件MySQL、Redis、Rabbitmq、Kafka、Flume、Elasticsearch等部署及维护工作 6. 具有Prometheus等相关监控落地经验。 7.有高度的责任心,良好的沟通协调能力,能主动协同各部门推动解决各类问题; 8.对运维体系有深入的研究和理解,有运维自动化系统经验优先 9.有管理第三方平台的经验者优先
  • 12k-18k 经验1-3年 / 不限
    人工智能服务,数据服务|咨询 / B轮 / 15-50人
    岗位职责: 1、公司运维体系建设和执行,运维资源巡查,安全审核,成本控制 2、机房7个机柜的维护和优化 3、华为云、阿里云等云服务器的维护管控 4、产品部署方案优化和BASH脚本开发 5、各种工具维护。git/ftp/docker/mysql/pgsql/mongodb/redis/....等等 任职要求: 1、计算机相关专业本科学历,或有较深IT背景可放宽 2、精通 Linux 操作系统,熟悉常见发行版(CentOS/Ubuntu/Debian/Alpine等) 3、精通Docker的使用、配置、优化、技巧 4、熟悉Bash/Perl/Python/PHP/NodeJS/Golang等语言任意一个 5、熟悉常见软件,包括 mysql,mariadb,redis,memcache,mongodb等编译、安装、优化、裁剪、定制 6、较强的学习意愿,有一定的业务抽象能力
  • 20k-40k·16薪 经验3-5年 / 本科
    通讯电子 / 不需要融资 / 2000人以上
    岗位职责: 1、负责数据库产品交付上线、运维保障、故障诊断、问题处理工作; 2、负责分布式数据库产品运维平台和工具的设计、开发工作; 3、用自动化、智能化的方法解决超大规模集群、分布式应用及复杂系统运维中的问题; 4、负责监控系统的设计、评审、发布并推动产品改进; 岗位要求: 1、熟悉Linux操作系统,具备常见故障的诊断、分析和处理能力; 2、熟悉Java、C/C++、Shell、Python等任一编程语言; 3、有业界领先的运维平台设计、开发、维护、SRE等经验者优先; 4、责任心强,沟通能力好,适应团队工作,善于思考、总结和改进。