• 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、保障公司短视频产品的直播重保平台等核心系统的线上稳定性,对线上事故进行快速响应并建立机制、平台提升处理效率; 2、参与建设运维工具、平台,推进运维自动化; 3、通过持续的全方位数据运营(包括可用性指标、历史事故、资源利用率等),找到系统薄弱点,落地地改进项目; 4、积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档; 5、推动提升服务的可靠性、可扩展性以及性能优化,保障系统SLA。 职位要求: 1、本科及以上学历,计算机及相关专业; 2、扎实的计算机软件基础知识;了解 Linux 操作系统、存储、网络IO等相关原理; 3、熟悉一种或多种编程语言,例如Python/Go/Java/PHP/C/C++; 4、具备系统化解决问题的能力,良好的沟通技巧和主人翁责任感。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责公司全球服务器的拆机、利旧、自维保场景下的质量管理与服务支持工作,保证相关业务正常开展; 2、负责服务器整机制造指标制定、监控、提升,管理OXM进行质量控制与质量提升; 3、负责服务器关键部件供应商QSA、QPA稽核、绩效考核、定期飞检、专项辅导,推动供应商持续改善; 4、负责服务器关键部件、利旧部件质量标准制定,包括外观标准,性能测试标准; 5、负责部件供应商出货质量监控与来料质量控制;整机制造与关键部件质量问题处理,包括异常处理、质量判责、RMA支持、MRB评审等。 职位要求: 1、本科及以上学历; 2、熟悉服务器生产制程工艺、技术管控关键点及质量异常处理流程; 3、熟悉供应商质量管理模式,熟悉供应商QSA、QPA系统性稽核诊断及辅导改善; 4、熟悉关键物料质量管理方法与关键制造工艺,如CPU、HDD、SSD、内存等。
  • 25k-50k 经验5-10年 / 不限
    工具类产品,内容社区,音频|视频媒体 / 上市公司 / 2000人以上
    岗位职责: 1. 负责研发部基建运维,设计、部署并维护可靠、可扩展的基础设施系统,包括云计算、容器、分布式系统等; 2. 负责参与持续交付和自动化建设,制定持续集成和持续交付的流程和工具; 3. 负责事故响应和故障排查,快速定位并解决生产环境中的问题,分析事故原因,制定预防措施,持续改进系统可靠性。 岗位要求: 1.熟悉至少一种主流编程语言,如Python、Go、Java等,熟练进行代码编写、调试和优化; 2.熟悉常见的系统架构模式及常见云计算平台, 如微服务架构、分布式系统等,具备部署架构设计和优化经验及在云环境下构建和优化系统的经验; 3.熟悉SLI/SLO/SLA指标管理,对系统可用性、容错性等进行持续监控和优化,同时具备成本优化意识, 能够通过资源分析、负载预测等手段,优化系统运行成本。
  • 20k-30k 经验3-5年 / 本科
    游戏 / 不需要融资 / 500-2000人
    职位说明: 1、 负责搭建和维护业务系统的运行环境,包括服务器架设、应用软件安装、配置以及优化; 2、 负责业务系统的管理与维护,包括性能监控、性能调优和故障诊断等; 3、 负责相关业务线的发布和数据同步的工作; 4、 日常运维文档的撰写整理工作; 5、 及时响应并协助解决公司应用相关的IT风险事件。 任职资格: 1、深入理解linux系统、Windows系统; 2、熟悉服务器硬件故障的简单处理; 3、熟悉交换机、路由器、软硬件防火墙和TCP/IP原理等网络设备及技术应用; 4、精通一门以上脚本语言(shell/go/python等),有java/c++开发经验更佳; 5、精通lvs、nginx、haproxy等组件运维体系; 6、精通持续集成,持续发布的管理流程和工具,熟悉jenkins; 7、掌握主流开源监控软件的配置使用,如:Zabbix、Open-Falcon等。
  • 30k-50k 经验3-5年 / 本科
    企业服务,信息安全 / 不需要融资 / 150-500人
    岗位职责 1. 负责超大规模服务器集群的交付保障、运行维护及资源退役,保障硬件资源稳定、高效运行; 2. 负责跟踪和处理服务器各类硬件故障,持续优化问题发现-定位-处置闭环机制,提升故障处理效率; 3. 负责AI大模型训练/推理集群相关服务器的运维支持,保障模型稳定性; 4. 负责协同网络、存储、数据中心等团队进行系统级故障协同定位及优化改进; 5. 负责推动新硬件上线适配及运维策略制定,确保平滑演进; 6. 负责运维可视化、自动化能力及故障预测预防能力建设。 任职要求 1. 本科及以上学历,计算机或相关专业; 2. 3年以上服务器硬件运维经验,有IDC实地运维或大规模集群支持经验者优先; 4. 熟悉主流服务器硬件架构,具备GPU服务器运维经验优先; 5. 具备处理AI大模型训练中常见硬件故障的能力; 6. 了解Linux操作系统基本命令,掌握常用日志分析与硬件健康检测工具; 7. 具备良好的开发能力,熟悉至少一种脚本语言(如 Python / Go / Shell),可独立开发或维护日常运维自动化工具; 8. 具备良好的沟通协作能力和问题分析能力,责任心强
  • 19k-28k·15薪 经验3-5年 / 本科
    金融 / 上市公司 / 2000人以上
    岗位职责: 1. 大数据平台组件运维及优化,进行必要的二次开发; 2. 数据湖、数据仓库技术研究及落地; 3. 实时、离线数据产品设计及开发。 任职要求: 1. 本科及以上学历,计算机及相关专业; 2. 3-5年Java/Scala开发经验,熟悉多线程编程; 3. 熟悉大数据生态相关技术,有二次开发经验者优先; 4. 熟悉实时及离线数仓架构及开发流程,有Phoenix/StarRocks使用经验优先; 5. 熟悉常见设计模式,熟悉如Spring/SpringMVC/Mybatis等主流框架; 6. 有较强的学习能力与逻辑思维能力,良好的团队合作精神。
  • 7k-11k 经验1-3年 / 硕士
    IT技术服务|咨询,新媒体,文化传媒 / 不需要融资 / 150-500人
    ■岗位职责 负责运维及代运维平台的传播矩阵建设、特色频道与品牌栏目的打造; 负责新闻策划、活动策划、专题策划、主题策划的组织和执行; 负责运维及代运维平台内容的策划、采访、编辑、制作、发布、传播与运营。 ■岗位条件 (1)年龄:原则上硕士研究生不超过30岁,博士研究生不超过32岁,特别优秀者可适当放宽。 (2)专业:新闻与传播学、文学、法学、商学、经济学、统计学、管理学、马克思主义哲学、历史文化学、文化产业与旅游管理学、外语(西班牙语)、广播电视编导、摄影摄像、导演剪辑等相关专业。 (3)基础能力: 有一定的新闻敏感性和思想深度,能够独立完成选题策划、采访报道和文稿编辑任务; 能够娴熟使用基础制图软件独立完成图片的设计与制作,熟练掌握视频拍摄、剪辑及发布等技能,能够应用大模型完成文生文、文生图、文生视频的制作; 能够独立完成短视频拍摄、剪辑、发布及推广等工作。 (4)放宽及优先条件: 特殊岗位及具有符合本岗位特殊才能的,学历和年龄可适当放宽; 有相关从业经历、从业经验且业绩卓著的,学历和年龄可适当放宽; 其他符合放宽或优先条件的。
  • 7k-9k 经验不限 / 本科
    IT技术服务|咨询,新媒体,文化传媒 / 不需要融资 / 150-500人
    ■岗位职责 负责各个业务系统的综合运维维护,实时监控报警、数据备份、日志分析、故障排除、性能调优等工作,保障系统稳定运行与数据安全; 配合开发新项目的环境搭建,与相关部门针对具体的技术点进行沟通、提出架构优化方面的意见和建议并推动实施; 负责突发事件处理,问题跟踪与解决; 负责公司网络、服务器、VMware虚拟化、CND等各种云资源的使用维护; 负责协助安全工程师完成漏洞修复、软件升级等基础网信安全、数据安全相关工作。 ■岗位条件 (1)学历:***普通高招大学本科及以上学历。 (2)年龄:原则上本科生不超过28周岁,硕士研究生不超过30岁,博士研究生不超过32岁,特别优秀者可适当放宽。 (3)专业:计算机科学与技术、软件工程、网络工程、信息与计算科学、信息安全、电子与计算机工程、信息与通信工程、网络空间安全、数据科学与大数据技术、人工智能等相关专业。 (4)基础能力: 掌握Linux安装、配置、日常管理、安全、备份、恢复、故障处理、日志分析以及性能优化; 熟练配置nginx、tomcat、redis、elk、rocketmq、zk、prometheus等软件,熟练集群部署,能够根据实际情况做性能调优; 熟悉Linux/CentOS操作系统;熟悉系统、软件漏洞修复; 熟悉git+jenkins+ansible持续集成; 熟悉Mysql、Mongodb数据库使用,集群部署,备份与恢复和性能调优; 熟悉Prometheus、grafana、zabbix等与监控相关的工具; 熟悉VMware虚拟化,docker容器和k8s编排工具; 熟悉公有云、政务云网络架构;熟悉防火墙、交换机等网络设备的简单配置。 (5)放宽及优先条件: 具有符合本岗位特殊才能的,学历和年龄可适当放宽; 具有算法开发相关经验者优先; 具有计算机高级职称者优先; 其他符合放宽或优先条件的。
  • 30k-50k 经验3-5年 / 本科
    企业服务,信息安全 / 不需要融资 / 150-500人
    职位描述 1.服务器技术交付负责人,包括项目虚线团队协同,沟通管理,计划管理,范围管理,变更管理,风险管理,质量管理,紧急情况处理等,作为一号位确保项目保质保量按期交付 2. 作为所负责用户交付相关的业务需求,业务方案技术方案,交付方案的总体推进人,制定计划,确保交付进程的顺利实施,并总结项目经验,推动标准和可复制方案迭代 3.负责协调服务器在IDC现场的交付全流程,保证各个环节顺利进行,如IDC环境验收、机架位规划和用电计算、网络布线、服务器设备到货上架、系统安装等环节,了解各环节关键节点及产出,提前识别延期风险并协调资源解决。 任职要求 1. 本科或以上学历,计算机相关专业,具备技术背景,了解服务器硬件,数据中心,网络,操作系统基础技术; 了解大语言模型软硬件相关技术优先 2. 3年或以上大型客户项目交付、客户成功、解决方案经验 客户沟通能力强,能有效协同内部各部门和各级关键客户形成共同的决策 3. 具备良好的抗压能力、沟通能力和团队协作精神,逻辑思维能力强,具备很强的书面同步能力 4.熟悉IDC服务器端到端交付全流程并具备丰富的实操经验,不限于综合布线、服务器落位规划、资产字段信息管理、服务器上架安装管理等,熟悉大模型网络架构、硬件设备者优先
  • 20k-30k·15薪 经验5-10年 / 本科
    其他 / 上市公司 / 500-2000人
    岗位职责: 1.负责服务器的日常巡检与状态监控,配置告警; 2. 负责部署和维护基础服务(如emqx、MySQL、Redis),负责应用系统的安装; 3. 负责制定应急响应预案。使用监控工具实现对业务、性能、告警进行配置和优化; 4. 处理开发反馈的技术问题,通过日志分析定位故障原因; 5. 参与开发Devops相关工具,提升团队效能; 6. 负责交付现场的路由器、防火墙等的配置工作。 任职要求: 1. 计算机、电子信息、电气自动化等相关专业,本科及以上学历,5年以上工作经验; 2. 必须有Python开发经验; 3. 熟悉Linux操作系统,有国产操作系统运维经验优先,有Arm等嵌入式设备经验优先; 4. 掌握TCP/IP协议、DNS、HTTP等网络基础知识,能排查网络问题。 5. 熟悉Emqx的部署与配置,了解MySQL/Redis的安装和配置工作; 6.熟悉Kubernetes集群架构和日常维护操作。 7.加分项:熟悉工控系统(如SCADA)或电力行业知识。
  • 25k-35k 经验3-5年 / 本科
    金融 / 上市公司 / 2000人以上
    工作职责 1、制定系统稳定性方案及度量体系,掌控系统可用性风险,针对各类隐患做好故障防范和应急方案,保障系统稳定性SLA达成; 2、推动重大稳定性治理项目,识别系统的风险/效能/成本问题,构建以稳定性为核心的工程技术平台,持续优化1-5-10应急响应机制(1分钟告警、5分钟定位、10分钟恢复); 3、制定运维领域智能化规划,运用平台已有能力,对于团队工作问题提出针对性智能化解决方案,改进工作效率和质量; 4、关注行业动态和新技术发展,探索前沿AI技术在运维领域的创新应用,推动新技术在运维场景中的落地应用,升级运维体系。 任职要求 1、本科及以上学历,计算机相关专业,3年以上系统运维(SRE)或系统架构稳定性设计经验; 2、熟悉云原生和AI主流应用架构,能根据运维场景利用AI技术进行工作流优化重构; 3、具备良好的项目管理和沟通能力,作为技术牵头人推动运维自动化/智能化项目落地; 4、有知名互联网公司工作经历者优先。
  • 20k-25k·15薪 经验3-5年 / 本科
    其他,金融 / 不需要融资 / 2000人以上
    岗位职责: 1、IT安全管理规划及体系建设,完成对系统纵深防御体系建设,部署维护安全检测、监控或阻断系统; 2、保障系统自身业务安全、运维安全、网络安全、数据安全、主机安全等; 3、负责包括WAF、IPS、审计、态势感知、审计、端点检测和响应工具(如防**)等安全设备的配置和管理; 4.负责系统自身安全风险及隐患发现分析,针对存在的安全问题,设计安全策略和解决方案。 岗位要求: 1、本科以上学历,网络通信、信息安全、计算机及其相关专业; 2、具有3年以上的网络和计算机安全方面的工作经验; 3、具有CISSP、CISA、COBIT、CCIE、CCNP、CISP、CIW等认证者优先考虑; 4、熟悉国内外主流的网络安全产品和技术,如防火墙、IPS、WAF、堡垒机、终端产品等,具有使用经验并能熟练操作和配置; 5、熟悉国家信息安全相关政策、法规与标准,熟悉信息安全管理体系与信息安全风险评估的理论、过程和方法; 6、熟悉主流网络设备、操作系统、网络应用系统配置和安全加固,熟悉黑客攻防技术,能够处理突发性安全事件; 7、具有良好的沟通能力和文档撰写能力,能够适应较大的工作压力。
  • 30k-55k·13薪 经验不限 / 不限
    旅游|出行 / D轮及以上 / 500-2000人
    岗位职责: 1、负责各公有云(AWS/GCP)和基础核心服务的管理和维护,包括各公有云网络、服务器、存储和k8s集群等,确保其安全、高可用和可扩展 2、负责运维团队及运维体系建设,制定并不断优化各项工作流程,完善公司运维管理规范,保障运维质量; 3、负责运维容量管理和稳定性建设,提升服务的可靠性、可扩展性以及高性能优化; 4、负责多云跨平台建设,包括AWS/GCP/阿里云跨云多活架构,以及多云k8s集群管理; 5、深入了解各项业务系统,参与业务方案讨论与设计,并推进优化服务的响应延迟、性能问题,提升服务可用性; 6、不断探索和研究新的运维技术,推动运维自动化、智能化能力建设,提升整体运维水平和风险控制能力; 7、负责推动云原生技术解决方案的制定、验证及落地,以及重要特性和核心功能的创新、技术攻关; 岗位要求: 1、**本科及以上学历,7年以上运维相关运维;具有5年以上AWS/GCP/Azure等公有云大规模资源的运维和实践管理经验;2年以上团队管理经验; 2、熟悉操作系统、容器技术、Kubernetes架构,熟悉相关网络和存储解决方案,可以独立处理复杂的k8s集群问题; 3、具备多云多中心和国际化部署管理经验; 4、具备项目管理能力和小团队管理能力,良好的沟通能力、应变能力和团队协作能力,有重大项目端到端交付经验优先; 5、具有服务意识,善于思考,积极主动、认真负责、具有高度责任感和敬业精神; 6、具有大型电商运维管理经验优先;
  • 15k-25k 经验5-10年 / 本科
    教育 / 不需要融资 / 50-150人
    岗位职责: 1、负责管理本地服务器及阿里云资源等日常维护,技术支持、系统优化、故障处理、相关维护文档编制; 2、负责以及应用系统日常维护工作,系统上线、升级、部署日常操作; 3、负责管理办公及网络设备(如路由器、交换机、防火墙); 4、负责对现行自动化建设与维护。 任职资格: 1、本科以上学历,3年以上相关工作经验; 2、具有Linux系统维护经验以及云服务器相关经验,熟练操作常见的Linux发行版(如CentOS, Ubuntu)系统的安装、配置及日常使用; 3、具备Shell/Python脚本编写能力,能高效地通过脚本自动化处理日常运维任务; 4、熟悉Nginx/mysql/redis/消息队列等软件的日常维护及故障排查; 5、熟悉TCP/IP协议栈以及HTTP协议,能够理解并解决相关的网络通信问题;了解基本的路由与交换技术,能够对交换机、路由器以及防火墙进行必要的配置工作; 6、熟悉常用的监控工具(如Prometheus, Zabbix等)和日志管理系统(如ELK Stack等),能够设置和维护这些工具以确保系统的稳定运行; 7、掌握Docker容器技术及Kubernetes集群管理,能够部署、管理和优化容器化应用。
  • 22k-32k·16薪 经验3-5年 / 本科
    科技金融 / 不需要融资 / 500-2000人
    岗位职责: 1. 负责业务系统基础环境的建设、维护和管理,推动线上服务稳定性建设,提升服务的可靠性、可扩展性,保障系统SLA; 2. 负责持续优化运维解决方案,包括但不限于智能调度、弹性扩容、精细化监控、容灾预案等; 3. 建立和完善规范化的运维体系,保障生产系统可靠,安全,稳定地运行; 4. 不断研发与探索运维自动化及智能化途径,提升运维效率,降低运维成本; 工作要求: 1. 本科及以上学历,计算机软件及相关专业,3年以上工作经验; 2. 熟悉Linux操作系统、计算机网络等,基础知识扎实; 3. 熟悉Docker、K8S容器平台的使用及原理,能定位异常; 4. 熟悉并掌握各种中间件及基础组件的部署和使用,比如etcd/dns/elasticsearch/prometheus/grafana/nginx等; 5. 熟悉和使用过业界云平台:腾讯云、阿里云等优先;熟悉大模型基础架构运维优先 6. 熟悉并擅长Pyhon、shell、go等脚本语言的任意一种,并能使用脚本来完成日常系统运维工作; 7. 具有良好的线上安全意识,有责任感,工作积极进取,乐于持续学习,抗压性强,有良好的服务意识和团队精神;