-
职位职责: 1、负责字节跳动数据中心网络P4网关产品交付和线上运维工作,提供超大集群网关服务能力和保证线上稳定运行; 2、负责网关类产品稳定性方案设计和能力建设,包括监控、告警、应急响应、运维数据分析,风险治理等; 3、负责网关类产品运维流程和规划的制定和优化,持续提升交付、变更、运维效率。 职位要求: 1、计算机相关专业,本科以上学历,具备扎实的计算机体系知识; 2、熟悉常见网络协议,比如TCP/IP、BGP、VXLAN、GRE等; 3、熟悉VPC、负载均衡、云企业网、专线连接等公有云网络产品优先; 4、具备良好的现网意识,持续提升现网的稳定性,有运维或稳定性相关经验优先; 5、具备良好的沟通表达能力和团队合作意识,责任心强,有较强的自我驱动能力; 6、掌握Golang、C++、Python等开发语言中的一门。
-
职位职责: 1、负责字节跳动数据中心网络P4网关产品交付和线上运维工作,提供超大集群网关服务能力和保证线上稳定运行; 2、负责网关类产品稳定性方案设计和能力建设,包括监控、告警、应急响应、运维数据分析,风险治理等; 3、负责网关类产品运维流程和规划的制定和优化,持续提升交付、变更、运维效率。 职位要求: 1、计算机相关专业,本科以上学历,具备扎实的计算机体系知识; 2、熟悉常见网络协议,比如TCP/IP、BGP、VXLAN、GRE等; 3、熟悉VPC、负载均衡、云企业网、专线连接等公有云网络产品优先; 4、具备良好的现网意识,持续提升现网的稳定性,有运维或稳定性相关经验优先; 5、具备良好的沟通表达能力和团队合作意识,责任心强,有较强的自我驱动能力; 6、掌握Golang、C++、Python等开发语言中的一门。
-
岗位职责: 1. 大数据平台组件运维及优化,进行必要的二次开发; 2. 数据湖、数据仓库技术研究及落地; 3. 实时、离线数据产品设计及开发。 任职要求: 1. 本科及以上学历,计算机及相关专业; 2. 3-5年Java/Scala开发经验,熟悉多线程编程; 3. 熟悉大数据生态相关技术,有二次开发经验者优先; 4. 熟悉实时及离线数仓架构及开发流程,有Phoenix/StarRocks使用经验优先; 5. 熟悉常见设计模式,熟悉如Spring/SpringMVC/Mybatis等主流框架; 6. 有较强的学习能力与逻辑思维能力,良好的团队合作精神。
-
岗位职责: 1. 负责研发部基建运维,设计、部署并维护可靠、可扩展的基础设施系统,包括云计算、容器、分布式系统等; 2. 负责参与持续交付和自动化建设,制定持续集成和持续交付的流程和工具; 3. 负责事故响应和故障排查,快速定位并解决生产环境中的问题,分析事故原因,制定预防措施,持续改进系统可靠性。 岗位要求: 1.熟悉至少一种主流编程语言,如Python、Go、Java等,熟练进行代码编写、调试和优化; 2.熟悉常见的系统架构模式及常见云计算平台, 如微服务架构、分布式系统等,具备部署架构设计和优化经验及在云环境下构建和优化系统的经验; 3.熟悉SLI/SLO/SLA指标管理,对系统可用性、容错性等进行持续监控和优化,同时具备成本优化意识, 能够通过资源分析、负载预测等手段,优化系统运行成本。
-
职位说明: 1、 负责搭建和维护业务系统的运行环境,包括服务器架设、应用软件安装、配置以及优化; 2、 负责业务系统的管理与维护,包括性能监控、性能调优和故障诊断等; 3、 负责相关业务线的发布和数据同步的工作; 4、 日常运维文档的撰写整理工作; 5、 及时响应并协助解决公司应用相关的IT风险事件。 任职资格: 1、深入理解linux系统、Windows系统; 2、熟悉服务器硬件故障的简单处理; 3、熟悉交换机、路由器、软硬件防火墙和TCP/IP原理等网络设备及技术应用; 4、精通一门以上脚本语言(shell/go/python等),有java/c++开发经验更佳; 5、精通lvs、nginx、haproxy等组件运维体系; 6、精通持续集成,持续发布的管理流程和工具,熟悉jenkins; 7、掌握主流开源监控软件的配置使用,如:Zabbix、Open-Falcon等。
-
岗位职责 1. 负责超大规模服务器集群的交付保障、运行维护及资源退役,保障硬件资源稳定、高效运行; 2. 负责跟踪和处理服务器各类硬件故障,持续优化问题发现-定位-处置闭环机制,提升故障处理效率; 3. 负责AI大模型训练/推理集群相关服务器的运维支持,保障模型稳定性; 4. 负责协同网络、存储、数据中心等团队进行系统级故障协同定位及优化改进; 5. 负责推动新硬件上线适配及运维策略制定,确保平滑演进; 6. 负责运维可视化、自动化能力及故障预测预防能力建设。 任职要求 1. 本科及以上学历,计算机或相关专业; 2. 3年以上服务器硬件运维经验,有IDC实地运维或大规模集群支持经验者优先; 4. 熟悉主流服务器硬件架构,具备GPU服务器运维经验优先; 5. 具备处理AI大模型训练中常见硬件故障的能力; 6. 了解Linux操作系统基本命令,掌握常用日志分析与硬件健康检测工具; 7. 具备良好的开发能力,熟悉至少一种脚本语言(如 Python / Go / Shell),可独立开发或维护日常运维自动化工具; 8. 具备良好的沟通协作能力和问题分析能力,责任心强
-
岗位要求: 一、专业知识: 1.、熟悉一个或多个领域的功能、原理、架构:公有云、私有云、Openstack、IaaS、PaaS、大数据、SDN、IOT、AI等; 2、相关行业云解决方案经验者优先; 3、具备重大项目上云解决方案设计经验,具备项目支撑和客户技术方案交流能力者优先,具备IT领域软件技术规划经验和架构设计者优先。 4、有相关行业的IT部门虚拟化、云化等项目规划、实施、运维经验优先。 5、持有CCIE、HCIE/HCIP/HCIA认证者优先。 二、技能要求: 1、通过学习迅速掌握并能够应用HCS以及云的基本知识,能够理解并应用产品域解决方案,了解主流云厂商产品优劣势 2、需求理解和云解决方案设计能力:能够理解客户需求,完成相关解决方案设计,包括配置报价、技术建议书等 3、项目运作能力:能够跟踪线索和机会点,参与项目策略制定,达成项目成功 4、有重大项目运作经验,沟通协同能力强优先。 三、语言要求:简体中文 四、教育背景要求:本科及以上 岗位职责: 1、负责在政企行业的售前咨询、技术方案交流及上云机会点洞察,项目需求分析、方案设计等工作; 2、负责本行业云解决方案格局和机会点管理,制定拓展策略,实现重大项目成功和格局份额领先; 3、深入行业洞察,识别客户关键需求,孵化和挖掘新机会点,推动可参与空间的扩大。
-
岗位职责: 1. 负责业务系统基础环境的建设、维护和管理,推动线上服务稳定性建设,提升服务的可靠性、可扩展性,保障系统SLA; 2. 负责持续优化运维解决方案,包括但不限于智能调度、弹性扩容、精细化监控、容灾预案等; 3. 建立和完善规范化的运维体系,保障生产系统可靠,安全,稳定地运行; 4. 不断研发与探索运维自动化及智能化途径,提升运维效率,降低运维成本; 工作要求: 1. 本科及以上学历,计算机软件及相关专业,3年以上工作经验; 2. 熟悉Linux操作系统、计算机网络等,基础知识扎实; 3. 熟悉Docker、K8S容器平台的使用及原理,能定位异常; 4. 熟悉并掌握各种中间件及基础组件的部署和使用,比如etcd/dns/elasticsearch/prometheus/grafana/nginx等; 5. 熟悉和使用过业界云平台:腾讯云、阿里云等优先;熟悉大模型基础架构运维优先 6. 熟悉并擅长Pyhon、shell、go等脚本语言的任意一种,并能使用脚本来完成日常系统运维工作; 7. 具有良好的线上安全意识,有责任感,工作积极进取,乐于持续学习,抗压性强,有良好的服务意识和团队精神;
-
【岗位职责】 1. 负责业务系统运维保障,通过持续优化技术架构,提升系统安全性、稳定性、高效性及易用性,支持业务和数据规模快速增长; 2. 负责建立和完善规范化的运维服务体系; 3. 负责线上问题排查,紧急故障处理,后续故障分析与优化; 4. 持续推动运维质量提升:SLA、多活容灾、故障演练、监控告警、容量管理等; 5. 结合部门需求,规划和管理各类型硬件和服务资源。 【任职要求】 1. 深入理解Linux系统,具备内核及系统参数调优经验; 2. 熟悉云原生 K8s 生态,具备生产环境落地及运维经验,有大规模 K8s 集群设计和管理经验者优先 3. 熟悉 Shell 或 Lua 等运维脚本编程,至少掌握一种脚本语言; 4. 熟悉常见中间件(如 Nginx、Redis、RabbitMQ、Kafka、Prometheus等)及数据库(如Postgres); 5. 熟悉大型分布式系统,微服务架构有日常维护和故障处理经验; 6. 具备网络基础知识,了解常见网络设备(如交换机、路由器等)的配置与优化。 【加分项】 1. 具有较强的责任心、安全意识、抗压能力及优秀的执行力; 2. 持有K8s认证(CKA/CKAD)或云平台专业认证; 3. 熟悉综合布线技术,了解网络组网原理及实施流程。 【工作模式】 - 需参与on-call轮值,处理紧急技术问题
-
职责描述: 1、负责公有云运维工作,故障处理,日常巡检 2、负责公有云环境搭建及监控,包括处理服务请求异常问题定位及修复等运维操作。 3、对公有云环境进行风险识别和评估,提出改进建议并修复。 4、对公有云环境运维建立运维标准和流程。 5、负责企业应用部署、发布系统、CMDB等相关项目维护。 任职要求: 1、本科及以上学历,计算机及相关专业,有3年以上运维经验。 2、熟悉公有云,具有1~2年以上腾讯云或阿里云运维经验。 3、熟悉防火墙、VPN、DNS、HTTPS、TCP/IP等网络技术, 熟练使用高可用/负载均衡技术。 4、具有一定的K8S运维经验,也具备一定的云上虚拟机或者中间件资源运维经验。 5、具有mysql、redis、rabbitmq、elasticsearch、prometheus等常规业务组件丰富的运维经验。 6、有python/shell脚本编程经验,有devops自动化脚本编写开发经验优先。 7、了解基础网络知识和网络设备工作原理。 8、对于网络安全,运维安全,数据安全有一定的认知和处理经验 8、具备良好的团队合作、沟通表达能力,心态沉稳可靠。
-
岗位职责: 1、IT安全管理规划及体系建设,完成对系统纵深防御体系建设,部署维护安全检测、监控或阻断系统; 2、保障系统自身业务安全、运维安全、网络安全、数据安全、主机安全等; 3、负责包括WAF、IPS、审计、态势感知、审计、端点检测和响应工具(如防**)等安全设备的配置和管理; 4.负责系统自身安全风险及隐患发现分析,针对存在的安全问题,设计安全策略和解决方案。 岗位要求: 1、本科以上学历,网络通信、信息安全、计算机及其相关专业; 2、具有3年以上的网络和计算机安全方面的工作经验; 3、具有CISSP、CISA、COBIT、CCIE、CCNP、CISP、CIW等认证者优先考虑; 4、熟悉国内外主流的网络安全产品和技术,如防火墙、IPS、WAF、堡垒机、终端产品等,具有使用经验并能熟练操作和配置; 5、熟悉国家信息安全相关政策、法规与标准,熟悉信息安全管理体系与信息安全风险评估的理论、过程和方法; 6、熟悉主流网络设备、操作系统、网络应用系统配置和安全加固,熟悉黑客攻防技术,能够处理突发性安全事件; 7、具有良好的沟通能力和文档撰写能力,能够适应较大的工作压力。
-
岗位职责: 1、负责各公有云(AWS/GCP)和基础核心服务的管理和维护,包括各公有云网络、服务器、存储和k8s集群等,确保其安全、高可用和可扩展 2、负责运维团队及运维体系建设,制定并不断优化各项工作流程,完善公司运维管理规范,保障运维质量; 3、负责运维容量管理和稳定性建设,提升服务的可靠性、可扩展性以及高性能优化; 4、负责多云跨平台建设,包括AWS/GCP/阿里云跨云多活架构,以及多云k8s集群管理; 5、深入了解各项业务系统,参与业务方案讨论与设计,并推进优化服务的响应延迟、性能问题,提升服务可用性; 6、不断探索和研究新的运维技术,推动运维自动化、智能化能力建设,提升整体运维水平和风险控制能力; 7、负责推动云原生技术解决方案的制定、验证及落地,以及重要特性和核心功能的创新、技术攻关; 岗位要求: 1、**本科及以上学历,7年以上运维相关运维;具有5年以上AWS/GCP/Azure等公有云大规模资源的运维和实践管理经验;2年以上团队管理经验; 2、熟悉操作系统、容器技术、Kubernetes架构,熟悉相关网络和存储解决方案,可以独立处理复杂的k8s集群问题; 3、具备多云多中心和国际化部署管理经验; 4、具备项目管理能力和小团队管理能力,良好的沟通能力、应变能力和团队协作能力,有重大项目端到端交付经验优先; 5、具有服务意识,善于思考,积极主动、认真负责、具有高度责任感和敬业精神; 6、具有大型电商运维管理经验优先;
-
一、主要职责: 1.构建、部署和维护容器化平台 2.负责微服务的部署、更新和回滚操作,确保服务的高可用性和连续性 3.设计和实施持续集成/持续部署(CI/CD)流程,自动化测试、构建和部署过程 4.实施监控解决方案,跟踪系统性能指标,及时发现并解决性能瓶颈 5.中间件Tomcat、rabbitMQ、Redis和zookeeper运维与管理;
-
主要职责: 1.前期通过深入处理客户投诉案件,落地对内和对外的客诉处理SOP并通过数据表现不断优化SOP内容,降低客诉的平均处理时长。 2.定期与客服团队复盘服务案例,主导沟通协调,推动流程优化方案设计与落地,提升整体服务效率。例如流程自动化方案,优化FAQ、话术及异常处理机制,降低咨询进线率。 3.通过定期分析履约数据,总结用户体验痛点并提出优化的建议,包括但不限于优化前端信息展示、优化case流转流程和执行SOP等,以降低履约失败率。 4.完成上级交待的其他服务运营相关工作,例如定期拉取数据,进行数据分析,为业务决策提供数据支持等。 任职要求: 1.本科或以上学历,英语读写熟练,熟悉旅游或租车业务链路(如订单履约、供应商协同、保险纠纷等)者优先。 2.热爱服务行业,善于表达,数据分析,工作积极主动,有责任心,能承受一定的工作压力,有服务运营经验优先。 3.有跨部门沟通和流程优化的实际案例,能够有效推动横向部门协作。
-
工作职责 1. 技术支持与故障排查: 1)作为一线或二线技术支持,通过电话、邮件、工单系统及远程会议等方式,快速响应和解决客户提出的技术问题。 2)对混合云环境(涵盖公有云、私有云及本地基础设施)中的问题进行全面诊断和深度排查,涉及计算、存储、网络、安全、容器及编排服务等领域。 3)高效地复现、分析和定位问题根源,并与内部工程和研发团队协作,推动复杂问题的最终解决。 2. 客户沟通与管理: 1)清晰、准确、专业地向客户传达问题处理进展,管理客户预期,提升客户满意度和信任度。 2)为客户提供最佳实践指导、架构咨询和性能优化建议,帮助客户更高效、安全地使用云平台。 3. 知识库建设: 1)创建、维护和更新详细的技术文档、解决方案知识库和常见问题(FAQ)。 2)将重复性问题的解决方案转化为标准化的处理流程,提升团队整体支持效率。 4. 值班与应急响应:根据需要参与值班(On-Call),提供7x24小时的紧急故障响应支持。 任职要求 1. 本科及以上学历,计算机科学、信息技术或相关专业; 2. 2年以上云计算领域(如AWS, Azure, Google Cloud, 阿里云,腾讯云,华为云等)或大型企业IT技术支持/运维经验;具备实际的混合云或私有云环境(如VMware, OpenStack, Nutanix等)的运维或支持经验; 3. 扎实的云计算基础:熟悉IaaS, PaaS, SaaS模型,熟悉虚拟化、计算、存储和网络的核心概念; 4. 熟悉TCP/IP, DNS, HTTP/HTTPS, VPN, 负载均衡、防火墙和网络安全原理,具备实际的网络故障排查能力;熟悉Linux/Unix和Windows Server操作系统,能够进行系统级调试和性能分析; 5.出色的逻辑分析和问题解决能力,能系统性、高效地处理复杂技术问题。 6.拥有强烈的服务意识和同理心,始终以解决客户问题为首要目标,能用非技术语言向客户解释复杂的技术问题,具备出色的书面和口头表达能力; 7.善于与内部团队(销售、产品、研发)协作,共同推动客户问题的解决。 8.抗压能力:能在高压环境下保持冷静,并行处理多个任务,并管理好紧急故障。


