-
职位职责: 1、保障公司短视频产品的直播重保平台等核心系统的线上稳定性,对线上事故进行快速响应并建立机制、平台提升处理效率; 2、参与建设运维工具、平台,推进运维自动化; 3、通过持续的全方位数据运营(包括可用性指标、历史事故、资源利用率等),找到系统薄弱点,落地地改进项目; 4、积累运维最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档; 5、推动提升服务的可靠性、可扩展性以及性能优化,保障系统SLA。 职位要求: 1、本科及以上学历,计算机及相关专业; 2、扎实的计算机软件基础知识;了解 Linux 操作系统、存储、网络IO等相关原理; 3、熟悉一种或多种编程语言,例如Python/Go/Java/PHP/C/C++; 4、具备系统化解决问题的能力,良好的沟通技巧和主人翁责任感。
-
岗位职责: 1.负责自研或AWS云上各种资源的使用、监控、调优,例如MySQL、Redis、Mongo、K8S/EKS等。熟悉各类中间件搭建、配置、监控、问题排查。 2.熟悉AWS各类网络及安全机制。负责搭建、开发性能监控及运维监控体系搭建,及安全运营体系的建立,例如Prometheus、Grafana、Skywalking、SonarQube等。 3.参与团队整体应用架构设计,协助完成架构体系设计,融合生产运维体系。 岗位要求: 1.本科及以上学历,5年以上运维工作经验,有互联网行业、Web3工程研发经验优先。 2.基础平台中间件使用经验丰富,熟悉MySQL、Redis、Mongo、ElasticSearch等主流中间件、存储引擎的原理,具备相关的性能调优能力。参与过大规模业务系统的架构设计和开发、运维相关经验的优先; 3.有云管理(AWS)、容器云平台(K8S/EKS)、Devops平台、DevSecOps平台相关经验,熟悉开发运维一体化管理机制的优先; 4.有一定的编程语言经验,例如Shell、Java、Python、Go经验者加分; 5. 责任心强,思路清晰,技术视野开阔,对业界新技术敏感,喜欢钻研,具有良好的学习能力并注重团队合作。
-
工作职责 1.异常分析处理,快速恢复应用系统故障,确保业务正常进行; 2.主动预防,分析公共平台类应用的运行趋势,找出潜在问题并防止其发生; 3.从运维角度评估应用架构可用性、变更风险,确保运行稳定; 4.梳理设计实施应用监控,完善应用监控体系; 5.使用AI等自动化运营脚本或工具开发,提升工作效率和质量。 任职要求 1.计算机相关专业,大学本科及以上学历; 2.一年以上软件开发或者运维工作经验,有金融系统运维经验优先; 3.熟悉以下技术中的两种或以上: 1)Oracle,PostgreSQL或者Mysql数据库性能优化技术; 2)Linux的操作、维护,了解Linux内核性能优化原理; 3)SpringBoot等微服务平台架构以及应用程序的开发技术及流程,或者Python、Go等语言开发技术; 4)Tomcat,Nginx或国产信创应用中间件的配置和维护; 5)k8s容器平台或者云计算、云网络、云存储等运维优化能力; 6)Hadoop,Hive,Spark或者Flink等大数据相关运维优化能力; 7)掌握应用运维领域的AI工程化能力。 4.责任心强,工作积极主动,有较好的沟通协调能力,有良好的心理素质; 5.自驱,具备较强的问题分析能力和解决能力;用大型平台类系统运维或非功能需求优化经验优先。
-
岗位职责: 1.负责服务器的日常巡检与状态监控,配置告警; 2. 负责部署和维护基础服务(如emqx、MySQL、Redis),负责应用系统的安装; 3. 负责制定应急响应预案。使用监控工具实现对业务、性能、告警进行配置和优化; 4. 处理开发反馈的技术问题,通过日志分析定位故障原因; 5. 参与开发Devops相关工具,提升团队效能; 6. 负责交付现场的路由器、防火墙等的配置工作。 任职要求: 1. 计算机、电子信息、电气自动化等相关专业,本科及以上学历,5年以上工作经验; 2. 必须有Python开发经验; 3. 熟悉Linux操作系统,有国产操作系统运维经验优先,有Arm等嵌入式设备经验优先; 4. 掌握TCP/IP协议、DNS、HTTP等网络基础知识,能排查网络问题。 5. 熟悉Emqx的部署与配置,了解MySQL/Redis的安装和配置工作; 6.熟悉Kubernetes集群架构和日常维护操作。 7.加分项:熟悉工控系统(如SCADA)或电力行业知识。
-
【岗位职责】 1. 负责业务系统运维保障,通过持续优化技术架构,提升系统安全性、稳定性、高效性及易用性,支持业务和数据规模快速增长; 2. 负责建立和完善规范化的运维服务体系; 3. 负责线上问题排查,紧急故障处理,后续故障分析与优化; 4. 持续推动运维质量提升:SLA、多活容灾、故障演练、监控告警、容量管理等; 5. 结合部门需求,规划和管理各类型硬件和服务资源。 【任职要求】 1. 深入理解Linux系统,具备内核及系统参数调优经验; 2. 熟悉云原生 K8s 生态,具备生产环境落地及运维经验,有大规模 K8s 集群设计和管理经验者优先 3. 熟悉 Shell 或 Lua 等运维脚本编程,至少掌握一种脚本语言; 4. 熟悉常见中间件(如 Nginx、Redis、RabbitMQ、Kafka、Prometheus等)及数据库(如Postgres); 5. 熟悉大型分布式系统,微服务架构有日常维护和故障处理经验; 6. 具备网络基础知识,了解常见网络设备(如交换机、路由器等)的配置与优化。 【加分项】 1. 具有较强的责任心、安全意识、抗压能力及优秀的执行力; 2. 持有K8s认证(CKA/CKAD)或云平台专业认证; 3. 熟悉综合布线技术,了解网络组网原理及实施流程。 【工作模式】 - 需参与on-call轮值,处理紧急技术问题
-
1、负责生产系统应用运维工作,包括应用监控、持续交付、应急响应、容量规划和安全漏洞修复等,保障应用系统安全稳定运行; 2、负责评估应用系统运行状态和性能,发现风险和隐患,推动应用系统架构优化; 3、推广应用领域自动化工具使用,提升应用运维效率和质量; 4、负责故障处理,分析定位原因并解决; 5、负责网络安全、系统安全监控运维,安全事件的响应与处理。负责高危漏洞验证、预警和加固。 要求: 1、计算机相关专业,本科以上学历; 2、5年以上应用运维经验;具备丰富的应用系统运维、故障处理经验,熟悉公有云资源的产品服务; 3、熟悉各类主流中间件使用,如tomcat/zookeeper/nginx等,熟悉JVM GC原理并调优,熟悉主流微服务框架,有大型复杂系统的运维经验优先; 5、熟悉Linux操作系统并优化,熟悉Shell/python脚本编写。熟悉使用vim、awk、sed等文本处理工具,熟悉HTTP协议、TCP/IP网络协议; 6、熟悉常用的监控系统如Prometheus 、zabbix等,熟悉APM工具如skywalking等; 7、熟悉自动化运维工具,如salt、ansible等,熟悉CI/CD工具,如jenkins,有kubernetes、docker生产运维经验,熟悉阿里云平台使用; 8、熟悉主流信息安全产品和技术,包括:防火墙、VPN、堡垒机、漏洞扫描、安全审计等。 9、熟悉主流网络攻击技术、方法和原理,及其防御方案; 9、责任心强,具备较强的问题分析能力、沟通能力和团队协作能力,善于学习新技术,有良好的文档编写习惯,有各类运维证书优先,如RHCA。
-
专科及以上学历,满足三年以上弱电或电信行业工作经验,计算机、通信 及相关专业专科或以上学历,具有安防、通信系统维护经验,熟悉至少两个电信专业系统,具备相应的沟通能力和技术能力,能够较快熟 悉业务流程、技术细节,可独立完成日常系统运维工作。
-
*参与客户环境的运维,包括但不限于健康检查,问题优化,系统升级等 *接收需求分析,制定变更方案,及时实施变更 *参与7*24 生产运行的应急响应和处置 *轮流参与7*24小时现场值班、节假日值班K 重要保障期间值班等 招聘要求: *本科及以上学历: *和计算机、通讯、自动化相关的理工科专业; *4年以上的工作经验: *具有良好的操作系统基础,熟悉linux系统,能够熟练的使用Linux中常见得分析工具,如:top,iostat, tcpdump等; *熟悉Puppet/Ansible等自动化运维工具 *良好的沟通能力和团队合作能力; *良好的学习能力,优秀的文档编写能力; 加分项: *拥有3年以上运维OpenStack环境的工作经验; *参与过1个或1个以上大型金融公司的一线运维工作; *拥有Ceph相关运维经验者
-
1、运维平台监控开发与优化:使用 Go 语言和 Java 进行运维平台监控模块的设计与开发,依据业务需求持续优化监控功能,保证监控数据的精准与实时。 2、告警能力完善:基于对 Prometheus、Thanos 及周边生态组件的熟悉,搭建并完善告警体系,设定合理的告警阈值,实现告警信息的及时准确推送。 3、K8S 集群相关运维:负责 Kubernetes 集群的日常运维工作,涵盖集群部署、扩缩容操作,以及针对集群运行中出现的故障进行排查与修复,维持集群的稳定运作。 4、监控数据处理与分析:深入分析运维平台监控数据,敏锐察觉潜在的系统问题与性能瓶颈,提出切实可行的优化方案。 5、自动化运维脚本开发:编写自动化运维脚本,运用 Go 语言或 Java 实现运维流程的自动化,提升运维效率,降低人为操作失误。 6、跨团队协作:与开发团队、产品团队紧密协作,积极参与项目推进,确保运维工作与整体业务发展目标相契合。 1、技术能力:熟练掌握 Go 语言和 Java 编程,拥有扎实的编程功底与良好的代码编写规范;熟悉 Kubernetes(K8S)原理与操作,能熟练开展集群管理与故障排查;精通 Prometheus、Thanos 及周边生态组件的使用。 2、问题解决能力:具备出色的问题分析与解决能力,能够迅速定位并处理运维过程中产生的各类技术难题。 3、团队协作能力:拥有良好的沟通和团队协作能力,能够积极主动地与其他团队成员协同合作,共同达成工作目标。 4、学习能力:对新技术充满热情,具备快速学习能力,能够及时跟进运维领域的最新技术动态并应用于实际s工作。 本科以上学历及工作经验:计算机科学、软件工程等相关专业毕业优先,博士1年及以上,硕士3年及以上,本科5年及以上,大专6年及以上运维技术开发经验,有实际的运维平台监控系统开发、告警体系搭建或 K8S 集群运维项目经验者优先
-
#### **职位描述** 我们寻找一位具有3年以上经验的运维专家,深度熟悉主流云平台(如AWS、Azure、GCP、阿里云、腾讯云),能够设计、优化并保障高可用云架构,推动自动化与DevOps实践,确保系统安全、稳定、高效运行。 --- #### **核心职责** 1. **云架构与运维** - 设计、部署及维护跨多云/混合云架构,确保业务高可用性及灾备能力。 - 优化云资源配置,实施成本监控与节约策略(如预留实例、弹性伸缩)。 2. **自动化与DevOps** - 使用Terraform、Ansible等工具实现IaC(基础设施即代码),构建CI/CD流水线(Jenkins/GitLab CI)。 - 管理容器化环境(Kubernetes/Docker),熟悉Service Mesh(如Istio)为加分项。 3. **监控与安全** - 搭建全链路监控体系(Prometheus/Grafana + ELK日志系统),实现异常预警与快速定位。 - 制定安全策略,管理漏洞、访问权限,确保符合GDPR/HIPAA等合规要求。 4. **协作与优化** - 与开发团队协作优化微服务架构性能,参与容量规划与容量测试。 - 主导故障根因分析,输出SOP文档,提升团队应急响应能力。 --- #### **硬性要求** - **经验**:3年以上生产环境运维经验,至少精通2个主流云平台(需举例项目经验)。 - **技术栈**: - 熟练使用至少一种编程语言(Python/Go/Shell)。 - 精通Kubernetes及周边生态(Helm/Operator等)。 - 熟悉网络架构(VPC/负载均衡/CDN)及安全实践(WAF/IAM)。 - **工具链**: - 自动化:Terraform/Ansible + CI/CD工具。 - 监控:Prometheus/Zabbix + 日志分析(ELK/Splunk)。 #### **优先条件** - 持有AWS/Azure/阿里云专家级认证。 - 具备百万级用户系统或复杂分布式系统运维经验。 - 熟悉FinOps理念,有云成本优化成功案例。 --- #### **团队与文化** - **远程协作**:支持部分时间远程办公,提供弹性工作时间。 - **成长支持**:全额报销云认证考试费用,定期技术沙龙分享。 - **技术影响力**:鼓励参与开源项目,提供国际会议交流机会。 --- #### **招聘流程** 1. **简历初筛**(附云项目案例优先)→ 2. **技术面试**(场景题+架构设计)→ 3. **实操测试**(故障排查/脚本编写)→ 4. **综合评估**(团队匹配度)→ 5. Offer --- #### **为什么选择我们?** - 参与亿级流量项目,技术栈前沿(如Serverless/边缘计算)。 - 扁平化管理,技术驱动决策,拒绝重复性运维工作。 - 年薪范围:40-80W(根据能力可谈)+ 期权激励。 --- **提示**:若您擅长将复杂运维问题系统化、产品化,并追求技术深度与业务价值的结合,我们期待您的加入! --- ### 优化点说明: 1. **突出技术深度**:强调云原生、K8s、安全合规等高阶技能,过滤初级候选人。 2. **结果导向描述**:要求提供项目案例,聚焦实际能力而非工具罗列。 3. **差异化福利**:远程办公、技术影响力建设,吸引优质人才。 4. **精准渠道建议**:除主流平台外,可同步发布至K8s社区、云厂商人才库。 可根据公司实际情况调整细节,如加入行业特定要求(如金融云合规经验)。
-
1、数据库管理: -安装、配置和维护数据库系统(如MySQLPostgreSQL、MongoDB等)。 -监控数据库性能,进行性能调优,确保数据库的高效运行。 -实施和管理数据库备份和恢复策略,确保数据的完整性和可恢复性。 -进行数据库安全管理,防止未经授权的访问和数据泄露。 2、服务监控-配置和管理监控系统(如Prometheus、ZabbixNagios等),监控服务器和服务的运行状态-设置告警规则,及时发现和响应系统故障和性能问题。分析监控数据,生成报告,提出系统优化建议。 3、自动化运维编写和维护自动化脚本,提高数据库和服务管理的效率 。-使用自动化工具进行配置管理和部署,减少人为操作失误。 4、故障排除与支持-及时响应和解决数据库和服务的故障,提供技术支持。分析和解决系统性能问题,优化系统性能 5、文档编写与管理-编写和维护数据库和服务的配置文档、操作手册和故障排除指南记录和跟踪系统变更,确保变更的可追溯性 6、协作与沟通-与开发团队、测试团队和其他相关部门协作,确保数据库和服务的顺利运行。-与供应商和服务提供商沟通,解决硬件和软件问题。 任职要求: 1、计算机科学、信息技术或相关专业本科及以上学历。 2、至少具备1-3年数据库管理和服务监控相关工作经验-熟悉MySQL、PostgreSQL、MongoDB等数据库的安装、配置、维护和性能调优。-熟悉Prometheus、Zabbix、Nagios等监控工具的配置和管理-熟悉Linux操作系统,具备良好的Shell脚本编写能力。 3、需具备安全防范意识及工作责任心。 其它: 1、具有竞争力的薪酬,提供13薪+年终奖; 2、依法缴纳五险一金,周末双休; 3、全天供应零食、饮料,定期团建聚餐; 4、免费提供午、晚餐; 5、年轻化团队,氛围开放、包容。
-
1、有多年的系统运维、数据库DBA、安全管理经验。尤其在防火墙配置、Nginx、PHP、系统监控、堡垒机等、要有相关经验。 2、精通Python、PHP语言,有丰富的开发经验。 3、做事细致、责任心强 4、有较强的学习能力
-
岗位说明: 此岗位需要接受去日本长期出差,在日期间将提供全程生活管家服务。 薪资待遇: 1、工资为40〜100万日元/月(内含40小时加班费),具体待遇需根据面试结果,视个人技术能力决定; 2、低于40小时加班的话,依然支付40小时的固定加班费(目前公司的加班状况为月平均10-20小时)。加班费:包含平日,周六,休日,祝日,深夜加班; 3、每月有绩效评价,月评绩效会影响年终绩效评价,从⽽影响年终奖的发放金额,当月15日以后⼊职不参与评价。技术能力达不到要求,产出,违返公司规章制度,迟到早退严重,没有按照着装要求着装等,有可能导致绩效评价等级降档; 4、试用期为入社日开始的3个月,3个月过后如果绩效评价不好,可能会延期3个月试用期,试用期期间的工资为80%(15日之前入职,当月算试用期第一个月;15日之后⼊职,试⽤期为15日-30日以及次月开始的3个月); 5、年终奖1回(视个⼈绩效情况,0-3个月基本工资),6月份以后⼊职的,当年不发生年终奖。 6、上下班交通费实费报销,上限2万日元; 7、入社6个月后10天带薪休假(法定); 8、工作时间10点-19点; 9、周末双休(年中有1次或2次周六出勤),祝日休,大型连休,具体参考公司年度日历; 10、社会保险:厚生年金(养老金)、劳灾保险(工伤)、雇佣保险(失业)、健康保险(医疗)完备。 岗位职责: 1、负责公有云应用架构的规划及设计; 2、负责公有云SaaS服务的技术调研、选型及推广应用; 3、负责公有云IAM账号权限设计和分配管理; 4、负责公有云成本管理、资源管理、成本化化; 5、负责公有云各SaaS服务的监控、告警及日志等; 6、配合业务工程师完成业务上云、资源分配、账号分配等工作; 7、参与日常项目工作,负责业务上云前期规划、选型和配合工作。 任职要求: 1、学信网可查的**本科以上学历,计算机或相关专业,5年以上相关工作经验; 2、具有AWS、GCP、Azure等公有云应用经验(非简单EC2应用); 3、能熟练使用Terrform、AWS CloudFormation、Ansible等工具,并有应用经验; 4、熟悉公有云网络,有规划VPC、VGW、NAT网关、VPN、对等连接等相关经验,有混合云连接经验; 5、熟悉公有云Container服务,如AWS EKS、GCP GKE等,能快速跟据需求调度集群; 6、熟悉公有云负载均衡服务,如AWS ELB、GCP CLB等,能够基于业务需求快速配置相应实例; 7、熟悉AWS Route 53、GCP Cloud DNS等服务; 8、熟悉常用的CDN服务,如CloudFront、Cloud CDN、Cloudflare、Akamai等; 9、具有将日常工作工程化的能力优先; 10、主动学习能力强、较好的问题分析与解决能力、抗压性强,良好的沟通协调能力和团队合作精神。
-
工作职责: 1. 负责运维体系工具需求梳理、架构设计和开发实现。 2. 配合规划、整合、完善现有IT运维工具链。 3. 配合项目组、应用厂商解决应用系统异常、故障、性能等相关问题。 4. 协助优化整合现有云平台运维相关工具,并进行迭代优化。 5. 协助建设维护业务监控和应用底座。 6. 编写和整理相关设计及接口设计文档。 任职资格: 1、有云平台相关建设经验,有实际云数据中心建设、运维经验者优先。 3、3年以上运维开发工作经验,熟练运用Golang或Python其中一种语言,熟悉至少一种go或者Python的web框架。 4、熟悉Mysql、Mongo等数据库。 5、熟练掌握Openstack、Kubernetes、Docker、Service Mesh等至少一种。 6、能够独立解决问题,能够主动学习和探索新的解决方法和思路。 6、具备较强的问题解决能力,能够主动思考,自学能力强。
-
岗位职责: 1、负责快手CDN平台建设和运维管理工作; 2、负责快手CDN监控系统、自动化运维系统的部署、维护工作; 3、负责快手CDN整体质量和稳定性保障工作; 4、负责快手动态加速、边缘计算等业务基础支持工作; 5、负责快手CDN成本优化相关工作。 任职要求: 1、本科以上学历,计算机或相关专业,2年以上CDN厂商运维或技术支持相关经验; 2、精通Linux、熟悉tcp/ip、http协议、quic协议及主流web server; 3、熟悉nginx、squid、lighttpd等开业软件; 4、具备较强的问题分析、排查、解决和沟通协调能力,善于跨部门沟通; 5、做事认真、仔细、负责,具备一定的抗压能力,可以做到7*24响应处理各类应急事件; 6、掌握Shell、python、go等至少一门语言; 7、了解P2P协议、P2P网络架构,有性能优化相关经验优先,有过CDN/P2P开发经验优先。


