• 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 关于我们: 我们是业务中台-SRE团队,我们正在负责字节跳动多个业务线如抖音搜索、抖音生活服务、今日头条、教育等多个应用的稳定性工作,通过MTTR治理、故障预防、容灾演练、机房建设等多个技术手段,保证多款核心业务高质量服务水平。 业务挑战: 我们团队需要支撑多个不同阶段的业务线,抖音搜索、抖音生活服务在业务复杂度、迭代速度、数据规模同样在快速增长,需要逐一突破每个业务不同的稳定性痛点,逐步成为字节中国业务稳定性优秀团队。 技术挑战: 在横向方面,我们要面向多个业务线探索通用的SRE解决方案,主导SRE技术方向在不同阶段的业务落地; 在纵向方向,我们要深入到业务中,深挖业务的痛点,面向多机房容灾等难题,为业务量身定制不同的稳定性解决方案。 1、持续支撑抖音搜索、抖音生活服务、今日头条等多条业务日常稳定性保障,构建并优化可观测性大盘,积极参与响应和应急,持续提升MTTR和SLA; 2、参与SRE技术平台研发,提升运维效率,推动风险治理,不限于监控告警、变更管控、风险巡检、预案演练、资源管理、成本优化等方向,强化通用化SRE技术能力; 3、参与热点流量、春节活动、营销活动稳定性保障,引导 SRE 运维工作朝着自动化、平台化、智能化方向演进,提升基础架构各组件体系整体运维管理效率。 职位要求: 1、本科及以上学历,计算机相关专业, 并有2年以上互联网运维工作经验; 2、扎实的计算机软件基础知识,了解 Linux 操作系统、存储、网络 IO等相关原理; 3、熟悉一种或多种编程语言,如 Python/Go/Java/Shell/C++等; 4、具备系统化解决问题的能力,良好的沟通技巧和主人翁责任感; 5、具有接入/计算/存储等相关系统经验优先(Nginx/Kubernetes/Docker/Redis/Mysql/RMQ 等)。
  • 25k-50k·15薪 经验5-10年 / 本科
    在线教育 / C轮 / 2000人以上
    工作职责 1.负责系统平台运维工作,包括环境部署、故障排查、架构优化、核心链路服务稳定性建设等相关工作; 2.实现分布式集群的高可用运维,制定业务相关的运维技术方案,确保业务高效稳定的运行; 3.负责应用监控和告警方案的设计,实现快速发现线上问题并协助定位问题; 4.参与重大活动和产品的设计过程,对技术风险领域进行评审和分析; 5.参与设计、开发提高稳定性、工程效率、资源效率的相关运维自动化工具与平台; 6.应用相关技术实现运维成本控制,优化并提升资源利用率,通过技术手段完成高效运维服务支持。 任职资格 1.计算机相关专业,本科及以上学历,至少3年以上的大规模系统运维经验; 2.熟悉Linux、Docker、K8S运维,有K8S平台服务编排、性能调优、监控、故障诊断等实践经验; 3.掌握Nginx,Redis,消息队列,分布式服务调用框架等基础组件,有微服务架构经验及Istio等云原生技术栈能力尤佳; 4.有devops开发经验或有中大型互联网公司运维自动化经验者优先; 5.熟悉TCP/IP、HTTP等协议,有良好的网络、数据传输、安全、计算机体系结构方面的知识; 6.熟练使用公有云产品,包括不限于阿里云、腾讯云、AWS等; 7.掌握python/shell/golang/java等任意一种以上的编程语言,有运维自动化开发经验为加分项; 8.良好的沟通表达能力、技术文档编写能力; 9.能够自主思考,具有自驱动性,对于新技术保持兴趣。
  • 15k-25k 经验1-3年 / 本科
    软件服务|咨询,区块链,IT技术服务|咨询 / 不需要融资 / 15-50人
    岗位职责: 1.与系统开发团队合作,日常网络故障的分析和处理,保证系统基础架构的正常运行,对大规模集群进行运维,更新和保障; 2.熟悉python、shell、sql等脚本编程,可熟练编写脚本,熟悉主流数据库的使用,并熟练掌握sql语句; 3.负责云安全产品的运维服务工作; 4.主动发现生产环境的问题和隐患,通过开源运维工具或自研运维工具提高公司运维交付能力 5.能够运用主机监控、日志分析、APM、常用系统性能分析命令等工具进行复杂问题定位,快速响应和处理反馈的问题。 6.快速处理实际运行中遇到的各种系统故障,并对系统可能出现的故障问题进行预防; 7.能够独立排查shell或pyhon脚本运行过程中的各种问题; 8.熟悉主流的计算、存储资源虚拟化技术,具备搭建和维护的实践经验; 任职要求: 1.本科及以上学历,计算机相关专业优先,扎实的计算机软件基础,具有对区块链、公链环境搭建有一定部署的优先; 2.良好的团队协作能力,能够在压力下工作; 3.精通 Linux操作系统,有Linux内核调优经验者优先; 4.熟悉 Windows、Linux系统及常见服务的安装配置优化,熟悉常见的负载均衡实现方案并有实际实施经验如Hpox、 Nginx、DNS,LDAP,Kerberos等; 5.能从独立搭建运维服务包括但不限于:jumpserver,k8s docker,jenkins,devops,wayne,VPN,LDAP; 6.能从独立搭建工具服务包括但不限于:gitlab,yapi,confluence,jira; 7.熟悉操作系统,运维相关技术,包括运维自动化技术,虚拟化技术,监控技术,容器技术等;能熟练编写Shell或 Python脚本; 8.熟悉服务器硬件安装与调优,能够熟练排查运维过程中出现的各种服务故障、系统故障、网络故障、安全攻击等问题,并进行快速处理响应; 9、有大型数据中心工作经验者优先; 提示:后期需要两班倒
  • 25k-35k 经验5-10年 / 本科
    居住服务 / C轮 / 2000人以上
    岗位职责 1、通过设计及监控可用性,延时等服务整体健康性指标,来运维线上服务 2、负责线上系统的可靠性改进,工作包括主导SLI/SLO制定,监控改进,容量管理,变更管理,应急响应,故障演练,OP改进等各种提升可靠性工作 3、保障云原生/分布式存储/消息中心/注册中心等多个核心系统的可靠性与正常运行,同时关注系统成本与稳定性; 4、负责自如网的核心基础设施架构设计、研发和持续交付 任职要求 1、大学本科及以上学历,3年以上运维工作经验; 2、具有云原生相关组件/分布式存储/消息中心/注册中心等系统运维经验(Nginx/Kubernetes/MQ/ZK/ETCD/Ceph等) 3、熟悉go、python等常用运维开发语言及框架; 4、熟悉主流容器化技术,具备Kubernetes使用经验; 5、有丰富的系统运维经验,对常见的系统隐患、系统故障有系统性总结和实际处理经验; 加分项 1、有自动化构建系统、配置管理、CI/CD系统、监控报警等自动化运维平台建设经验者优先; 2、有ServiceMesh使用维护经验者优先;
  • 12k-20k 经验3-5年 / 硕士
    IT技术服务|咨询,信息安全,软件服务|咨询 / 不需要融资 / 2000人以上
    职位描述: 1. 负责数据中心运维管理工具的架构设计及系统建设,保证系统完整、可用; 2. 负责编制数据中心运维工具系统的运行维护方案、计划、手册及应急预案; 3. 负责数据中心运维管理相关系统及系统依赖的数据库、中间件的运行和维护; 4. 负责数据中心运维管理系统设备的部署、备份、恢复、系统优化、策略调整、监控、巡检、**防范、补丁更新,对系统故障或异常进行快速响应和修复,保证业务连续性。 5. 负责设计、开发和维护自动化工具和脚本,提高运维效率和系统稳定性。 6. 定期进行数据库、中间件、服务器和操作系统等相关知识培训,制作相关培训文档、课件。 职位要求: 1. 熟练掌握Nginx,HAproxy,Keepalive,Redis,Kafaka,Zabbix,Prometheus,Mysql等软件的安装部署、配置、优化。 2. 熟练掌握WINDOWS、LINUX操作系统的安装、系统优化、**防护和故障处理,熟练掌握服务器的配置和管理; 3. 掌握一门以上脚本语言Python/Shell/Powershell,熟悉自动化运维方案及技术。 4. 熟悉CI/CD持续集成、部署和交付,熟悉Jenkins、Gitlab等。 5. 具有良好的主观能动性、沟通意识、服务意识,现场协调能力; 6. 性格稳重、有责任心、具有良好的职业道德,能保守企业秘密; 7. 了解ISO27001、ISO20000管理标准的要求; 8. 熟悉大型数据中心动力环境监控、电力系统监控的部署、运维者优先; 9. 有相关工作经验者优先。
  • 15k-25k 经验3-5年 / 本科
    科技金融,IT技术服务|咨询 / 未融资 / 150-500人
    岗位职责: 1、参与软件产品的需求分析、概要设计、详细设计等工作,协助系统架构设计师进行系统架构设计工作; 2、负责相关业务模块的开发、评审、部署、测试、维护以及相应文档的编写,对代码质量及开发进度负责: 3、负责开发和提炼公共组件、产品性能优化、安全问题解决等工作; 4、必须具备接口设计、数据库设计、工作量评估、任务分解、代码评审、总结培训、知识库文档撰写等能力; 5、能够具备需求文档编写、前端开发、测试用例编写、测试工具使用等能力优先; 任职要求: 1、教育背景:计算机相关专业本科及以上学历; 2、专业领域经验:3年以上 J2EE 开发经验,有分布式系统、微服务模块设计经验; 3、熟悉互联网供应链金融业务,具备3年或以上金融行业系统开发经验优先; 4、具备银行信贷系统、供应链系统开发经验优先,具备银行风险管理系统开发经验优先; 5、工作所需技能: 1) 熟悉大数据量、高并发、高性能的分布式系统及微服务的设计,调优; 2) 熟练使用 Spring、SpringBoot、SpringCloud、MyBatis 等主流开源框架; 3) 熟练使用 Tomcat、Nginx、Redis、rabbitmq 消息队列等中间件; 4) 熟练掌握 MySQL,Oracle、mongodb 等主流数据库,有数据库设计经验; 6、职业行为能力:具备较好的沟通、理解、表达、逻辑能力、学习能力和执行力。 注:该岗位可接受春节后入职。候选人需可接受适当出差或项目驻场(公司有相关补贴)。
  • 新能源汽车制造 / 未融资 / 2000人以上
    工作职责: 1、负责公司数据平台产品的需求分析以及系统设计; 2、负责子版本的迭代功能的设计与开发; 3、根据开发过程中遇到的各类问题和潜在风险,对产品提出改进建议。 4、具有数据平台系统开发经验者优先。 经验要求: 1、3年以上的java技术战的开发经验,熟悉Spring Boot,具备分布式架构系统开发经验者优先; 2、优秀的数据库设计和优化能力,熟悉Mysql,Redis,ES,Doris者优先; 4、熟悉Linux、Nginx、Bash、Python者优先; 能力要求: 1、具备产品思维,良好的沟通能力和团队意识; 2、具备良好的时间管理和流程意识,善于学习,可快速适应新项目新技术; 3、具备前端或是开放平台设计及开发经验优先。
  • 25k-35k 经验3-5年 / 不限
    移动互联网,广告营销 / 上市公司 / 2000人以上
    岗位职责: 1.负责搜狐智能媒体垂直业务服务端研发;2.对业务需求进行技术方案设计、实现以及优化,持续提升服务性能和稳定性,承接用户端流量;3.改进和优化开发流程、技术框架、服务设施性能;4.跟踪新技术发展并运用到实际项目中。 任职资格: 1.**本科以上学历,计算机科学、电子工程、信息工程或其它相关理工科专业学士以上学位,有2年以上互联网服务端开发经验;2.Java基础扎实,熟悉主流的Java开发框架,如SpringBoot,Mybatis,gRPC等;3.熟练使用MySQL、Redis的使用,并了解其原理,具备SQL调优经验;4.熟悉Linux、Tomcat,Nginx等开源的服务器和Web服务中间件,有调优经验;5.对Hadoop,Hbase,Hive有一定的了解;6.责任心强,有良好的沟通能力,团队合作能力以及推进工作执行能力。
  • 25k-35k·13薪 经验5-10年 / 本科
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    职位描述: 1,负责Centos等主流linux操作系统的运维管理,负责日常运维工作、系统优化等工作。 1,熟悉运维相关技术,包括运维自动化技术、私有云、公有云、监控技术,网络技术等。 2,数据存储相关服务维护(如mysql、fdfs、redis等),监控及性能优化,维护生产环境的稳定性和扩展性。 4,建立数据库相关标准和流程、不断完善灾难应对机制,保证数据安全及服务的可用性。 5,能够较好地协调、推进跨部门的相关工作。 职位要求: 1,在中大型互联网公司或相关公司3年以上工作经验,具有大型互联网、金融、电商类公司工作经验者优先。 2,熟悉Linux的体系结构,熟悉Shell/Python/Go/C/PHP等语言中的一种或多种,能够自主开发运维自动化工具和运维系统; 3,具有nginx、tomcat、java、docker、k8s等服务的实际维护经验。 4,熟悉数据库mysql高可用、集群、容灾及备份恢复方案。 5,能够主导数据库mysql架构及部署方案的设计及优化、性能优化、确保数据库稳定高效运行。 6,具备良好的团队意识及高度的责任感,具有较强学习能力和工作主动性。
  • 25k-30k 经验5-10年 / 本科
    科技金融 / 不需要融资 / 2000人以上
    工熟练使用Linux常用操作命令,具备系统运行环境搭建及应用部署能力; 熟练使用MySQL、Oracle等常用数据库,具备数据库设计、开发和性能优化经验; 熟悉使用Tomcat、Nginx、Docker等工具和技术的使用; 具有系统运维支持经验优先; 具有良好的沟通协调能力;作职责: 任职资格: 1、本科及以上 2、3-8年工作经验
  • 15k-18k·16薪 经验5-10年 / 本科
    IT技术服务|咨询 / 未融资 / 50-150人
    岗位职责: (1)负责公司民生卡相关产品软件的系统运维,主要负责业务系统日常监控、日志分析、链路追踪、问题排错、系统优化、CI\CD等工作; (2)负责Nginx、Elasticsearch、Jenkins、Kafka、Redis集群、Mysql、SkyWalking等各种中间件的运维支持、性能调优、监控、故障诊断等工作; (3)负责自动化运维工具或平台的建设及实现,并可根据新需求持续迭代工具; (4)负责业务系统的二次迭代和功能优化开发; (5)负责应用监控、应用告警、日志监控、链路追踪、性能分析等相关方向工具调研工作; (6)对应用的运维情况进行总结、汇报,提炼形成运维知识库以及相关运维文档; (7)负责领导交办的其他工作。 任职资格: (1)本科及以上学历,计算机相关专业,5年以上相关岗位工作经验; (2)熟练掌握Docker、Kubernetes等容器技术、熟悉Prometheus、grafana等监控产品、ELK日志分析、链路追踪、Ansible自动运维等自动化相关产品和技术; (3)熟练掌握Java语言,基础扎实,熟悉多线程、分布式、缓存、消息等机制; (4)熟悉spring cloud微服务体系,熟练使用nacos、Mybatis、Redis、ES、MQ、kafka、mysql等常用中间件,熟悉公有云服务,能够熟练使用相关组件; (5)熟悉Linux操作系统原理,熟练使用Shell或Python语言,理解常用网络协议原理; (6)有主动推进问题的主观能动性和较强的逻辑思维能力、自我学习能力。
  • 20k-35k·14薪 经验3-5年 / 本科
    金融 / 未融资 / 500-2000人
    工作职责: 1、运维保障:通过不断优化技术架构,为业务提供安全、稳定,高效,易用的数据服务能力,支撑业务和数据量的快速扩张; 2、高可用能力保障:沉淀业务保障关键能力,如应急响应、故障恢复,健康巡检,变更管控,日常演练等; 3、自动化能力提升:负责内外部系统的日常管理和运维,利用自动化手段解决运维平台问题,提高其他部门生产力; 4、CI/DC能力提升:维护并改善CI/CD流程, 参与设计 CT (continuous testing) 流程,实现监控告警和故障恢复自动化; 5、运维平台开发&技术调研:CMDB、系统运维自动化平台、自动化业务监控平台、自动化工单系统、Devops平台开发;相关技术调研与文档输出。 任职要求: 1、拥有三年以上的 Golang 和 Python 3.x 实际开发经验;拥生产环境Swarm/k8s/nomad 容器管理经验; 2、熟悉Linux (Ubuntu 优先)常用运维工具,熟练使用 bash , 熟悉 sysctl 配置, 了解重要系统指标监控和解读; 3、拥有生产环境使用 Prometheus 、Zabbix经验, 包括部署, 使用和调优;拥有生产环境lvs等流量转发工具、nginx等服务代理或者服务网关等组件运维与自动化经验; 4、有 Kafka,Etcd,Zookeeper,RabbitMQ生产环境部署, 使用和调优经验;具有真实的CMDB、自动化平台、监控平台、工单系统、Devops开发经验; 5、熟练使用 ELK 平台和相关工具;具有良好的文档编写能力与跨部门沟通能力。
  • 15k-30k·15薪 经验1-3年 / 本科
    金融业 / 不需要融资 / 50-150人
    岗位描述: 1、参与公司核心业务系统架构设计和开发工作 岗位要求: 1、2 年以上 PHP 开发经验,有高并发场景的实际项目经验,具备大型互联网产品开发经验优先 2、熟练掌握至少一种 MVC 框架,熟悉 Swoft、Hyperf 等框架优先。 3、具有 MySQL 数据库设计、索引优化、查询优化经验。 4、熟悉 memcache,redis,mongodb 等常用 nosql 解决方案,了解各自的优缺点及使用场 景; 5、分布式研发经验优先,对 nginx、redis、MQ、RPC 等能够独立思考和应用; 6、有高负载、大并发的系统结构、调试、排错、优化、部署等方面经验优先; 7、良好的沟通技能,团队合作能力
  • 15k-25k·15薪 经验3-5年 / 本科
    其他,金融 / 不需要融资 / 2000人以上
    岗位职责: 1、负责系统管理,包括系统软件(含中间件)的安装,配置,管理和备份等服务及应用系统日常处理服务等; 2、负责机房相关设备管理,如服务器、存储、一体机、机柜等设备; 3、负责监控、备份管理,包括基础设施、应用系统等资源数据; 4、基础设施中容器(Docker&Kubernetes)环境的安装设置,管理和维护; 5、基础设施相关的采购工作; 6、基础设施相关的项目管理; 7、与其它团队或者部门进行协调沟通工作。 职位要求: 1、精通Linux、Windows操作系统基本原理,掌握负载均衡、高可用等常用概念; 2、具备RHCE、RHCA、PMP等相关认证者优先; 3、熟悉常用WEB中间件,如weblogic、tomcat、nginx、apache等; 4、熟悉常用系统服务,如Redis、Mq、consul、等服务; 5、熟悉常用配置管理工具,如svn、git、maven、jekins、ansible等工具; 6、熟悉常用监控工作,如zabbix,cacti,Prometheus等; 7、熟悉云计算相关技术,如:KVM、Vmware、Docker、K8S等软件 8、具备独立写脚本的能力,如shell、python; 9、技术出众有特点,对云计算、自动化、分布式等新技术有探究; 10、管理经验强,要知识面广且有较多项目实践经验。
  • 25k-50k 经验5-10年 / 本科
    短视频 / 上市公司 / 2000人以上
    岗位职责: 1、负责快手CDN平台建设和运维管理工作; 2、负责快手CDN监控系统、自动化运维系统的部署、维护工作; 3、负责快手CDN整体质量和稳定性保障工作; 4、负责快手动态加速、边缘计算等业务基础支持工作; 5、负责快手CDN成本优化相关工作。 任职要求: 1、本科以上学历,计算机或相关专业,2年以上CDN厂商运维或技术支持相关经验; 2、精通Linux、熟悉tcp/ip、http协议、quic协议及主流web server; 3、熟悉nginx、squid、lighttpd等开业软件; 4、具备较强的问题分析、排查、解决和沟通协调能力,善于跨部门沟通; 5、做事认真、仔细、负责,具备一定的抗压能力,可以做到7*24响应处理各类应急事件; 6、掌握Shell、python、go等至少一门语言; 7、了解P2P协议、P2P网络架构,有性能优化相关经验优先,有过CDN/P2P开发经验优先。