-
职位职责: 1、负责字节跳动数据中心网络P4网关产品交付和线上运维工作,提供超大集群网关服务能力和保证线上稳定运行; 2、负责网关类产品稳定性方案设计和能力建设,包括监控、告警、应急响应、运维数据分析,风险治理等; 3、负责网关类产品运维流程和规划的制定和优化,持续提升交付、变更、运维效率。 职位要求: 1、计算机相关专业,本科以上学历,具备扎实的计算机体系知识; 2、熟悉常见网络协议,比如TCP/IP、BGP、VXLAN、GRE等; 3、熟悉VPC、负载均衡、云企业网、专线连接等公有云网络产品优先; 4、具备良好的现网意识,持续提升现网的稳定性,有运维或稳定性相关经验优先; 5、具备良好的沟通表达能力和团队合作意识,责任心强,有较强的自我驱动能力; 6、掌握Golang、C++、Python等开发语言中的一门。
-
职位职责: 1、负责字节跳动数据中心网络P4网关产品交付和线上运维工作,提供超大集群网关服务能力和保证线上稳定运行; 2、负责网关类产品稳定性方案设计和能力建设,包括监控、告警、应急响应、运维数据分析,风险治理等; 3、负责网关类产品运维流程和规划的制定和优化,持续提升交付、变更、运维效率。 职位要求: 1、计算机相关专业,本科以上学历,具备扎实的计算机体系知识; 2、熟悉常见网络协议,比如TCP/IP、BGP、VXLAN、GRE等; 3、熟悉VPC、负载均衡、云企业网、专线连接等公有云网络产品优先; 4、具备良好的现网意识,持续提升现网的稳定性,有运维或稳定性相关经验优先; 5、具备良好的沟通表达能力和团队合作意识,责任心强,有较强的自我驱动能力; 6、掌握Golang、C++、Python等开发语言中的一门。
-
【职位诱惑】 - 腾讯系团队,扁平管理,六险一金; - 能深度参与互联网金融公司业务架构以及devops工具链全流程建设; - 能学习到许多金融、证券行业知识。 【岗位职责】 1.保障平台登陆和行情业务的稳定性,和研发一起对事故进行快速响应,并建立机制提升处理效率; 2.参与建设运维工具和平台, 推进运维自动化; 3.通过持续的全方位数据运营(包括历史事故、资源利用率等),找到系统薄弱点并改进优化; 4.处理告警,使告警得到良好处置; 5.操作db重要变更,包括数据恢复,数据备份检查,alter操作,数据迁移; 6.指导研发更好的使用平台工具。 【职位要求】 1.本科及以上学历, 计算机相关专业, 并有两年以上相关领域工作经验; 2.扎实的计算机软件基础知识; 了解 Linux 操作系统、存储、网络 IO 等相关原理; 3.熟悉一种或多种编程语言,例如Python/Go/Shell; 4.具备系统化解决问题的能力,良好的沟通技巧和主人翁责任感; 5.具有相关计算/分布式/大数据等系统经验优先(Nginx/Kubernetes/Docker/redis/mysql 等); 6.具有算法思维,良好的数据结构和系统设计的能力者优先。
-
职责描述: 1、负责公司大数据平台的运维保障工作,保障平台的正常运行和相应数据服务的稳定高效; 2、对接数据开发侧团队,主动优化和完善服务巡检、监控工具、脚本等,减少人工操作提高运维效率;负责数据平台的故障处置、推动性能优化。如平台产品技术问题,提交给平台产品技术组进行后台处理,并及时反馈. 3、负责数据平台二线运维支撑保障,响应运维/服务台一线请求:处置生产事件,跟踪问题处理; 4、定期组织团队人员开展大数据平台的技术知识积累和移交; 5、负责设计日常运维相关的自动化工具或系统,并完成相应需求收集和需求管理 ; 任职要求: 1. 具有1年以上金融行业数据类项目运维经验,熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员,或长期在类似的运维项目上承担运维工作优先; 2. 具备较强的数据开发分析能力,熟练掌握SQL等技能,熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先; 3. 具备较强的数据分析,问题分析,逻辑思维能力,团队协作能力,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 4. 强烈的自驱力和责任感,面对复杂业务问题,可以从业务和技术多角度推进,最终达成目标。
-
if strings.Contains(passions, "coding") { switch techstack { case "Go": fallthrough case "Node.js": fallthrough case "Python": fallthrough case "Kubernetes": fallthrough case "Serverless": fmt.Println("Join AfterShip") } } 岗位职责 1、保障公司业务的稳定,积极解决业务问题;负责公司各类公有云 PaaS、SaaS 产品的维护; 2、通过自研、开源软件二开等手段提升自动化能力,提升运维效率; 3、深入业务架构,结合运维相关的最佳实践,对线上系统进行优化; 4、通过架构优化、工具平台、流程机制建设,持续提升网站稳定性,持续优化云成本; 5、梳理和完善运维文档,沉淀技术经验;参与 On-Call 值班,及时响应处理线上报警等事件。 岗位要求 1、本科及以上学历,至少 3 年以上互联网系统的运维经验,英语读写熟练; 2、熟悉 Linux 操作系统、计算机网络等,基础知识扎实;至少熟练掌握 Shell/Python/Go 一种语言; 3、有生产环境下 K8s 的使用和维护经验;熟悉 Prometheus、Grafana 等监控工具; 4、有 GCP、AWS 等国外公有云使用经验优先,比如 GKE、Pub/Sub、Cloud Storage、Dataflow、Cloud Run 等产品; 5、有良好的线上安全意识、学习能力、团队精神和客户意识;有高度的责任感,对于工作积极严谨。 加分项 1、有丰富的 GCP 或 AWS 云平台使用经验; 2、有 AIOps 领域的实践经验; 3、有运维自动化平台或者 API 开发经验; 4、有数据库相关的维护经验; 5、英语可作为工作语言。 为什么加入我们 1、朝阳行业:国际电商 SaaS 服务赛道,国际一线投资机构加持; 2、稳健发展:团队稳健扩张,业务规模及营收每年持续稳健增长; 3、多元文化:团队来自全球 20 多个不同城市,国际化视角、扁平化管理; 4、极客氛围:拥抱开源技术,实践敏捷开发,崇尚通过工具和自动化来解决问题; 5、特色福利:AI 学习基金、 一对一帮带、内部商城、提供 MacBook 及可升降办公桌。
-
岗位职责: 1、负责稿定私有化客户部署、运维实施与技术支持 2、辅助参与私有化部署时相关实施工具研发 3、能够准确地将实施过程中遇到的问题、需求传达给研发&SRE团队,并进行必要的整理和归纳 4、能够较好的服务意识快速响应客户问题和保障客户服务可用性 岗位要求: 1、一年以上运维相关经验,熟练使用Shell脚本,能够独立完成各种运维相关工作,快速高效的处理各种突发事件 2、熟悉 Linux/Unix 系统、网络、硬件等相关知识 3、熟悉Kubernetes基础运维操作,能够基于K8S环境进行环境搭建、服务部署、问题排查 4、具备良好的表达能力,良好的文档编写和方案呈现能力 5、有不错的抗压能力,能够接受中短期出差 6、有企业实施交付经验者优先
-
岗位职责: 1. 保障各业务高效稳定运行,确保系统的高可用性和容错性,及时处理各类故障和异常情况; 2. 持续完善运维规范,优化现有运维流程,提炼标准操作流程,提高运维效率; 3. 负责系统架构的设计和优化,包括但不限于网络、存储、服务器、数据库等方面; 4. 配合研发团队进行系统开发和测试,提供技术支持和指导; 5. 监控系统运行状态,及时发现和预警潜在风险,制定和实施应急预案; 6. 参与制定和执行安全策略,防范潜在的安全风险,保障系统的安全稳定运行。 目标: 1. 确保各业务系统的高效稳定运行,满足业务需求和用户期望; 2. 提升运维工作效率,降低运维成本; 3. 推动团队的技术进步和创新能力,提升团队整体技术水平; 4. 保障公司业务系统的安全稳定运行,避免重大事故和损失; 5. 与其他团队紧密合作,共同推动公司业务的顺利发展。 经验要求: 1. 至少有3年以上相关工作经验,熟悉Linux操作系统和主流的数据库、中间件技术; 2. 具备较强的系统分析、架构设计、开发和测试能力; 3. 熟练掌握Python、Java等编程语言,有微服务、云计算等经验者优先; 4. 有大规模系统运维经验者优先。 资格要求: 1. 本科及以上学历,计算机相关专业; 2. 具备较强的沟通、协调、团队合作能力,良好的职业素养和责任心。
-
Duties and responsibilities ● system availability and performance monitoring at both the infrastructure and application levels ● planned infrastructure and application updates ● new environment deployment ● changing existing infrastructure according to requirements ● other tasks related to the system functionality Hiring requirements ● production experience with the following: ○ deploying and supporting servers on Google Cloud Platform (experience with Tencent Cloud will be a plus) ○ Google Kubernetes Engine (RKE will be a plus) ○ preparing automation scenarios using Terraform ● experience with Microsoft Windows Server ● experience with Active Directory ● knowledge of Linux system ● expertise in preparing automation scripts to perform routine tasks using scripting languages (Bash, PowerShell, Python) ● ability to plan new infrastructure requirements and maintain current infrastructure ● understanding of network concepts: firewalls, VPN, peering (for public clouds) Will be a plus: ● knowledge of MS SQL ● knowledge of PostgreSQL
-
职责 1、制定所负责业务的风险&效能&成本架构演进规划,协同&推动全局架构演进,以及前瞻性的设计规划,包括内部各子域的业务架构、数据架构、信息架构、技术架构,支撑各子域间高质量高效率协同,提升业务交付效率和运营效率; 2、识别负责业务的风险&效能&成本问题,制定相应的解决方案,并协同方案落地,最终取得业务结果; 3、制定所负责域的智能化规划,运用好平台已有的数据智能能力,对于团队工作问题提出针对性的数据智能的解决方案,改进工作效率和质量; 4、识别风险&效能&成本系统建设和运营过程中影响团队效率的其他问题,制定标准化、流程化、系统化、产品化等改进计划。 要求 1. 知名互联网企业专注系统稳定性工作三年以上,或从事系统架构师/资深研发工程师五年以上,java研发功底扎实,有大规模在线服务系统架构设计和稳定性保障经验,对如何做好系统稳定性保障有全面深入的理解; 2、喜欢做系统稳定性技术风险专业相关的事情,愿意在这个领域长期发展; 3、乐于挑战业务和技术难题,能够探索新方法新思路,全力以赴拿结果
-
职位描述 1.参与掌阅线上业务全流程的稳定建设,包括架构设计,环境治理,业务容灾等等,保障业务稳定性; 2.参与掌阅线上业务的日常运维以及业务保障,包括版本迭代发布,监控告警治理,紧急事故处理等等,全生命周期保障业务稳定; 3.利用自动化手段解决各类问题,提高全部门的生产力。 职位要求 1.计算机,软件,自动化等相关专业学生,所学课程需要包含Linux,计算机网络等相关课程; 2.接触过 Linux 操作系统,熟悉命令行操作; 3.熟悉一门计算机编程语言,加分项: Python/Golang/shell; 4.熟悉 TCP/IP 协议,加分项:熟悉HTTP 协议; 5.具备快速学习能力、系统化解决问题的能力以及良好的团队合作和沟通能力,以及强烈的责任感; 加分项 1.熟悉git 等源码管理工具 2.接触过 Docker,K8S 3.了解过云服务,不限于阿里云,AWS 等 4.了解一种监控系统及相关应用 5.具有一定的计算机相关文档的英语阅读能力
-
岗位亮点: 办公形式是在家远程办公 工作时间:10点-12点半,14点-18点半,每周平均每天8小时,周末双休 金融科技类型的互联网企业,高速发展中,这里有你学不完的技术和挑战,只要你愿意!全球化、扁平化、自治化! 岗位职责: 深入理解业务,负责金融业务的高可用治理,持续提升业务SLA; 通过持续的全方位数据运营(包括可用性指标、历史事故、资源利用率等),找到系统薄弱点,落地地改进项目; 持续打磨监控体系,提升监控效率,缩短故障定位时长; 保障业务系统IaaS、PaaS 基础设施高效稳定运行,持续完善运维规范、提炼标准操作流程 监控和审查系统架构合理性、流程逻辑合理性,系统性能、稳定性等技术领域和指标,驱动项目业务团队解决问题; 负责**时间响应生产故障,作为总体调度角色,组织相关研发、运维、产品等各方联合排查和解决问题,对故障响应时间、故障解决时间MTTR负责; 引导 SRE 基础运维工作朝着自动化、平台化、智能化方向演进,提升基础架构各组件体系整体运维管理效率。 积累运营最佳实践,为业务架构设计与组件选型提供指导,输出运维技术文档。 编写相关文档、定期进行技术和管理成果全员分享。 其它相关工作。 任职要求: 计算机本科相关专业,7年以上中大型互联网/金融行业开发/运维/SRE经验,3年消息中间件/缓存/k8s/数据库生产环境维护经验。 精通Shell编程,熟练掌握Golang\Java\Python 中的 1-2 种编程语言; 有良好的计算、存储、网络、安全、计算机体系结构方面的知识; 熟悉网络基本原理,熟悉 TCP/UDP 网络、Http、Socket、CDN等技术 熟练掌握如Nginx、LVS、Redis、Kafka、MySQL、Elasticsearch 等常见中间件/数据库工作原理、部署和使用; 熟悉Jenkins、Gitlab等,对CI/CD流程制定与集成有实践经验; 熟悉Docker/k8s容器平台及相关的底层技术和原理; 熟悉互联网技术架构,对网络通讯协议、应用服务器、负载均衡、微服务架构有较深入的理解; 熟悉互联网通用的组件,对消息中间件、分布式缓存、数据库有较深入的理解; 有丰富的服务运维或中间件运维经验Troubleshooting,对常见的系统隐患、系统故障有系统性总结和实际处理经验; 能够胜任7*24小时故障响应及处理,抗压性强,良好的服务意识和团队合作精神; 性格开朗外向,有很好跨团队的沟通技巧,有很强的责任心,具备优秀的推动力,做事追求**。 工作细致、善于思考,有很强的数据分析和问题解决能力; 加分项: 有跨地区远程项目协助经验者优先; 有在证券、期货公司、区块链从事相关技术类工作经验; 有完整自动化运维工具开发经验者优先; 岗位亮点: 公司金融科技重点业务线的高可用治理; 通过事故运营、质量运营和风险运营等,持续推进高可用治理,提升业务SLA; 自动化运维系统、运营系统的建设和打磨,持续提升人效; 我们的技术栈: 数据库 mysql pgsql elasticsearch redis mongodb etcd OceanBase CickHouse 中间件 nacos kafka zookeeper rabbitmq rocketmq apisix nginx 容器化 k8s rancher 存储 nas ceph 网络/负载均衡 CDN haproxy frp openvpn-as apisix CI/CD confluence/JIRA/gitlab/harbor 语言 go java python
-
岗位职责: 1、负责数据库产品交付上线、运维保障、故障诊断、问题处理工作; 2、负责分布式数据库产品运维平台和工具的设计、开发工作; 3、用自动化、智能化的方法解决超大规模集群、分布式应用及复杂系统运维中的问题; 4、负责监控系统的设计、评审、发布并推动产品改进; 岗位要求: 1、熟悉Linux操作系统,具备常见故障的诊断、分析和处理能力; 2、熟悉Java、C/C++、Shell、Python等任一编程语言; 3、有业界领先的运维平台设计、开发、维护、SRE等经验者优先; 4、责任心强,沟通能力好,适应团队工作,善于思考、总结和改进。
-
工作内容: 1. 搜索/推荐系统自动化运维方案设计和开发 2. 负责京东搜索和推荐系统的稳定性管理 3. 京东搜索和推荐系统核心组件的变更和风险预案设计执行 技能要求: 1. 扎实的编码能力,整洁的编码风格。熟练掌握至少一门通用编程语言(c/c++/java/go等)或一门脚本语言(shell/python/ruby/perl等)。 2. 优秀的架构设计和理解能力,熟悉互联网常见架构和组件(docker/k8s/kafka/redis/mysql等),熟悉大数据常见技术栈加分(hadoop/flink/hbase等)。 3. 熟练掌握数据结构,操作系统,计算机网络和数据库等计算机相关基础知识。 4. 有搜索/推荐系统等相关工作经验加分。
-
工作职责: 1.在华为云/阿里云/AWS云 进行项目维护; 2.实现并管理全面的监控解决方案(包括指标、日志、追踪),使用如 Grafana、Prometheus 等工具或其他相关平台; 3.自动化部署流程、系统健康监控以及故障响应等操作; 4.与开发团队协作,提升系统性能与可靠性; 5.使用 Kubernetes 管理容器化应用程序。 任职资格: 1.本科及以上学历,计算机相关专业,3年以上运维工作经验; 2.熟悉linux,k8s,有使用华为云/aws /阿里云的经验, 熟悉云技术(CICD, 监控,部署); 3.维护过 Java/PHP 的项目; 4.有维护过mysql db 的经验 (较有优势),有华为云经验优先。
-
职位职责: 1、负责字节跳动数据中心网络P4网关产品交付和线上运维工作,提供超大集群网关服务能力和保证线上稳定运行; 2、负责网关类产品稳定性方案设计和能力建设,包括监控、告警、应急响应、运维数据分析,风险治理等; 3、负责网关类产品运维流程和规划的制定和优化,持续提升交付、变更、运维效率。 职位要求: 1、计算机相关专业,本科以上学历,具备扎实的计算机体系知识; 2、熟悉常见网络协议,比如TCP/IP、BGP、VXLAN、GRE等; 3、熟悉VPC、负载均衡、云企业网、专线连接等公有云网络产品优先; 4、具备良好的现网意识,持续提升现网的稳定性,有运维或稳定性相关经验优先; 5、具备良好的沟通表达能力和团队合作意识,责任心强,有较强的自我驱动能力; 6、掌握Golang、C++、Python等开发语言中的一门。
热门职位


