-
岗位职责: 1、负责大规模容器集群稳定性保障工作,参与容器云平台架构设计及研发; 2、负责跟踪Kubernetes社区动态并参与服务编排框架的开发; 3、负责跟踪Docker社区动态并参与关键技术研究开发; 4、参与基础架构中间件/微服务的实践和推进。 任职要求: 1、计算机相关专业本科或以上学历,5年以上开发工作经验,有基础架构开发经验优先; 2、有Go语言开发经验; 3、熟悉Docker/Kubernetes容器生态核心开源项目和周边服务生态项目,如监控、日志、网络等方案,精通或者有实施经验者加分; 4、DevOps背景,有开源项目贡献维护经历加分; 5、对新技术有执着追求,热爱编程。善于抽象、总结、思考,能及时关注和学习业界新技术; 6、有互联网行业高并发、高稳定可用性、高性能相关的开发、设计经验; 7、有较强的自学能力和钻研精神,具有良好的沟通能力和团队合作能力,综合能力强。
-
25k-40k·14薪 经验5-10年 / 不限营销服务|咨询,数据服务|咨询 / 上市公司 / 500-2000人岗位职责: 配合产品开发团队,保障FreeWheel数据平台的关键服务和重要基础设施的稳定、可靠地运行; 工作内容: 1. 深入理解业务,持续提升业务SLO/SLA; 2. 通过持续的全方位数据运营(包括可用性指标.历史事故.资源利用率等),找到系统容量、可用性、稳定性方面的薄弱点,并推进落地改进项目; 3. 参与建设运维工具.平台,推进运维自动化,量化数据,使用代码解决线上问题; 4. 参与故障应急响应处理,持续打磨监控系统,提升报警准确率,缩短故障定位时长; 5. 积累运维最佳实践,为业务及基础设施架构设计与资源选型提供指导,输出标准运维流程文档; 岗位要求: 1. 5年及以上相关工作经验,计算机科学或相关专业(通信、电子、信息、自动化等)优先; 2. 熟悉主流云厂商及服务,如AWS/GCP/Azure/AliCloud等; 3. 云环境管理与优化经验,包括成本管理,安全管理,运维管理,应用架构优化; 4. 熟悉业内流行的大数据或消息队列等分布式系统平台:Aerospike, Kafka, Hadoop,Yarn,HDFS,Hbase,Druid或其他NoSQL系统等; 5. 积极拥抱 “Infrastructure as Code”思想并有较丰富的实践经验,熟悉相关厂商及开源解决方案,如CloudFormation/Terraform等; 6. 运维平台设计与使用经验,如设计或参与开发过运维管理平台:资源管理,K8s管理,配置管理等; 7. 对多种云计算基础服务有较丰富的实践操作经验,包括但不限于: VPC, Subnets, Security Group, EC2, S3, IAM, Route 53, Security Hub etc; 8. 深入理解Linux操作系统,并掌握多种开源解决方案及相应技能:Kubernetes/Container/Nginx/Ansible/Prometheus/Grafana/ELK; 9. 熟悉Golang开发语言为优; 10. 工作积极主动,有强烈的责任心,执行能力强;善于思考总结,有很强的学习、问题分析和推进解决能力; 11. 基本的英文听说能力,较强的读写能力,能够快速融入英文工作环境。
-
20k-30k 经验1-3年 / 不限IT技术服务|咨询,网络通信 / 不需要融资 / 2000人以上Has large scale system setup/deployment experience, Familiar with Shell/Python scripts.
-
岗位职责: 负责在 Kubernetes 环境中进行应用程序的部署、管理和维护。 设计、开发和维护 Kubernetes 集群的自动化部署和管理工具。 与团队合作,制定和实施 Kubernetes 的最佳实践。 分析、故障排除和解决 Kubernetes 集群的问题。 监控和调优 Kubernetes 集群的性能、可用性和容量。 参与容器化应用程序的设计和开发,并将其部署到 Kubernetes 集群中。 执行容器化技术和 Kubernetes 相关的安全性、合规性和最佳实践的审计。 任职要求: 对 Kubernetes 生态系统有深入的理解,熟悉 Kubernetes 的架构和核心概念。 熟悉使用 Kubernetes 进行应用程序的部署、管理和调度。 具备使用容器编排工具(如 Docker、Kubernetes)进行开发和部署的经验。 熟悉使用云原生技术栈,如容器编排、服务发现、负载均衡等。 熟悉 Linux 系统和命令行工具,具备良好的脚本编写能力。 具备良好的分布式系统和网络知识,能够故障排除和优化 Kubernetes 集群。 具备使用编程语言(如 Python、Go)开发和维护 Kubernetes 工具的经验。 熟悉容器和镜像技术,如 Docker、OCI 标准等。 具备与团队合作和沟通的能力,能够快速学习和适应新技术。
-
岗位职责: 1. 负责基于公有云的大数据架构、开发、优化工作; 2. 负责Kubernetes operator,cluster autoscaler等基础组件开发和优化工作; 任职要求: 1. 熟悉Java或者GO,2年以上经验; 2. 具备大数据 on Kubernetes 落地实践经验,熟悉 Docker/Kubernetes 相关生态; 3. 具备 Kubernetes 集群扩缩开发优化经验,具备Operator开发经验; 4. 熟悉公有云大数据产品、大数据生态开源工具和开源引擎,具备二次开发经验的优先 5. 有强烈责任感,具备较强的团队沟通和协作能力,较强的自我驱动能力,具备良好的学习能力;
-
工作职责: 1. 负责AI训练平台k8s底座部署,升级及日常的维护 2. 负责研发侧cicd持续交付和效率提升 3. 负责多云平台集群管理中心和配置中心研发和维护 4. 关注平台易用性、可扩展性以及前瞻性,跟踪业界趋势与技术选型,持续推进算法平台的规划与演进。 任职资格: 1.本科及以上学历,计算机相关专业。 2.熟练掌握Golang语言。掌握Python语言是plus。 3.熟悉容器技术,熟练掌握kubernetes编排服务框架,熟悉kubernetes底层工作原理。 4、了解kubernetes的nvidia生态,了解nvidia-device-plugin,nvidia-container-runtime等工作原理。 5、有kubernetes平台研发相关项目经验。 6、 较强的责任感与自我驱动能力,较强的学习能力。 【加分项】 1.对深度学习框架tensorflow、Pytorch等其中一种有一定的了解或开发经验者 2.有大规模分布式系统研发,多云技术、云计算平台研发经验者 3.熟悉GPU相关技术或Linux内核者。
-
Kubernetes研发工程师
[北京·三元桥] 2023-09-0515k-30k·13薪 经验不限 / 本科移动互联网,企业服务 / B轮 / 15-50人团队介绍: 构建基于 Kubernetes 的机器学习平台 OpenBayes 提供从数据标注到模型部署的全流程服务。致力于不断降低机器学习体系的使用门槛,加速从原始数据到最终应用的转化。 职位介绍: 针对机器学习场景,围绕 Kubernetes 生态构建支撑组件,应用场景包括线上 JupyterLab 的编排 CRD、线上服务 CRD、跨节点机器学习任务 CRD 等。 职位职责: 1.平台已有的 CRD / Controller / Operator 的维护; 2.对 Kubernetes 的组件做扩展,实现特定的调度策略,支持不同硬件的调度流程; 3.按照业务需求构建 extended resource 实现异构计算资源的调度; 4.其他组件构建与维护。 职位要求: 1.本科及以上学历; 2.熟练应用 Go/Python/Java 等编程语言之一或多个,Go 语言最佳; 3.有一定的 Kubernetes 开发经验,了解其底层原理; 4.计算机基础扎实,有基本的算法和数据结构基础知识; 5.自主学习能力强,有意愿接受新技术并进入新领域,有良好的沟通能力和团队协作能力。 加分项: 1.了解并使用过基于 k8s 的机器学习训练框架 kubeflow 或其他; 2.对分布式系统管理有实践经验,对该领域有很大的热情; 3.了解云原生体系,对其生态有所了解。 -
Kubernetes 研发工程师(实习)
[北京·三元桥] 2023-07-174k-8k 经验在校/应届 / 本科移动互联网,企业服务 / B轮 / 15-50人职位职责: 1. 平台已有的 CRD / Controller / Operator 的维护; 2. 对 Kubernetes 的组件做扩展,实现特定的调度策略,支持不同硬件的调度流程; 3. 按照业务需求构建 extended resource 实现异构计算资源的调度; 4. 其他组件构建与维护。 职位要求: 1. 本科及以上学历; 2. 熟练应用 Go/Python/Java 等编程语言之一或多个,Go 语言最佳; 3. 有一定的 Kubernetes 开发经验,了解其底层原理; 4. 计算机基础扎实,有基本的算法和数据结构基础知识; 5. 自主学习能力强,有意愿接受新技术并进入新领域,有良好的沟通能力和团队协作能力; 6. 实习时间至少三个月,每周至少三天。 加分项: 1. 了解并使用过基于 k8s 的机器学习训练框架 kubeflow 或其他; 2. 对分布式系统管理有实践经验,对该领域有很大的热情; 3. 了解云原生体系,对其生态有所了解。 实习期间表现良好有正式入职机会。 -
java高级开发(熟悉kubernetes,懂大数据)
[北京·朝阳区] 2023-07-1728k-33k·14薪 经验5-10年 / 本科人工智能服务,数据服务|咨询 / A轮 / 150-500人须懂大数据 第6条是必须项 职责描述: 1、大数据平台后端开发相关工作 2、将客户需求转换为平台产品任务 任职资格: 1、熟悉j2EE开发,精通spring boot、spring cloud、 mybatis等框架 2、熟悉mysql、oracle,postgres等关系数据库的开发(SQL、存储过程等) 3、熟悉redis、hive、hbase等,并有数据系统调优经验 4、熟悉分布式系统的设计和应用,熟悉分布式、缓存、消息、搜索等机制;熟悉目前网站常用的缓存组件,缓存类型,缓存策略 5、拥有大型分布式应用系统分析、架构设计、开发经验,了解负载均衡策略实现。能对分布式常用技术进行合理应用、解决问题 6、熟悉kubernetes、docker的存储解决方案,数据持久化,高可用,安全等,有至少2年以上的kubernetes实际使用经验,深入理解其技术原理 7、熟悉Linux操作系统,熟悉Shell脚本编程及常用Linux操作命令 8、有强烈的责任感,主动性强,具有良好的团队合作精神和高度的责任心,能在较大压力下工作 -
岗位职责: 1、参与公司容器云平台的技术架构、技术预研,应用推广及落地等; 2、参与容器云平台核心技术问题的攻关,系统优化,协助解决产品/项目开发过程中的技术难题; 3、结合公司业务实际应用,对相关容器平台开源组件进行扩展开发和优化; 4、与团队成员分享经验和新技术,帮助团队不断成长。 任职资格: 1、2-5年软件开发经验,有大型云计算平台架构研发经验优先,有大型云计算产品公司3年以上工作经验者优先; 2、对Docker等容器运行时技术和Linux内核技术(命名空间、文件系统,网络,cgroups等)有一定的理解,有Linux内核开发和调试经验的优先; 3、具备开源容器调度K8S的使用经验和系统集成经验(如监控、日志等系统),具备混合云、多云平台使用经验者优先; 4、熟悉k8s各组件工作原理,具备K8S的Controller、Operator扩展机制的实际开发经验,熟悉K8S源码者优先; 5、了解K8S CSI/CNI/CRI的工作原理,至少进行过其中一种的使用及开发; 6、熟悉使用其中一种语言开发如: Go / Python / C++,精通Go语言优先; 6、较强的团队沟通和协作能力,较强的自我驱动能力。 7、有云原生社区开发贡献者的优先;
-
岗位职责: 1. 参与微博商业产品相关系统的设计开发和维护; 2. 独立负责业务模块的设计和实现; 3. 优化系统架构、提高代码质量和开发效率,提高系统性能和可靠性; 4. 在项目周期内按时交付高质量的代码,并与其他团队成员协作。 任职要求: 1. 计算机相关专业本科以上学历,三年以上移动互联网行业工作经验; 2. 熟练掌握Go、PHP等编程语言,了解Go语言的并发、网络编程等特性; 3. 对算法、设计模式有一定的了解,熟练使用MySQL/NoSQL等存储系统,了解其原理与性能优化; 4. 熟悉大型网站构架和性能优化,并有实际的项目经验; 5. 熟悉Linux和Shell脚本编程,能够在Linux下进行软件开发和故障排查,了解TCP/IP、HTTP协议等网络相关内容; 6. 了解Kubernetes、Docker等技术; 7. 热爱技术,学习能力强,具备良好的沟通能力和团队协作精神
-
职位职责: 1、参与到生产集群&服务的整个生命周期中通过良好的工程架构设计,满足可持续化发展,不断提升稳定性,从设计、部署、上线等,参与到架构规划、评审; 2、保障大数据/计算/云原生/分布式存储等多个核心系统的高可用性和性能,并构建自动化工程以防止问题再次发生,同时关注系统成本与稳定性; 3、设计、编写和交付软件,以提高公司服务额可用性、可扩展性、延迟和效率,构建保障线上大规模集群快速迭代的自动化平台; 4、为大型复杂系统构建自动化运营解决方案,参与系统设计到上线的整个生命周期内保障系统可靠性; 5、基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析、业务问题定位排障、推进系统高可用架构改造升级等。 职位要求: 1、本科以上学历, 计算机相关专业或同等实践经验, 并有两年以上相关领域工作经验; 2、扎实的计算机软件基础知识; 了解 Linux 操作系统、存储、网络 IO 等相关原理; 3、具备以下一项或多项软件开发经验: Go/Python/Java/C++等; 4、具备系统化解决问题的能力或工程化研发能力,良好的沟通技巧和主人翁责任感; 5、具有相关计算/分布式/大数据等系统经验优先(Kubernetes/Containerd/OpenStack/Hadoop/Spark/Flink/YARN/分布式存储等); 6、具有产品和工程思维,良好的项目能力、数据结构和系统设计的能力者优先。 优先条件: 1、具有大型分布式系统的设计、工程、分析和故障排查经验; 2、系统化的思维,及系统的解决问题的方法,有出色的沟通技巧; 3、英语口语流利,能熟练的通过英语进行沟通、表达,完成全球协助。
-
职位描述 1、负责机器学习平台的设计和开发。 2、参与AI平台业务模型优化和运营; 3、分析并解决系统研发过程或实际使用中遇到的各类问题,保证系统研发、运行正常进行。 任职资格 1、有丰富的python开发经验,熟悉java开发语言,掌握多线程及高性能的设计与编码及性能调优,有高并发应用开发经验优先。 2、熟悉机器学习建模流程、常用的机器学习算法和深度学习算法及框架,如:XGB、Lgb、Sklearn、TensorFlow、Pytorh等; 3、熟悉Linux平台下常用命令操作、环境部署; 4、了解云原生相关体系,如:Docker、Kubernetes等; 5、了解缓存、消息、大数据存储相关技术,例如:mysql、redis、kafka、hive、Hadoop、spark、flink等; 6、能适应高强度工作,责任心强,工作积极主动,善于学习和交流,具有良好的团队合作精神。
-
岗位职责: 1、负责携程公司级研发工具平台建设(包括但不限于 CI/CD 流水线、代码仓库、发布平台等); 2、参与平台系统的技术规划,架构设计以及日常功能迭代; 3、结合业务痛点,提供一站式、全流程解决方案,协助业务提升研发效能与工程质量。 岗位要求: 1、本科以上学历,计算机、软件工程等相关专业,具备 3 年以上效能工具开发经验者优先; 2、熟练掌握 Go/Python/Java 等编程语言的一种, 具备较强的编码能力,熟悉网络、操作系统、数据库、常用的数据结构和算法; 3、熟悉 Git、流水线、持续集成、持续交付、Kubernetes、容器等技术,对 DevOps 与云原生生态有一定的了解; 4、善于学习,积极主动,有技术热情,有较好的逻辑思维和分析能力,拥有良好的沟通能力和团队协作精神。
-
职位描述 1、为快手百亿级广告变现平台提供通用的基础设施、研发框架、运维工具等; 2、保障广告系统的可用性及稳定性; 3、参与设计与实现百TB级别容量的通用存储平台,包括单机过百万的高性能存储引擎、可扩展的数据存储服务、元数据管理服务等; 4、业界前沿架构与技术的探索与落地。 任职要求 1、至少精通一门主流服务端开发语言,如:C++、Java、Golang;熟悉一门脚本语言,Shell、Python等; 2、有分布式系统开发经验,包括分布式存储服务,计算平台,高并发实时服务等;了解分布式系统理论; 3、较强的问题分析与解决能力,能够归纳抽象问题并能给出系统的解决方案; 4、具有良好的团队合作意识和沟通能力,责任心强。 加分项: 1、有主流存储引擎、数据处理框架(Rocksdb、MySQL、HBase、Flink、Storm等)使用或开发经验; 2、有基于Docker、Kubernetes的容器化运维经验; 3、开源社区活跃贡献者。