-
岗位职责: 1、负责公司服务器、网络设备和软件系统的日常管理和维护。 2、负责项目集群的搭建、部署、监控、性能调优、升级、日常维护和管理工作。 3、负责项目备份、监控、应急响应、故障预警与排除等。 4、监控系统性能,定期进行性能调优和容量规划。 5、建立支撑持续集成和持续部署(CI/CD)流程。 6、编写和更新系统文档,制定和优化运维相关标准和流程。 岗位要求: 1、**大专学历,3年及以上的相关工作经验,熟悉基本网络原理。 2、熟练掌握Linux操作系统配置、维护和优化,有信创系统经验者优先。 3、熟练掌握mysql、mongodb、redis集群搭建、性能优化及备份恢复等技术。 4、熟悉Jenkins持续集成过程和工具链的配置,包括Jenkins流水线设计,Sonar、Nexus等常用工具的集成和配置等。 5、精通shell、python中至少一门脚本语言,熟练运用脚本做自动化处理; 6、熟悉自动化运维工具使用者优先,如:ansible、puppet等。 7、熟悉容器化技术,能编写dockerfile;熟悉K8S架构和基础组件概念与原理,具备容器编排运维能力者优先。
-
职位职责: 1、负责火山引擎-机器学习平台的研发,聚焦AI算法工程师的体验,从机器学习系统、云原生、云计算架构等多个层面进行技术探索和攻坚,帮助客户实现高性能、高资源利用率的高性能计算平台; 2、设计和实现机器学习相关的基础设施/算法框架/工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。 职位要求: 1、熟悉Linux平台下的分布式系统的开发及运维,三年及以上Golang/Python/C/C++/Java/Scala的开发经验,ACM/ICPC/Codeforces等获奖者优先; 2、能够从产品思维、机器性能和稳定性、团队协作等多种视角,高标准要求自己的技术方案和每一行代码; 3、对如下一个或多个领域有经验,或者无经验但有浓厚的兴趣(须额外付出时间进行深入研究和探索): a. 云原生:Kubernetes(调度器/CSI)、容器系统、大规模训练任务和推理服务的编排、在离线混部及资源调度、微服务网格和流量治理、Terraform等; b. 云计算:云存储、网络虚拟化、云安全、混合云、技术商品化探索等; c. 机器学习:Pytorch/Tensorflow/JAX/PaddlePaddle/Mindspore等机器学习框架、GPU/NPU/ARM等最新异构计算系统与架构、RDMA高性能网络。
-
职位职责: 1、负责大模型平台的基础设施搭建和持续集成; 2、负责大模型平台管控面和数据面的上线和日常运维; 3、从运维视角研发各类工具,命令行,脚本等,配合完成模型和数据的持续部署能力; 4、运维监控数据抓取,收集,运维大盘建设; 5、大模型平台的长期稳定性建设。 职位要求: 1、3年以上K8S云原生平台的相关系统运维开发和稳定性建设经验; 2、2年以上公有云的相关的运维开发,有丰富的云上基础设施运维和构建经验; 3、 熟练掌握Python/Golang/Shell中的一种语言; 4、有大中型互联网服务运维经验者优先; 5、有IaC(基础设施即代码)相关的terraform/pulumi/crossplane经验者优先。
-
职位描述 1、负责快手一站式机器学习平台的设计研发与迭代改进,为业务提供稳定易用、高性能、高性价比的AI中台解决方案; 2、业内机器学习系统与平台前沿技术进展跟进与调研、落地; 3、参与模型训练,模型服务,模型管理,资源调度等机器学习相关问题的开发。 任职要求 1、计算机基础知识与编程基本功扎实,熟悉Go/Python/C++至少一种; 2、参与过大规模分布式系统的开发和维护; 3、良好的沟通能力和团队协作精神,严谨的工作态度与高质量意识 ; 4、善于学习新的知识,动手能力强,有进取心。 加分项: 1、了解行业内典型的调度系统架构、混部系统架构,了解优缺点; 2、了解分布式系统、调度、容器相关领域技术,熟悉Kubernetes/docker/Yarn等原理与实现,有Yarn/K8s二次研发经验优先; 3、熟悉计算机体系结构和Linux操作系统,了解 GPU 架构、Cuda编程; 4、优秀的分析问题和解决问题的能力,对解决具有挑战性问题充满激情; 5、对机器学习系统(Tensorflow/Pytorch/Jax)和算法(transformer/bert)有认识/经验者优先。
-
岗位职责: 1.负责腾讯广告/推荐/搜索等机器学习平台的稳定性保障、容灾方案设计和开发; 2.参与相关运营平台建设,提升平台运营效率; 3.对线上事故进行快速响应以及快速响应机制的优化和完善、提升平台响应效率; 4.推动提升服务的可靠性、可扩展性以及性能优化,保障系统SLA。 岗位要求: 1. 有大型系统的运营经验,3年以上相关工作经验; 精通Linux/Shell/Python/Go等编程语言,动手能力强; 2. 较强的分析和解决问题的能力,思维严谨,责任心强; 3. 积极乐观,工作认真细致,具有良好的团队沟通与协作能力; 加分项: 1、熟悉推荐/广告/搜索技术; 2、运营过大规模机器学习平台; 3. 至少熟悉一种大数据技术:flink, spark, k8s, Oceanus; 此岗位为腾讯集团旗下子公司编制岗位
-
岗位职责: 1、负责机器学习平台后台相关设计与开发,保障大规模业务场景中的落地; 2、负责模型训练过程的效率优化,加快模型迭代效率、提升模型效果; 3、面向算法工程师的接口和工具优化,降低机器学习应用门槛; 4、协同算法工程师优化模型效果; 岗位要求: 1、熟悉掌握 C++/JAVA/GO/Python 中一种或多种编程语言,熟悉常用算法和数据结构,扎实的编程功底; 2、了解 Kubernetes、Docker等云原生技术工具,了解Spark、Flink等大数据领域技术框架 ; 3、加分项:具备一定分布式、大数据软件开发经验优先;了解主流深度学习框架 TensorFlow/Pytorch/MXNet 等优先; 4、有强烈的自主学习能力、执行力,具备良好的沟通能力和优秀的团队协作能力。 此岗位为腾讯集团旗下子公司编制岗位
-
岗位职责: -结合电商的业务特性,进行模型和算法创新,打造业行领先的机器学习/深度学习算法平台能力。 -超大规模的机器学习模型优化,包括但不限于深度学习、强化学习、表征学习等,最大效率地提升电商流量效率。 岗位要求: -计算机及相关专业,具有扎实的算法和数据结构,优秀的问题理解能力和编码能力。 -扎实的机器学习理论基础,具有行业常用的机器学习算法实践经验。 -熟悉业界主流的机器学习平台,有大规模机器学习平台的研发经验者优先,有Tensorflow/PyTorch等机器学习框架使用经验者优先。 -具有电商相关业务的算法实践经验者优先,包括但不限于推荐、广告、搜索等。 -良好的团队合作和协调沟通能力,学习能力强,自我驱动力强。
-
岗位职责: 1、结合电商的业务特性,进行模型和算法创新,打造业行领先的机器学习/深度学习算法平台能力。 2、超大规模的机器学习模型优化,包括但不限于深度学习、强化学习、表征学习等,最大效率地提升电商流量效率。 岗位要求: 1、计算机及相关专业,具有扎实的算法和数据结构,优秀的问题理解能力和编码能力。 2、扎实的机器学习理论基础,具有行业常用的机器学习算法实践经验。 3、熟悉业界主流的机器学习平台,有大规模机器学习平台的研发经验者优先,有Tensorflow/PyTorch等机器学习框架使用经验者优先。 4、具有电商相关业务的算法实践经验者优先,包括但不限于推荐、广告、搜索等。 5、良好的团队合作和协调沟通能力,学习能力强,自我驱动力强。
-
工作职责: 1、微众银行机器学习平台的建设开发与运营管理工作; 2、负责机器学习平台研发与维护,包含特征工程、模型训练、模型部署、模型管理、计算资源调度等MLOPS链路上功能迭代; 3、负责MLOPS相关体系在公司内部的运营、落地及使用,推进MLOPS适配不同的业务场景。 岗位需求: 1、大学本科及以上学历,计算机或者相关专业; 2、具备较强的主动承担意识和自我驱动力,良好的客户服务意识; 3、具备较强的主动学习意识和学习能力; 4、熟悉 Golang/Python/Java 语言,扎实的编程功底,有良好的代码品位和设计风格: 5、熟悉Kubernetes、Docker等常见工具和框架,熟悉容器化与云原生技术; 6、掌握常见的机器学习算法,同时了解风控开发流程; 7、具备机器学习平台开发及大规模模型训练推理经验优先,熟悉机器学习平台相关工具优先,如kubeflow、volcano、mlflow等。
-
10k-20k 经验不限 / 本科工具类产品,软件服务|咨询,IT技术服务|咨询 / 不需要融资 / 500-2000人岗位职责 1、独立负责模块研发(系分/编码/自测等),输出高质量代码、自测和功能交付。 2、具备风险意识,非功能性考虑充分、自测覆盖完善。 3、参与日常运营问题排查及支持。 岗位要求 1、JAVA基础扎实,理解IO、多线程、并发和集合等基础框架、了解OOP、OOD和常用设计模式;对JVM原理有一定的理解,并拥有优秀的编码能力、质量意识和解决问题的能力。 2、数据库基础扎实,理解事务机制、锁机制和SQL运行优化机制,并具有丰富的实践经验。 3、了解常见分布式开源框架的原理(Redis、Kafka、MQ等)、分布式系统设计、分布式缓存、消息等,并有一定的实践经验。 4、对互联网或分布应用开发的新潮流有关注,乐于学习和尝试新技术,追求编写优雅的代码,从技术趋势和思路上能影响技术团队。 5、积极主动、有较强的责任心和学习能力。
-
岗位职责: 1、负责私有云平台、虚拟化平台、容器云平台等多种虚拟化技术平台的建设及运维管理工作,包括软硬件选型、服务选型、工具建设、资源交付、容量/性能监测与调整、扩容/缩容、故障排除等; 2、负责设计、规划、建设和运营公司统一的网络、计算、存储资源池,优化高可用集群的架构和性能; 3、负责公司灾难恢复体系的建设及运营管理工作; 4、负责服务器类硬件产品运维管理工作,包括对PC服务器、小机、一体机、存储等的监控、调优、故障诊断、性能优化等; 5、负责物理机、虚拟机、裸金属的操作系统及镜像源等的运维与管理; 6、参与IT内部支持系统、运维自动化平台及其组件的设计与开发运维工作; 7、负责持续制定并完善服务器系统运维标准流程规范及灾备、应急处置规范等。 8、具备极好的跨部门沟通能力和团队管理能力。 任职资格: 1、本科及以上学历,计算机、通信等相关专业,8年以上服务器系统运维经验,其中3年以上互联网金融、银行、保险等行业经验,有带过团队; 2、精通服务器虚拟化相关技术,掌握主流如腾讯、阿里、青云等私有云平台、VMWare虚拟化平台及Rancher、Openshift、TKE等容器云管理平台; 3、精通常用操作系统(Windows、Linux),熟练使用Python、SHELL等脚本语言; 4、具备常见运维工具(如 Zabbix/ELK/Ansible/Docker 等)的使用经验; 5、具有良好的沟通协调能力,较强的团队合作精神、责任心和一定抗压能力。
-
岗位职责: 1.负责CDH大数据平台的安装和部署; 2.负责CDH大数据平台各组件的性能优化; 3.负责CDH大数据平台各组件的运行维护和状态监控; 4.负责新技术调研,并能在团队内进行推广应用。 任职资格: 1.理解大数据计算原理,精通Hadoop/Spark体系,了解大数据平台运营基本思路; 2.熟悉HDFS、HBASE、KUDU、SPARK、HIVE等hadoop核心组件,具有两年以上hadoop/Spark技术的运维经验; 3.理解MapReduce计算框架的思想,熟悉分布式计算模型; 4.至少精通一种大数据开发语言,如JAVA、scala等; 5.至少熟练使用一种脚本语言,如Shell、Python等; 6.热爱技术,工作认真、严谨,有团队精神。
-
岗位职责: 1、负责系统管理,包括系统软件(含中间件)的安装,配置,管理和备份等服务及应用系统日常处理服务等; 2、负责机房相关设备管理,如服务器、存储、一体机、机柜等设备; 3、负责监控、备份管理,包括基础设施、应用系统等资源数据; 4、基础设施中容器(Docker&Kubernetes)环境的安装设置,管理和维护; 5、基础设施相关的采购工作; 6、基础设施相关的项目管理; 7、与其它团队或者部门进行协调沟通工作。 职位要求: 1、精通Linux、Windows操作系统基本原理,掌握负载均衡、高可用等常用概念; 2、具备RHCE、RHCA、PMP等相关认证者优先; 3、熟悉常用WEB中间件,如weblogic、tomcat、nginx、apache等; 4、熟悉常用系统服务,如Redis、Mq、consul、等服务; 5、熟悉常用配置管理工具,如svn、git、maven、jekins、ansible等工具; 6、熟悉常用监控工作,如zabbix,cacti,Prometheus等; 7、熟悉云计算相关技术,如:KVM、Vmware、Docker、K8S等软件 8、具备独立写脚本的能力,如shell、python; 9、技术出众有特点,对云计算、自动化、分布式等新技术有探究; 10、管理经验强,要知识面广且有较多项目实践经验。
-
职责描述: 1、负责大数据运维体系搭建及大数据平台各个组件的运维; 2、负责大数据平台及相关组件的部署和维护,保证其稳定运行; 3、负责完善大数据平台运维监控工作。 任职要求: 1、本科或本科以上学历,计算机相关专业,3年以上大数据系统运维经验; 2、熟悉Windows/Linux操作系统; 3、熟悉Hadoop、Hive、Hbase、Yarn、Spark等组件的原理及运维方式; 4、熟悉中间件工作原理,对Tomcat/Redis/Nginx/Kafka有一定了解,具备一定的操作能力; 5、至少熟悉Java/PHP/Python/Bash/Shell一种或多种语言,可独立编写维护及监控; 6、工作细致、善于思考,有很强的问题分析和推进解决的能力; 7、有强烈的责任心、良好的沟通协调能力、极强的业务推动能力,勇于接受挑战; 8、良好的英文听说读写交流能力,能使用英语作为工作语言。
-
职位描述: 1、负责重点违规场景的规则及治理策略的设计及落地,对最终的治理效果负责; 2、有一定商家商品或行业治理经验,了解特定行业国家标准及风险特性; 3、能够通过数据、场景及各渠道信息定位及分析违规问题的根因并针对性制定策略; 4、与产运等部门配合,通过策略不断完善,提升违规的识别及召回能力,并为策略准确性负责; 5、能够通过日常治理工作,沉淀治理通用系统及数据能力,不断完善治理体系的建设及优化。 任职要求: 1、熟悉O2O或传统电商交易流程及各环节问题特点,对内容消费有一定了解和思考,充分熟悉其与传统电商差异; 2、3年及以上平台治理、策略运营等工作经验,对规则、识别、判责等治理动作有一定理解和经验; 3、具有较强的数据挖掘及分析能力,能够完成问题的根因分析,有完整产品模块的运营能力及经验; 4、目标感强,有韧性,善沟通,跨部门沟通协调能力强,能够独立完成复杂项目的孵化及落地; 5、本科及以上学历,具有较强的数据挖掘及分析能力,熟练运用SQL等统计分析工具者优先。