-
职位JD: 职位名称:容器服务统一调度工程师 公司名称:XX科技公司 职位描述: 我们正在寻找一位有经验的容器服务统一调度工程师,负责公司系统的容器化部署和调度工作。 主要职责: - 设计和实现容器化部署方案,确保应用程序的高可用性和可扩展性。 - 管理和维护公司的容器服务,确保它们的安全性和可靠性。 - 设计和实现容器化应用程序的统一调度策略,提高系统的性能和可扩展性。 - 监控和解决容器化应用程序的问题,确保应用程序的稳定性和可靠性。 - 与其他团队协作,理解和实现业务需求,并将其转化为容器化应用程序。 职位要求: - 3年以上容器化部署和调度的工作经验,熟悉Docker、Kubernetes、LXC等容器化技术。 - 熟悉Linux系统和容器化部署工具(如Docker、Kubernetes、LXC等)。 - 熟悉网络和安全管理知识,了解常见的安全漏洞和攻击方式。 - 具备良好的编程技能和逻辑思维能力,能够独立工作和与团队协作。 - 熟悉敏捷开发和DevOps最佳实践。 如果具有以下技能和经验,我们将非常感兴趣并寻求您的加入。 - 3年以上容器化部署和调度的工作经验,熟悉Docker、Kubernetes、LXC等容器化技术。 - 熟悉Linux系统和容器化部署工具(如Docker、Kubernetes、LXC等)。 - 熟悉网络和安全管理知识,了解常见的安全漏洞和攻击方式。 - 具备良好的编程技能和逻辑思维能力,能够独立工作和与团队协作。 - 熟悉敏捷开发和DevOps最佳实践。 公司提供具有竞争力的薪酬和福利,包括有竞争力的薪资、完善的福利计划、培训和晋升机会等。
-
(一)职位要求 1、熟练掌握java技术栈,要求Java基础扎实,熟悉io、多线程、分布式、缓存、MQ,熟悉主流中间件; 2、3年以上Java开发的经验,熟练使用spring 、MVC等主流框架,熟悉Linux下的常用命令,熟悉MySQL等主流的数据库; 3、掌握常用设计模式,有大型应用的开发经验,具备应对大数据、分布式、高并发、高负载、高可用性等系统设计能力; 4、具备良好的抽象设计能力,思路清晰,善于思考,能独立分析和解决问题,责任心强,具备良好的团队合作精神和承受压力的能力; 5、有良好的项目规划和决策能力,善于捕捉业务需求、架构设计中存在的问题,并给出有效的解决措施和方法。 (二)岗位职责: 1、结合稳定性业务目标,依据产品需求高质量完成SRE工具支持平台,包括变更统一管控平台、故障全生命周期管理平台、应急协同平台、故障演练平台,稳定性隐患巡检平台、客户重保平台、可观测平台等开发工作; 2、负责项目设计与开发工作,对需求设计分析,系统架构设计与实现; 3、核心框架的技术选型和代码编写; 4、研发基础服务组件,解决共性需求,减少重复开发。
-
1. 理解所负责的容器平台的技术原理、架构和使用场景,对容器平台调度/容器运行时/应用编排/serverless/弹性容量/可观测等特性,可以进行产品设计、输出对内对客产品方案。 2.理解微服务体系架构(例如springcloud/dubbo等),从注册发现/治理/apm/日志等细节场景,推进容器集成设计、输出对内对客产品方案。 3. 根据对云计算平台以及企业用户的业务需求,从稳定性、功能、性能、可用性等方面,负责设计、实现、改进、规划云产品,不断提升云原生容器产品的市场竞争力和市场份额。 4. 和前线产品线架构师/SA/BTE销售紧密合作,了解客户当前在技术上遇到的困难,通过产品&技术推动业务发展。 5. 熟悉产品商业化过程,知道如何借助产品、品牌、市场运营,推动客户成功、产品成功。 职位要求 1. 熟悉 Kubernetes、容器、Serverless、Istio等容器和云原生技术,熟悉微服务架构、Serverless基础设施、DevOps流程与工具;有企业服务背景优先;有AI,大数据背景者优先。 2. 收集产品落地中的客户需求,推动产品迭代,持续进行产品改进; 4. 对内部产品架构师/合作伙伴进行解决方案赋能,迭代提升解决方案与客户需求匹配度 5. 职位要求贴近业务,能够适应出差、一定频率的客户拜访。 6. 有开发背景/基础架构设计背景优先。
-
1、负责浙江省范围内互联网领域的云业务拓展,包括数字商业、游戏、互娱、社交、资讯平台、互联**育、互联网医疗、企业SAAS服务、人工智能、大数据、物联网、区块链、互联网+产业等相关领域客户的云业务拓展。要求对浙江互联网市场格局有洞察,通过对客户业务的分析和判断,推荐合适的云计算相关产品,形成交易闭环,达到业务收入目标; 2、负责梳理客户的IT全貌,适配阿里云解决方案并挖掘项目机会,对重点项目进行管理、包括统筹资源进行技术交流和技术测试、商务谈判、管控项目风险,为阿里云在客户的目标结果及价值呈现负责; 3、成为行业专家,有咨询能力,理解客户的业务,有商业敏锐度。基于客户业务及数字化价值出发,在客户发展不同阶段给到客户合理的数字化改造建议。能够对AI、大数据、云原生、区块链、营销等领域有洞察,通过技术赋能为客户业务带来价值提升,互利共赢 ; 4、负责大客户的维护和业务拓展,深度与大客户形成紧密的合作关系,为阿里云创造客户价值,与客户建立友好互信、长期的合作关系。 职位描述 1、大学本科及以上学历,5年以上互联网或云计算相关行业的工作经验,对浙江大型互联网企业有服务经历1年以上的优先考虑; 2、解决方案销售,对云计算产品,尤其需要对云原生、RTC、CDN、大数据、AI有比较深刻的认知,具备与客户技术人员对话的能力; 3、具备良好的沟通能力和内部协调能力,能够理解客户的诉求和痛点,有同理心、责任心、敬畏心,具备和客户高层对话能力的优先考虑; 4、具备良好的职业素养,要求善于资源整合、团队协作,服务意识强,敢于挑战,对新鲜事物有好奇心,有较强的学习能力。 5、具备互联网相关客户单项目500万以上销售经历,或有ACP或者ACE证书者优先考虑。
-
工作职责: 1、策划模拟经营类大型3D游戏主体架构,主体游玩逻辑规则,以及各大主系统功能策划 2、熟悉任务和玩法模式编写,游戏数值设定等; 3、负责游戏内各大系统,包括但不限于系统功能模块、玩法模式规则、载具装备功能等方面内容的设计和质量总控与跟进执行; 4、协助制作人进行细节实现,推动策划、美术、技术工作进度; 5、负责对功能进行验收和测试管控,保证产品质量; 6、负责产品开发各部门关系协调,保证游戏内资源合理优化配置。 7、研究游戏行业发展趋势和走向及用户反馈,分析竞品及行业情况,实时调整产品策略。 任职要求: 1、本科以上学历,5年以上策划经验,2年以上策划团队管理经验,有模拟经营类游戏成功项目经验者优先 2、热爱模拟类,沙盒类游戏(波西亚时光,动森,牧场物语,我的世界),对这几种类型游戏理解深刻,有过多年游戏经验 3、主导过一款及以上多人游戏项目设计开发工作;较强的数据分析能力,能够根据游戏线上数据的情况分析出问题所在以及提供相应的优化策略; 4、充分了解主流游戏系统设计,能根据需求搭建系统框架;有成功线上产品的策划经验者优先;
-
职位描述: 负责阿里云网络安全防护平台和产品研发,直接参与系统设计和核心代码开发。包括但不限于如下方向:云平台边缘/南北/东西向各网络边界处防护网关,海量网络流量的实时采集和分析,防护系统高可靠性/高承载力架构演进,全局策略智能管控调度等。 职位要求: 1.计算机基础扎实,熟悉TCP/IP和HTTP等常见网络协议; 2.精通C/Go等编程语言,有相关大型项目开发经验; 3.对技术有激情,喜欢钻研,良好的学习能力和解决问题的能力; 4.良好的表达、组织、沟通和协作能力;
-
【职位描述】 1.负责阿里云中小企业应用产品、控制台、营销、渠道等前端开发和体系建设; 2.负责前端技术开发和架构设计,推进新技术在业务中落地; 4.负责基础架构建设,并同时将能力沉淀为系统平台; 5.解决产品开发过程中的疑难问题,性能优化问题; 6.指导新同学开发,制定开发计划并执行落地。 【岗位要求】 1.前端技术扎实,技术专研能力强,对新事物和技术热情高,熟悉主流的思想; 2.在工程领域,前端框架(react,vue),全栈,移动,动画等领域有一项或是多项有深入研究(不仅仅只是使用); 3.执行力强,有良好的分析,总结能力。能够有效识别痛点,并找到有效的解决方案; 4.具备良好的团队协作精神,能利用自身技术能力提升团队整体研发效率,提高团队影响力; 5.在理解产品业务的基础上,提升产品的用户体验,技术驱动业务的发展; 6.业界有创新性技术沉淀,github负责的类库或框架 star超过500以上优先。
-
1.负责数字化运维平台的技术、商业化方向战略规划及落地,助力客户企业数字化转型。 2.带领团队提供决策和解决方案,实现产品及技术创新 3.识别业务和团队痛点,组织推动团队整体规划的执行,验证、复盘及优化,持续推动改进 4.负责主导一个或多个关键领域业务及技术创新突破。 职位描述 1.**本科及以上学历,具备技术、产品等跨团队管理经验 2.有足够强的业务产品意识,能够通盘考虑运营,商业化变现等。 3.具备丰富的架构设计经验,能够准确、全面理解业务,并根据业务情况设计合理的整体架构方案。 4.具备大规模复杂系统的设计开发经验,具有较完整的产品技术知识体系,并能结合到实际工作。 5.有良好的技术视野、对前瞻技术有敏锐的察觉,有很强的沟通能力,能够拉通多角色,拉通跨部门大团队协作。 6.超强的责任心,对自己的专业领域有充分的信心,敢于坚持敢于表达,追求**
-
主要工作内容: 1、技术方案设计 • 收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、技术架构、数据架构和开发流程 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 3、基础服务开发 • 洞察和抽象团队内的共性技术需求并形成基础服务技术方案 • 通过技术框架、技术领域SDK、web组件库、技术知识库等可复用能力的建设,不断提升团队研发效率和质量 4、技术洞察与研究 • 通过行业会议、技术媒体、学术研究、友商交流等方式,收集领域内的最新技术信息,包括但不限于技术原理、技术优劣势、应用场景等 • 追踪并定期分析竞对产品的核心技术指标和发展方向 • 通过内外部渠道,了解并洞悉客户需求,并凝练形成对应的技术洞察 5、技术规划 • 基于业务需求和技术洞察,制定技术团队的中长期发展规划和技术路线图 • 体系性的设计各类配套规划,包括技术人员规划、技术基础设施规划、技术质量规划、技术安全规划等 6、项目管理 • 确定项目目标和范围,并拟定项目计划、预算和资源需求计划、项目风险评估、交付成果等 • 组建项目团队,明确项目各岗位职责和任务,配备必要的资源,并设计高效的协作机制 • 按项目计划进行落地实施,并对项目进度、数据、质量进行监控,确保项目保质保量实施 • 总结项目经验和教训,反馈项目成果和绩效,为之后的项目管理沉淀经验总结 岗位要求: • 3年以上应用开发经验 • 参与过完整的应用项目开发 • 熟悉技术领域相关的前沿信息渠道,定期形成相关的前沿研究文档沉淀并能在团队中进行技术分享 • 熟悉竞对和对标产品的核心技术指标、优劣势对比,对我们如何追赶和保持优势有一定的理解 • 通过POC、产品经理、PDSA等内外部渠道理解客户诉求,并能结合自己的技术理解形成有价值的洞见 • 独立负责多个技术模块或全部模块并可参与团队内或跨团队项目 • 能够理解复杂度适中的业务需求和技术需求的关联性,做出合理的技术选型判断,并独立完成产品功能/相应SDK的技术方案设计 • 能够负责一个大型项目的子模块开发职责,并提供高质量的代码产出和文档沉淀,积极参与推动code review,提交代码前完成自测,对技术领域基本原理有深刻理解,同时具备一定技术攻坚能力,同时具备一定技术攻坚能力,能够解决单点复杂技术问题和工单(如一个较为复杂业务的性能优化、一个较低概率出现的稳定性问题) • 具备较强的风险意识,能准确识别、暴露风险,并且推动风险得到有效解决 • 子系统研发安全生产执行者 • 具备较强的研发安全生产意识,熟悉所负责子模块、子系统以及横向关联子模块、子系统的安全生产风险及预防措施,能够处置和恢复较复杂的安全和稳定性故障 • 在所负责的子模块、子系统的全链路研发流程中(需求理解、设计、测试、发布、运维)上严格遵循研发安全生产规范,保障系统的安全和稳定 • 具备参与研发安全演练的技术能力 • 熟悉系统使用场景,能根据业务场景设计系统的能力,抽象功能需求,优化性能 • 对关联业务、业务发展、行业产品有基本了解 • 正确认知所在技术模块的业务定位 • 具备和业务或者团队内外的上下游产品的互动能力,能够主动理解任务/需求与团队和项目其他人工作之间关系 • 初步具备中等复杂度项目的管理能力
-
关于我们 加入阿里云飞天企业版团队,您将参与构建面向云原生、DevOps、IoT、AIOps、时序存储与安全分析的企业级大数据服务,并参与面向 AI 的智能化能力落地。在国内最大规模的云平台上,解决真实且复杂的工程问题,成长与影响力并重。 参与企业级大数据产品的核心分布式架构设计与性能优化; 推动微服务平滑拆分与弹性扩缩容,提升系统自愈能力与可观测性; 深度结合安全、容灾与自动化运维,保障企业级服务的合规与可靠性; 有机会将前沿云计算与 AI 能力快速落地,参与产品长期演进规划。 ========= 负责飞天企业版大数据类产品的分布式系统开发与架构演进,推动微服务化与弹性扩缩容方案落地。 优化系统性能与资源使用(内存/CPU),设计退避、限流、熔断等容错与自愈机制。 主导或参与底层库与中间件的调优、代码重构与可测试性改进,提升系统可维护性。 构建与完善漏洞自动化修复、容灾恢复流程,支持企业级特殊服务/数据场景。 与产品、运维、测试等团队协同,推动线上演进、容量规划与可靠性保障。 岗位要求 熟练掌握 C++/Python/Go/Java 中至少一种,具备良好的编码规范与单元测试习惯;熟悉代码重构与常用设计模式。 三年以上分布式系统开发经验,有公有云/私有云相关项目经验优先。 了解编程语言演进与 Core Guidelines(如 C++ Core Guidelines)者优先。 熟悉 Folly、Abseil、ElasticSearch、ClickHouse、Kafka 等大数据基础开源组件,能阅读源码并有社区贡献或提交者优先。 熟悉 Kubernetes 等容器编排/分布式管控系统;使用过 Azure Stack、AWS Outposts 等专有云/混合云解决方案者更佳。 学习能力强,对云计算前沿技术充满热情,能将新技术快速工程化并在产品迭代中做出合理权衡与规划。
-
职位描述: 1. 作为企业客户技术服务工作的第一责任人,深入了解客户业务场景,与客户的架构、开发、运维团队深入合作,梳理分析客户现有云产品及应用架构,围绕企业客户上云、云上业务设计稳定性优化方案,从云上监控,主动发现,灾难演练,业务快恢/降级方案,高可用架构改造等方面协助客户持续优化云上稳定性。 2. 与阿里云各团队充分合作,从客户架构视角出发进行问题处置、护航保障、风险治理,并沉淀输出最佳实践及工具产品,面向客户痛点主动进行专项高阶服务。 3. 追踪客户关键稳定性问题,持续协助客户治理并不断推动阿里云产品及服务的优化改进。 4.协助云上企业客户进行架构改造落地,并持续迭代降低使用成本,提升性能及业务连续性。 职位要求: 1. 3年以上制造、健康、零售等行业大型互联网应用或集团型企业应用的解决方案、架构设计、监控方案、Devops、AIops、维护、高可用改造方案经验。 2. 熟悉至少一个技术领域如:数据库,网络,OS,serverless,存储,音视频,大数据,大模型,Al等。 3. 熟悉云计算产品与技术原理,并有实操使用经验,有阿里云公共云产品相关使用运维经验优先。 4. 熟悉云原生的系统架构设计方法,有应用与数据迁移改造方案设计实施经验优先。 5. 具有优秀的沟通技巧、团队合作经验、敬业精神和学习能力。 6. 具有较强的抗压能力和执行力。 加分项: 1.有阿里云技术认证ACA(阿里云认证助理工程师)、ACP(阿里云认证工程师)、ACE(阿里云认证高级工程师)者优先。 2.有基于阿里云产品的大规模应用开发或运维经验。 3.有生产环境Al或大模型实施经验。
-
岗位职责:(部分匹配即可) 1、针对大模型推理、训练等场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率; 2、能够使用Profiler手段,分析训练瓶颈,使用分布式策略调优、算子优化等手段来提升训练性能; 3、提升分布式推理下模型并行(ModelParalleism)、数据并行(Data Paralelism)等场景下的性能; 4、支撑异构AI芯片上的调度框架设计与优化,提升系统的实时性、吞吐率、算力利用率等指标; 5、针对不同端侧设备的硬件特性(CPU、GPU、NPU 等)进行镜像和训推框架适配,针对特定硬件架构和推理引擎进行性能优化; 6、深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法; 7、探索前沿技术方向(如混合专家模型MoE、强化学习算法等),推动AI工程化落地的效率提升。 岗位要求:(部分满足即可) 1、熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化等; 2、熟悉TensorRT-LLM、LMDeploy、vLLM、SGLang等大模型推理框架,有实际性能调优经验(如KV Cache优化、动态批处理、Attention算子定制等); 3、扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术; 4、至少熟练使用C++/Python/Golang中一种,具备良好的算法设计与代码实现能力; 5、熟悉Pytorch,Deepspeed等主流分布式框架的使用和原理,熟练掌握TensorFlow、PyTorch等深度学习框架; 6、了解深度学习算法基本原理,熟悉深度学习训练框架及其模型文件的解析; 7、了解通信架构原理、有分布式优化和通信优化经历者优先; 8、了解深度学习模型的量化压缩、推理加速等优化技术; 9、了解通信架构原理、有分布式优化和通信优化经历者优先。
-
签约公司为阿里云子公司诚云科技 职位描述 1、项目管理与协调:负责项目进度排期、资源分配、风险管理,以及项目启动(KO)、结项等生命周期管理; 2、流程规范与数字化:执行项目流程机制规范,支持数据分析和业务指标拆解,参与建立需求及项目管理的数字化系统; 3、跨部门协作与流程建设:参与流程规范及产研流程协作机制建设,协助内部资源协调和跨部门(如销运、产管、财务、法务、采购)协作,解决业务流程中的卡点问题; 4、技术领域效能分析:分析解读技术领域的效能数据,确保项目目标的达成; 5、质量与时间目标保障:负责单个子产品/系统或跨多个产品线的项目管理,确保达成时间和质量目标; 职位要求 •3年以上工作经验,至少2年研发项目或交付项目管理经验; •(专有云)10人以上项目团队管理经验; 有开发、测试、运维经验 •跟进项目按时交付,监控成本等指标风险,主持重点项目管理、落地,确保项目目标的达成 •应用项目管理规范,建立基本机制,组织项目方案讨论,汇总问题,推动问题上升决策和解決 •具备良好的沟通和服务支撑能力,助力各方协同达成共识 •理解产品/技术领域的相关知识和技术逻辑,把控项目过程中的成本、进度、风险 。参与重点项目方案制定,主持项目/子项目的规划分解,组织项目相关干系人沟通协调,达成决议和共识 •负责重点项目的项目管理,协同团队实现项目按时交付,确保目标达成 •沉淀可复制的项目管理方法和规范,敏锐发现影响产研效率的问题
-
1、至少3年以上的弹性计算、数据库、存储、网络、大数据等相关工作经验,并在某个专业领域有一定技术深度。 2、熟悉云计算产品与技术原理,并有实操使用经验,有阿里云公共云产品相关使用运维经验优先。 3、熟悉云原生的系统架构设计方法,有应用与数据迁移改造方案设计实施经验优先。 4、具有较强的责任心、抗压能力,并能接受一定频率的出差。 5、具有较强的沟通表达能力、文档写作能力。
-
职位要求 1、系统研发:包括需求分析、功能设计、编码实现等,确保系统在功能和质量上能够满足用户需求。 2、平台架构治理相关工程化能力的建设:对各个横向平台架构能力进行持续守护。 任职要求: 1、专业要求:计算机基础知识扎实,熟悉计算机操作系统、计算机网络、数据结构、数据库、常用算法等。熟练掌握至少一门编程语言,如Java、Python。熟悉Linux环境开发、测试、调优、脚本。了解Docker、kubernetes等容器技术。 2、Java基础:扎实的Java编程能力,熟悉io、多线程、集合等基础框架。 主流框架与技术:熟练使用Spring、MVC等框架,熟悉Linux常用命令,MySQL等数据库。 设计模式:掌握常用设计模式。 3、有大型系统研发经验优先(存储、中间件、数据库、虚拟化、大数据等)。 4、有OpenStack、Vmware、虚拟专有网络等云计算相关研发经验优先。 5、年限:3年以上。 团队介绍: 阿里云专有云(以下简称专有云)是云智能集团针对企业级市场使用特点,历经十年磨砺为客户量身打造的开放、统一、可信的企业级云平台。专有云把握政企市场国产自主可控和自主创新、发展AI尤其是大语言模型应用两大趋势,为政企客户打造云数智一体的“云+AI”平台。下一个十年,专有云将继续与客同行,打造AI时代最开放的云。 统一算力运营平台团队负责专有云核心企业级特性的构建,在多Region、多AZ、多集群、多芯的统一平台架构之上,为客户上云、管云、用云提供全链路运营管理和服务能力支撑:通过迁云平台帮助客户的服务、数据快速上云;在管云方面,不仅提供面向资源和多云管理的云资源管理平台,还为客户业务连续提供了有备无灾的同城容灾、异地容灾和备份恢复能力;业界领先的云运营平台让客户自主化用云、可持续运营,同时可使用开放平台提供的各类API和IaC能力,满足云平台和客户系统集成的需求。此外,我们紧扣政企市场的发展趋势,持续在AI大模型、“一云多芯”、“一云多算”上开拓创新,提供面向AI工程开发和模型应用的一体化AI服务平台。


