• 15k-25k 经验3-5年 / 本科
    电商,企业服务 / 上市公司 / 2000人以上
    职位描述: 1. 作为企业客户技术服务工作的第一责任人,深入了解客户业务场景,与客户的架构、开发、运维团队深入合作,梳理分析客户现有云产品及应用架构,围绕企业客户上云、云上业务设计稳定性优化方案,从云上监控,主动发现,灾难演练,业务快恢/降级方案,高可用架构改造等方面协助客户持续优化云上稳定性。 2. 与阿里云各团队充分合作,从客户架构视角出发进行问题处置、护航保障、风险治理,并沉淀输出最佳实践及工具产品,面向客户痛点主动进行专项高阶服务。 3. 追踪客户关键稳定性问题,持续协助客户治理并不断推动阿里云产品及服务的优化改进。 4.协助云上企业客户进行架构改造落地,并持续迭代降低使用成本,提升性能及业务连续性。 职位要求: 1. 3年以上制造、健康、零售等行业大型互联网应用或集团型企业应用的解决方案、架构设计、监控方案、Devops、AIops、维护、高可用改造方案经验。 2. 熟悉至少一个技术领域如:数据库,网络,OS,serverless,存储,音视频,大数据,大模型,Al等。 3. 熟悉云计算产品与技术原理,并有实操使用经验,有阿里云公共云产品相关使用运维经验优先。 4. 熟悉云原生的系统架构设计方法,有应用与数据迁移改造方案设计实施经验优先。 5. 具有优秀的沟通技巧、团队合作经验、敬业精神和学习能力。 6. 具有较强的抗压能力和执行力。 加分项: 1.有阿里云技术认证ACA(阿里云认证助理工程师)、ACP(阿里云认证工程师)、ACE(阿里云认证高级工程师)者优先。 2.有基于阿里云产品的大规模应用开发或运维经验。 3.有生产环境Al或大模型实施经验。
  • 15k-30k 经验在校/应届 / 硕士
    电商,企业服务 / 上市公司 / 2000人以上
    职位描述 1、负责云计算领域端到端解决方案的设计和交付,主导系统集成、工程问题的处理与闭环,确保项目的成功交付以及客户满意;  2、负责云上系统的运维,主导业务系统监控和故障处理,通过自动诊断等手段,确保云服务的稳定运行,并持续提升用户体验和产品能力;  3、基于客户业务场景的解决方案设计,通过工具化等手段快速对云上客户问题进行分析和解决,提升客户满意度  4、基于产品及解决方案的演进,进行前瞻性的服务方案设计,实现公共云/混合云/专有云等低成本、高质量的交付与维护;  5、负责工具体系的设计与开发,构建面向未来的交付、运维和服务平台;  6、对客户问题归纳总结,沉淀体系化工具平台,理解客户业务场景,推动产品和服务改进。  职位要求 1、客户服务意识强,具备良好的沟通理解和人际交往能力; 
 2、熟悉一种或多种编程语言优先,例如Java/Go/Python; 
 3、熟悉云服务/混合云相关技术(k8s/Docker等); 
 4、熟悉计算/操作系统/虚拟化/存储/网络/数据库/安全等产品的基本原理; 
 5、具备较强的定位、分析和解决问题的能力;
  6、抗压能力强,有责任心,有良好的团队合作意识。  工作地点可以选择如下城市 北京/杭州/上海/武汉/西安
  • 电商,企业服务 / 上市公司 / 2000人以上
    职位描述 1. 负责阿里云各种产品的文档、教程、最佳实践等形式的完整内容体系,为用户快速上手使用产品提供完整的支撑。 2. 参与制定和改进阿里云文档体系,包括流程、规范、工具、质量持续提升计划等,并能将其有效落地。 3. 和产品团队紧密联系,根据产品定位设计产品信息模型,组织内容开发,保持内容、产品的强一致性和准确性。 4. 负责整合、分析各渠道的用户反馈,制定内容改进方案建议、跟踪改进进度及改进效果,负责用户体验持续改进计划。 5. 负责对产品团队进行文档写作培训、文档质量标准宣导,提高技术团队整体写作能力。 职位要求 1. 本科以上(含本科)学历,信息类专业或者有IT从业经验。 2. 3年以上文档/技术开发/测试经验,对于内容开发感兴趣,并期望投身其中 3. 有快速学习能力,能尽快学习掌握云计算各种产品,做到理解原理,有能力验证产品,开发运维等。 4. 具备良好的项目管理、表达、沟通及协调能力。 5. 具备优秀的语言理解能力、信息架构能力及文档写作能力。 6. 有良好的客户服务观念,工作责任心强,注重团队合作。 7. 英语水平佳,大学英语六级以上水平。 优先录用条件: 有大型企业产品文档开发经验。 有丰富云计算产品使用或支持经验,熟知相关技术。 有开发运维经验。
  • 电商,企业服务 / 上市公司 / 2000人以上
    (一)职位要求 1、熟练掌握java技术栈,要求Java基础扎实,熟悉io、多线程、分布式、缓存、MQ,熟悉主流中间件; 2、3年以上Java开发的经验,熟练使用spring 、MVC等主流框架,熟悉Linux下的常用命令,熟悉MySQL等主流的数据库; 3、掌握常用设计模式,有大型应用的开发经验,具备应对大数据、分布式、高并发、高负载、高可用性等系统设计能力; 4、具备良好的抽象设计能力,思路清晰,善于思考,能独立分析和解决问题,责任心强,具备良好的团队合作精神和承受压力的能力; 5、有良好的项目规划和决策能力,善于捕捉业务需求、架构设计中存在的问题,并给出有效的解决措施和方法。 (二)岗位职责: 1、结合稳定性业务目标,依据产品需求高质量完成SRE工具支持平台,包括变更统一管控平台、故障全生命周期管理平台、应急协同平台、故障演练平台,稳定性隐患巡检平台、客户重保平台、可观测平台等开发工作; 2、负责项目设计与开发工作,对需求设计分析,系统架构设计与实现; 3、核心框架的技术选型和代码编写; 4、研发基础服务组件,解决共性需求,减少重复开发。
  • 35k-60k 经验3-5年 / 硕士
    电商,企业服务 / 上市公司 / 2000人以上
    岗位职责:(部分匹配即可) 1、针对大模型推理、训练等场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率; 2、能够使用Profiler手段,分析训练瓶颈,使用分布式策略调优、算子优化等手段来提升训练性能; 3、提升分布式推理下模型并行(ModelParalleism)、数据并行(Data Paralelism)等场景下的性能; 4、支撑异构AI芯片上的调度框架设计与优化,提升系统的实时性、吞吐率、算力利用率等指标; 5、针对不同端侧设备的硬件特性(CPU、GPU、NPU 等)进行镜像和训推框架适配,针对特定硬件架构和推理引擎进行性能优化; 6、深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法; 7、探索前沿技术方向(如混合专家模型MoE、强化学习算法等),推动AI工程化落地的效率提升。 岗位要求:(部分满足即可) 1、熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化等; 2、熟悉TensorRT-LLM、LMDeploy、vLLM、SGLang等大模型推理框架,有实际性能调优经验(如KV Cache优化、动态批处理、Attention算子定制等); 3、扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术; 4、至少熟练使用C++/Python/Golang中一种,具备良好的算法设计与代码实现能力; 5、熟悉Pytorch,Deepspeed等主流分布式框架的使用和原理,熟练掌握TensorFlow、PyTorch等深度学习框架; 6、了解深度学习算法基本原理,熟悉深度学习训练框架及其模型文件的解析; 7、了解通信架构原理、有分布式优化和通信优化经历者优先; 8、了解深度学习模型的量化压缩、推理加速等优化技术; 9、了解通信架构原理、有分布式优化和通信优化经历者优先。
  • 25k-50k·16薪 经验3-5年 / 本科
    电商,企业服务 / 上市公司 / 2000人以上
    职位描述: 阿里云API网关是阿里云管控API的入口,每天处理数以百亿计的请求。提供稳定、安全、高可用、可扩展的阿里云API网关对用户至关重要。阿里云API网关作为管控侧的统一网关,同时也集成了流量控制、访问和权限控制、审计、监控等各种横向能力,需要让这些能力稳定、高效的生长在网关上。 作为阿里云开放API - API网关团队的一员,你将迎接巨大规模和复杂性的挑战,跟团队一起以技术的方式解决难题、提升API网关的稳定性、安全性、可用性和可扩展性。阿里云API网关上承载了上百款云产品、上万个对外开放的管控API、以及百亿级别的日调用量。你需要对网关做体系化的设计和建设,兼顾稳定安全和效率,用业界的最佳实践打好地基。除此之外,你也需要善于跟其他云产品团队打交道,理解他们的场景和需求,以平台的思维推动阿里云统一网关的建设。 我们希望寻找一名有丰富后端研发经验、对技术有热情、注重工程质量和最佳实践的候选人加入到我们的团队!在阿里云API网关团队,你将服务阿里云用户海量的管控API请求,提供流量控制、访问控制、审计、监控等核心横向能力,做好阿里云API的“看门人”。我们相信,随着云计算技术的不断发展,它将会像水电煤一样成为社会的基础设施,为人们带来更多的便利和创新。作为阿里云开放API - API网关团队的一员,你将加入到一个充满使命感、热情激昂、不畏艰难的团队。诚挚期待你的加入,跟我们一起并肩作战,为用户提供无法计算的价值! 职位要求: ● 计算机相关专业本科及以上学历; ● 5年及以上的后端研发经验、其中至少2年以上是网关或相关领域的经验; ● 2年及以上领导复杂技术项目的经验,能够做好架构设计,带领项目成员突破技术难点,乐于培养新人、能够给新人高质量的建议和方向指引; ● 熟悉网络、分布式系统、API网关相关的知识,对复杂系统设计、分布式系统设计、可演进的架构设计有丰富的实战经验; ● 熟悉工程的最佳实践、能在日常工作中贯彻推行代码设计、代码测试、代码评审、CI/CD、部署运维等方面的最佳实践; ● 有AWS、Azure、GCP工作经验和国际化视野者优先,善于不断学习和自我提升。
  • 电商,企业服务 / 上市公司 / 2000人以上
    职位要求 1、系统研发:包括需求分析、功能设计、编码实现等,确保系统在功能和质量上能够满足用户需求。 2、平台架构治理相关工程化能力的建设:对各个横向平台架构能力进行持续守护。 任职要求: 1、专业要求:计算机基础知识扎实,熟悉计算机操作系统、计算机网络、数据结构、数据库、常用算法等。熟练掌握至少一门编程语言,如Java、Python。熟悉Linux环境开发、测试、调优、脚本。了解Docker、kubernetes等容器技术。 2、Java基础:扎实的Java编程能力,熟悉io、多线程、集合等基础框架。 主流框架与技术:熟练使用Spring、MVC等框架,熟悉Linux常用命令,MySQL等数据库。 设计模式:掌握常用设计模式。 3、有大型系统研发经验优先(存储、中间件、数据库、虚拟化、大数据等)。 4、有OpenStack、Vmware、虚拟专有网络等云计算相关研发经验优先。 5、年限:3年以上。 团队介绍: 阿里云专有云(以下简称专有云)是云智能集团针对企业级市场使用特点,历经十年磨砺为客户量身打造的开放、统一、可信的企业级云平台。专有云把握政企市场国产自主可控和自主创新、发展AI尤其是大语言模型应用两大趋势,为政企客户打造云数智一体的“云+AI”平台。下一个十年,专有云将继续与客同行,打造AI时代最开放的云。 统一算力运营平台团队负责专有云核心企业级特性的构建,在多Region、多AZ、多集群、多芯的统一平台架构之上,为客户上云、管云、用云提供全链路运营管理和服务能力支撑:通过迁云平台帮助客户的服务、数据快速上云;在管云方面,不仅提供面向资源和多云管理的云资源管理平台,还为客户业务连续提供了有备无灾的同城容灾、异地容灾和备份恢复能力;业界领先的云运营平台让客户自主化用云、可持续运营,同时可使用开放平台提供的各类API和IaC能力,满足云平台和客户系统集成的需求。此外,我们紧扣政企市场的发展趋势,持续在AI大模型、“一云多芯”、“一云多算”上开拓创新,提供面向AI工程开发和模型应用的一体化AI服务平台。
  • 40k-70k·16薪 经验5-10年 / 本科
    电商,企业服务 / 上市公司 / 2000人以上
    【岗位职责】 1、技术洞察和问题定义 •洞察领域发展方向,熟悉技术标准和前沿进展,跟踪关键竞对的技术和方法。 •结合产品现状提出待解决的问题,理解业务目标并分解到技术产品待解决问题中。 2、架构规划 •对所在领域业务进行架构抽象,建立整体业务领域模型。 •制定系统整体架构规划和技术路线图,确定系统目标和方向,综合考虑应用架构、数据架构、关键技术选型、部署架构等多方面因素,确保系统整体质量。 3、架构设计 •设计架构方案,包括系统组件、模块间的关系、接口、数据流和数据结构、基础设施等,保障系统的安全性、稳定性、易扩展、易维护和性能。 •把握业务全链路技术方案设计,确保技术可实现性、易用性,无重大风险。 •拆解工作,把复杂目标拆成一系列可以落到具体团队或个人的工作。 4、架构落地 •识别优先级、明确目标步骤和应急方案,保障架构实施落地和用户体验。 •梳理关键技术难点,指导开发团队进行突破和攻关,对开发过程进行监督和管理。 •负责部分核心代码编写,虚实结合,做好架构管理。 5、架构治理和演进 •制定架构的原则、规范与治理机制,并且落实到具体的项目研发中。 •负责架构管控,参与领域的重大架构决策,管控架构变更。 •识别不合理业务和架构设计,定期评估架构成熟度。 •基于业务需求和技术演进目标,指导开发团队对系统进行优化和扩展、解决技术债务,推动架构持续演进。 6、技术沉淀和赋能 •团队技术架构分享、技术文档和架构规范沉淀、学习引入新技术,赋能开发团队的技术成长,做好知识传承。 【职位要求】 • 8年以上工作经验,至少6年大型分布式系统或云计算重要领域的运维架构及开发经验 • 能够梳理、设计大型系统的架构,通过治理、改进、重构等方式主动降低全局复杂度,具体体现在对于困难问题,能够提出并落地简单的易于维护的解决方案。 • 能够合理地对于 1-2 年的系统演进和技术选型做出决策,能够识别技术复用的机会,在项目中复用团队内外部的技术,或者产出能被其他团队复用的技术。 • 有站在公司角度上的全局意识(或)技术产生业务增值。 • 能够主导核心业务或技术系统的架构设计和实际编码,通过对代码的code review、设计评审、单测覆盖,确保功能的交付质量和鲁棒性,有较强的问题分析和问题解决能力,是关键问题终结者 • 在稳定性、资损、安全等方面能够系统性保障,并持续跟进进展,有效预判并防范风险 • 能识别产品现状问题,并分解为多个可管理的小问题,更好地指导技术团队工作。 • 能平衡各相关方诉求,平衡产品及架构的长、短期需要,推动关键领域问题解决。 • 产品线研发安全生产构建者 • 能够在多产品/小型产品线/中型复杂系统层面严格遵循研发安全生产规范和流程,保障相关产品/技术/系统的可容灾、可观测、可处置、可运维、可快恢 • 熟练掌握业内主流的研发安全生产技术体系,并在团队内有效落地应用,提升产品/技术/系统的安全和稳定性 • 具有跨产品、中型复杂系统的研发安全生产经验,能够应对比较复杂的项目环境和各类突发状况,保障研发项目的平稳落地 • 在所负责团队层面严格遵循安全稳定演练体系,通过容灾演练、红蓝对抗、突袭演练等方式提前发现系统风险,基于稳定性演练持续培养技术团队的研发安全生产意识和专业能力 • 了解产品基本面,熟悉产品的全链路,能有效说明产品的本质。 • 熟悉技术领域相关的前沿信息渠道,并能在团队中进行技术分享。 • 熟悉竞对和对标产品的核心技术指标、优劣势对比,对我们如何追赶和保持优势有一定的理解。 • 通过内外部渠道理解客户诉求,并能结合自己的技术理解形成有价值的洞见。 211、985优先 大厂工作经历优先
  • 30k-50k·16薪 经验1-3年 / 硕士
    电商,企业服务 / 上市公司 / 2000人以上
    职位描述 1. 负责大语言模型的应用模式探索和落地,包括大不限于Agent,RAG,多模态等 2. 负责天基小蜜产品(基于LLM应用)在资源运维和运营等场景下的算法设计和优化,包括但不限于故障应急,人效优化,资源优化等 2. 负责日志数据和时序数据的特征挖掘,提升异常检测的准确率和召回率 3. 负责复杂故障场景下的多维度关联分析和根因定位的算法方案设计和实现 4. 负责智算资源的利用率分析和稳定性能力构建和应用 5. 结合以上方向的研究和实践,撰写发表论文,和业界、学术界保持良好的交流。 职位要求 1.计算机、数学或统计学相关专业硕士及以上学历; 2.熟练掌握Java/Python中至少一门语言,有扎实的数据结构和算法基础,具有良好的编程习惯; 3. 熟练掌握至少一种主流的深度学习框架,Pytorch,tensorflow等; 4.熟悉常用的机器学习算法,例如时序分析算法,日志分析算法等; 5. 熟悉LLM原理,训练和推理方案;了解大语言模型FT,HFRL,prompt调优等技术原理,了解RAG,Agent等应用模式和框架; 6.具备优秀的分析和解决问题的能力,良好的沟通协作能力; 7.有数据挖掘、机器学习、强化学习、信息检索、自然语言理解、AIOps等相关领域研究和实践经验,在以上领域的国际会议(SIGIR、SIGKDD、ICML、NIPS、WSDM、WWW、AAAI、CIKM、ACL、RECSYS)或者期刊上发表过论文者更佳; 8.参加过ACM或数据挖掘&机器学习类竞赛(天池大奖赛、Kaggle)并取得好名次者更佳; 9.参与过机器学习开源项目并有突出贡献者更佳。 https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=1092401&track_id=SSP*************NgQOiNwbsL6144
  • 30k-50k·13薪 经验5-10年 / 本科
    电商,企业服务 / 上市公司 / 2000人以上
      云原生技术专家职位描述: 作为云原生技术专家,您将负责在公司内部推广云原生技术,并协助团队利用这些技术提高开发效率和系统性能。您需要具备深厚的技术背景和对云原生技术的深刻理解,以确保团队在开发过程中能够快速解决技术问题。 主要职责: 1. 推广云原生技术:在公司内部普及云原生技术,提高团队对云原生技术的认识和应用能力。 2. 技术支持:为团队提供云原生技术方面的咨询和支持,协助解决技术问题。 3. 项目实施:参与云原生技术相关的项目实施,负责项目的技术方案和落地。 4. 技术研究:关注云原生技术的发展动态,进行技术调研,为团队提供新的技术方向和解决方案。 5. 知识分享:定期组织技术分享会,与团队成员分享云原生技术的知识和经验。 任职要求: 1. 本科及以上学历,计算机相关专业。 2. 3 年以上云原生技术相关工作经验,熟悉容器、微服务、服务网格等云原生技术。 3. 熟悉 Linux 操作系统,熟悉常用编程语言(如 GoLang、Python、C/C++ 等),具备扎实的编程基础。 4. 熟悉 Docker、Kubernetes 等云原生技术,有云原生组建开发经验者优先。 5. 具备良好的沟通能力和团队协作精神,能承受工作压力。 6. 有开源社区贡献者优先,有技术博客或文章发表者优先。 我们提供具有竞争力的薪酬和福利待遇,包括弹性工作时间、培训和职业发展机会等。如果您对云原生技术充满热情,并希望在一个充满创新和挑战的环境中发挥您的才能,欢迎加入我们!
  • 电商,企业服务 / 上市公司 / 2000人以上
    10+岗位等着你,有软件开发、运维、技术支持、产品经理等经验的同学都可以来试试看。 1. 你有3年以上软件开发经验,会写代码,做过项目,语言不限,js, java, python, 客户端开发等都行。 2. 你做过软件系统运维,搞过k8s、openstack、cicd等。 3. 你做过技术支持、写过答疑文档,懂产品技术。 4. 有互联网产品设计调研经验,对市场敏感。 诚云科技的文档工程师岗位很需要你的加入。和我们一起去学习使用阿里云产品,一起建设阿里云产品的文档。
  • 15k-30k·16薪 经验1-3年 / 本科
    电商,企业服务 / 上市公司 / 2000人以上
    职位描述 1.客户服务:提供专业、及时的客户服务,帮助客户更好地使用阿里云产品和服务;可以快速响应客户问题和故障,协调内部资源以解决客户面临的问题:在服务、运维、业务合作等多万面为客户提供体验升级; 2.推动续签和Upsel:定期与客户沟通收集反馈,挖掘产品和技术需求:在和客户的合作过程中,帮助客户理解网络、存储、数据库、A智算等阿里云产品的技术价值;通过有效的资源整合和运作,推动客户快速决策,实现续签和Upsell 3.与客户关键人员建立长期的合作关系,提升客户满意度,并在合作中获得关键性支持 职位要求 1.本科及以上,计算机或泛计算机专业 2.1-3年以上云计算相关行业,有To B售后或售前关工作经验,了解客户售前售后业务流程 3. PaaS, SaaS层产品经验优先
  • 400k-410k 经验在校/应届 / 硕士
    电商,企业服务 / 上市公司 / 2000人以上
    阿里云云原生中间件团队负责分布式软件基础设施,为阿里云上万家企业提供如消息服务、微服务引擎、服务治理等分布式基础服务,加速企业上云的进程和创新速度。同时,云原生中间件团队也服务着阿里集团众多核心业务和场景,是支撑双十狂欢节的最核心团队之一。 在这里,有世界一流的中间件产品和场景,有世界领先的企业互联网架构平台,服务上万家阿里云的企业,支持世界最大的电商交易业务场景。 在这里,你会参与到全球最**的开源项目(如RocketMQ、Nacos、Arthas、Istio、Envoy、Kubernetes、ServiceMesh、Serverless)和阿里云核心商业化产品(MQ、MSE、ARMS) 研发工作中,一同拓展云原生技术的边界,既赋能阿里巴巴集团,更服务全世界的开发者用户。 岗位要求: 1. 本科以上学历,计算机、电子工程、通信等相关专业; 2. 具备扎实的数据结构和计算机系统基础,精通一种开发语言; 3. 对基础软件充满热情,具备较好的动手能力和技术热情,有成功的研究型或实战型项目技术成果落地者优先; 4. 关注开源技术,有开源贡献者优先; 5. 快速学习,不断突破技术瓶颈,乐于探索未知领域,随时准备好去面对新挑战; 6. 良好的团队合作精神,能够做到严谨、皮实、乐观。
  • 18k-24k·16薪 经验3-5年 / 硕士
    电商,企业服务 / 上市公司 / 2000人以上
    1.只要你是云原生(网络、虚拟化、容器、微服务)、数据库、大数据、大模型任一方向的技术背景,只要你希望转型从事云计算技术服务方向都可以联系我。 2. 与阿里云各团队充分合作,从客户架构视角出发进行问题处置、护航保障、风险治理,并沉淀输出最佳实践及工具产品,面向客户痛点主动进行专项高阶服务。 3. 追踪客户关键稳定性问题,持续协助客户治理并不断推动阿里云产品及服务的优化改进。 4. 协助云上企业客户进行架构改造落地,并持续迭代降低使用。
  • 20k-40k 经验1-3年 / 本科
    电商,企业服务 / 上市公司 / 2000人以上
    1. 与对应的产品,设计同学最好协同.高质量快速落地智能合同产品的相关前端需求 2. 负责相关系统架构设计和稳定性优化 3. 对负责的需求进行一定的数据分析并且给出优化建议、推动落地