-
职位职责: 1、负责云网络AI Infra业务研发,探索推理框架与云网络系统的深度集成,优化大模型推理性能; 2、推动云网络与大模型加速相关生态建设,设计和实施AI Infra中云网络的软硬结合解决方案; 3、持续跟进LLM前沿技术和开源方案,完成业务场景化分析,并落地云网络产品,提升产品竞争力。 职位要求: 1、计算机相关专业,本科以上学历,5年以上研发/架构经验; 2、熟悉主要云厂商的AI Infra解决方案,有分布式计算和网络项目经验; 3、熟悉主流AIGC算法模型原理,熟悉LLM/CV/NLP/推荐系统等业务场景的系统和原理; 4、有高性能网络(如RDMA、NCCL、MPI等)开发经验者优先。
-
职位职责: 1、负责云网络AI Infra业务研发,探索推理框架与云网络系统的深度集成,优化大模型推理性能; 2、推动云网络与大模型加速相关生态建设,设计和实施AI Infra中云网络的软硬结合解决方案; 3、持续跟进LLM前沿技术和开源方案,完成业务场景化分析,并落地云网络产品,提升产品竞争力。 职位要求: 1、计算机相关专业,本科以上学历,5年以上研发/架构经验; 2、熟悉主要云厂商的AI Infra解决方案,有分布式计算和网络项目经验; 3、熟悉主流AIGC算法模型原理,熟悉LLM/CV/NLP/推荐系统等业务场景的系统和原理; 4、有高性能网络(如RDMA、NCCL、MPI等)开发经验者优先。
-
岗位职责: 1 开发和维护GPU服务器及集群的自动化验收和部署工具; 2 部署和运维各GPU集群,监控和识别常见问题及推动解决; 3 部署和运维公司业务系统所需的平台组件,包括k8s、日志、监控、报警系统等; 4 组织落地新增IDC服务器上机事宜,包含网络、存储等规划和实施等。 任职要求: 1 计算机专业或相关专业,本科学历学位,能独立完整阅读理解纯英文技术文档; 2 3年-7年相关工作经验,有Infra或SRE工作经验,熟悉DevOps流程,一手承担过运维工作; 3 精通Linux,熟悉docker、k8s,了解Ansible、Helm,了解微服务架构; 4 熟悉常用组件的部署和维护,如mysql、redis、MQ、ELK、prometheus、grafana等; 5 熟悉shell脚本,熟练掌握git; 6 热爱技术,钻研本质,终身学习,在工作中不被经验束缚,从**性原理出发思考问题。
-
岗位职责 工作地点:深圳,北京、上海、杭州、苏州、南京、成都、西安。 1、IP 验证,根据 spec 提取测试点、制定验证计划; 2、搭建验证平台,编写验证用例,执行验证; 3、Failure、Bug 分析及定位,Coverage 分析及收敛; 4、按时、保质完成各节点的交付; 5、开发验证相关的自动化工具。 任职要求 1、微电子、电子工程、通信、计算机等专业本科及以上学历,5年以上相关工作经验,有 IP 验证经验,有ISP验证经验优先; 2、精通 Verilog/SystemVerilog 和 UVM,能够独立搭建验证环境; 3、精通 C/C++等编程语言,熟悉 reference model 的开发及使用; 4、掌握至少一种脚本语言:Makefile、Perl、Python、Ruby、Tcl 等; 5、熟悉常用 EDA 工具的使用,如 verdi、vcs、ncsim 等; 6、具备强烈的责任心、驱动力和schedule意识,良好的学习能力、团队合作精神、沟通表达和问题分析能力。 加分项 a)有 ISP 验证经验 b)有 NPU 验证经验 c)熟悉视频编解码
-
职位描述与方向: 1. 负责各类业务场景的 GraphQL 及其他协议接口开发与服务发布; 2. 美餐服务 log、tracing、metrics 等可观察性相关内容迭代、维护; 3. 以 Node.js 框架为主的 BFF 层开发; 4. 与产品、设计师、后端工程师密切合作,参与开发、优化业务接口; 5. 参与 GitLab CI/CD、Docker 与 AWS 等技术实践。 职责与任职要求: - 前端 HTML、CSS、JavaScript 基础知识扎实; - 精准产品业务流程、需求,愿意为提升用户体验作出最大努力; - 熟悉 HTTP、TCP、UDP 等常见协议; - 熟悉 Node.js 服务测试流程,懂得如何写出可测试的代码; - 熟悉 GitFlow 流程; - 能独立完成工作、具备优秀的时间管理与英文文档阅读能力; - 至少有一个以 Node.js 为主的项目开发经验,并了解 BFF 实践与微服务或其他主流架构,有具体实践为佳; - 良好的沟通能力,有责任心,愿意自我驱动,爱折腾新鲜事物,能够快速学习新技术并实践。 我们的技术栈: - TypeScript、ES2020+ - React 17+、Redux、MobX、Next.js、Webpack、SWC - Express、NestJS、GraphQL、WebSocket、Protocol Buffers、gRPC、Jest、RxJS - Grafana、ELK、Jaeger、Redis、DynamoDB - Docker、K8s、GitLab、AWS、Serverless 加分项: - 服务端监控开发、维护经验; - 使用过 AWS、腾讯云、阿里云等云服务; - 有微前端、CLI、SDK、低代码平台开发经验; - 了解其他语言,如 Python、Go、Java、Kotlin 等; - 使用过 Figma、Sketch 等设计工具。 工作风格、福利及其他: - 提倡 Work-Life Balance,目标内可自由安排工作时间并以结果为导向,拒绝 996 和无效加班; - 公司实行扁平化管理,无 leader 概念,有 Scrum 中的 SM 和 PO 角色; - 周期性技术分享,组织参加 GopherChina、JSConf、AWS Summit 等技术会议; - 入职即配置任意品牌电脑,每 2 年换新,旧电脑归个人所有; - 配置 Herman Miller Embody 人体工学椅、电动升降桌; - 定期组织团建,每周有足球、篮球、羽毛球等体育活动; - 期权分配。
-
岗位职责: - 协助团队负责人监控团队日常运营并准备管理仪表板; - 调查/实施/维护对 AIA TSS 所有用户的基础设施服务/流程; - 带领项目组实现项目目标; - AIA TSS 用户的日常运营支持服务(包括网络和服务器); - 供应商和资源管理; - 提供动手BCP/DRP 演练支持和技术解决方案; - 在日常运作中严格遵守 AIA 标准和内部程序/指南; - 按照指示完成其他相关任务。 任职要求: - IT 或相关学科本科及以上学历; - 至少2年 IT 工作经验; - 良好的英文读写能力; - 扎实的网络和 Windows 支持经验; - CCNA/CCNP/MCSE/MCSA 等 IT 认证是一个优势; - 团队合作精神,成熟,乐于承担责任和挑战。
-
职位描述: 负责自动驾驶车端软件的开发工作,包括软件系统架构设计、中间件开发、提供完善的自动驾驶系统framework等。 职位要求: 1. 计算机、软件相关专业本科及以上学历 2. 熟练掌握C++,包括C++ 14后的的新特性,有大型C++项目开发经验 3. 熟练掌握常用的数据结构、算法和设计模式 4. 具备良好的编码规范,能够和团队充分沟通协作,对工作富有责任心,有良好的自我驱动力 加分项: 1. 有自动驾驶或机器人相关领域经验 2. 有大型framework的开发经验 3. 有向大型开源项目贡献过代码
-
职位描述: 负责自动驾驶车端软件的开发工作,包括软件系统架构设计、中间件开发、提供完善的自动驾驶系统framework等。 职位要求: 1. 计算机、软件相关专业本科及以上学历 2. 熟练掌握C++,包括C++ 14后的的新特性,有大型C++项目开发经验 3. 熟练掌握常用的数据结构、算法和设计模式 4. 具备良好的编码规范,能够和团队充分沟通协作,对工作富有责任心,有良好的自我驱动力 加分项: 1. 有自动驾驶或机器人相关领域经验 2. 有大型framework的开发经验 3. 有向大型开源项目贡献过代码
-
Infra Engineer - IT基础设施建设工程师
[广州·新港] 2023-03-2812k-16k·13薪 经验3-5年 / 本科IT技术服务|咨询 / 上市公司 / 2000人以上岗位职责: - 协助团队负责人监控团队日常运营并准备管理仪表板; - 调查/实施/维护对 AIA TSS 所有用户的基础设施服务/流程; - 带领项目组实现项目目标; - AIA TSS 用户的日常运营支持服务(包括网络和服务器); - 供应商和资源管理; - 提供BCP/DRP 实操支持和技术解决方案; - 在日常运作中严格遵守 AIA 标准和内部程序/指南; - 按照指示完成其他相关任务。 任职要求: - IT 或相关学科本科及以上学历; - 至少 3 年 IT 工作经验; - 良好的英文读写能力; - 扎实的网络和 Windows 支持经验; - CCNA/CCNP/MCSE/MCSA 等 IT 认证是一个优势; - 团队合作精神,成熟,乐于承担责任和挑战。 -
职位描述: 需要有良好的编码习惯和代码编写规范。能独立完成系统设计,编码工作和单元测试覆盖。 日常工作中,需要为应用开发团队、算法团队提供一些框架性的支持。 能够利用一些开源工具完成服务器的日常维护工作。 职位职责: - 负责QT应用的性能优化、网络通信框架的维护。 - 通过terraform和ansible完成服务器与数据库的部署与维护工作(<10台)。 - 完善现有AI模型训练的框架,并在指导下承接后续的开发与维护工作,给算法团队提供可以平行扩展的模型训练服务。 岗位要求: 本科及以上学历,Linux开发经验,熟悉linux网络编程; 熟练掌握C/C++ 和 Python编码,能书写规范的单元测试; 良好的沟通协调和学习能力,敏捷的思维辨证能力,优秀的团队合作精神; 有工作热情,具有良好的沟通技巧和团队合作精神,抗压能力强; 良好的英文阅读能力,较好的听说能力; NOIP、NOI、ACM / ICPC获奖是加分项。 以下工具掌握越多越好:bazel、cmake、gtest、pytest、gRPC、terraform、ansible、QT;
-
岗位职责: 1. 根据公司AI战略规划和业务需求,负责高可用性、高性能、可扩展性强的AI基础设施网络架构方案的设计与研发。 2. 对AI训练和推理过程中涉及的网络流量进行性能调优,设计和优化网络通信模型与网络路由协议,不断提升大规模集群的计算效率。 3. 制定和实施基于云计算的网络策略,包括VPC、子网划分、路由策略、负载均衡、防火墙规则、安全策略等。 4. 持续探索AI Infra网络领域的新技术,持续保持在技术上的竞争力。 任职要求: 1. 计算机科学、信息技术或相关领域本科及以上学历; 2. 5年以上网络架构设计与实施经验,有AI相关的基础设施的建设与调优经验; 3. 满足以下至少2条开发经验要求: -RDMA协议的应用优化及拥塞控制算法优化工作经验,熟悉IB/RoCE网络; -GPU集群部署的性能优化工作经验,了解GPU互联,熟悉NVLink、NVSwitch; -GPU虚拟化,至少熟悉vCUDA、cGPU、qCUDA、rCUDA等一种虚拟化方案; -CUDA和NCCL的优化工作,熟悉CUDA算子库、runtime、driver库相关API; 4. 熟悉公有云服务提供商的网络服务,并有实践经验; 5. 强烈的责任心、优秀的沟通能力和团队协作精神; 6. 拥有网络专业认证者优先。
-
工作内容: •积极跟进所负责项目的各项任务,负责任务状态更新,任务问题跟踪,任务依赖项识别管理并整合各项指标,汇总报告项目进度情况和跟踪风险管理措施; •与业务伙伴协作,对项目的预算使用状况和资源分配情况进行及时的同步; •负责管理项目所涉及商务合同的起草、修订、审查及归档工作,确保项目执行的合规性以及项目范围的完整性和正确性; •参照公司管理要求及业界实践,负责项目全过程交付物的完整性、可追踪性、准确性和及时更新,确保项目各个阶段的交付有据可查; •负责定期的项目状态报告,通过专业和客观的数据来反映项目执行的各项指标; •提供即时、及时、专业的技术服务,响应管理团队、项目干系人或其他业务伙伴的咨询或疑问,并判断优先级按序处理; •通过书面形式将自己所学的新知识与团队成员分享,帮助团队成员成长、共同实现团队目标。 技能要求: •3年以上infra相关的IT项目管理经验; •有过一个及以上network相关经验是大加分项 •精通英语口语和书面表达,能够清晰地表达观点和准确地理解信息;
-
岗位职责: 1. 负责公司核心大模型应用平台和智能体开发平台的架构设计、核心功能研发与持续优化,打造高效、易用的AI原生应用开发环境。 2. 参与大模型基础工程建设,包括但不限于模型训练、微调(Fine-tuning)、推理服务的工程化和性能优化,保障模型全生命周期的高效运转。 3. 负责检索增强生成(RAG)等关键技术的工程化落地,构建高效、可扩展的知识库与检索系统,提升大模型应用的准确性和时效性。 4. 跟进行业前沿技术,对大模型相关的各类中间件、框架和工具(如模型服务框架、向量数据库、分布式计算框架等)进行技术研究、选型与应用,持续优化平台技术架构。 5. 与算法、产品等团队密切协作,快速理解业务需求,推动大模型能力在各类业务场景中的落地和应用。 6. 设计和开发高可用的模型服务、数据处理服务及相关API,确保平台的高性能、高并发和高稳定性。 任职资格: 1. 计算机科学、软件工程或相关专业本科及以上学历,5年及以上后台开发或平台研发相关工作经验。 2. 精通Go和/或Python语言,熟悉Linux开发环境,对网络编程、多线程/并发编程有深入理解和实践经验。 3. 有机器学习平台、LLM应用平台或AI Infra相关项目经验者优先;有成功的高性能、大并发后台服务或分布式系统的架构设计和研发经验者优先。 4. 有大模型训练、推理优化(如量化、剪枝)、模型服务化(Model Serving)等相关经验者优先;熟悉检索增强生成(RAG)技术栈,有向量数据库(如Milvus, Pinecone)、LangChain/LlamaIndex等框架使用经验者优先。 5. 具备出色的分析和解决复杂问题的能力,对新技术有强烈的好奇心和学习能力,能独立owner复杂技术项目,并具备良好的沟通协作能力。
-
Staff Analytics Engineer, Data
[北京·国贸] 2025-10-0950k-58k 经验10年以上 / 本科营销服务|咨询 / B轮 / 50-150人Responsibilities -Own & deliver cross-team analytics epics end-to-end (often multi-quarter):scoping, design, implementation, rollout, and adoption, with minimal oversight -Set technical direction for our analytics/BI layer(Looker+dbt+Trino/Spark) and data products; lead design reviews and establish guardrails (cost, reliability, privacy, inclusion) -Model and govern data:design stable contracts(schemas/SLAs), manage lineage, and evolve domain models that unlock self-service and performance at scale -Optimize performance & cost across engines (Trino, Spark/Databricks):plan-level analysis, join/partitioning strategies, aggregation layers, caching/materialization; set SLOs with monitoring/alerting -Raise the bar on engineering quality:testing, CI/CD, documentation, privacy/security, on-call hygiene; lead incident reviews and drive permanent fixes -Mentor & multiply:coach engineers/analysts, delegate effectively, and contribute to recruiting while holding the bar Qualifications -Education: Bachelor's degree or higher in Computer Science or a related technical field, or equivalent practical experience. -Experience: 8–12+ years in data/analytics engineering or adjacent DE/BI roles, including 5+ years owning production semantic models & transformations and 3+ years leading cross-team initiatives end-to-end -SQL & performance:Expert SQL with the ability to read/act on query plans (distributed + warehouse). Proven wins on TB-scale data (e.g., ≥2× latency reduction or ≥30% cost savings) via partitioning, file formats, pruning, aggregations, and caching/materialization -dbt at scale:Operated mid-to-large dbt projects (≈100+ models), using incremental models, tests, exposures, macros/packages, CI/CD, and data contracts; strong documentation and naming standards -Looker semantic layer:Owned LookML modeling across multiple domains; shipped governed explores/measures for 100+ users, with version control, code review, release process, and change management that enable self-service analytics - Engines & storage:Hands-on with Trino/Presto and/or Spark/Databricks (distributed plans, join strategies, partitioning, autoscaling); comfortable with Parquet/Iceberg table layouts and query-aware modeling -Reliability & governance:You set SLOs for BI/analytics surfaces, establish monitoring/alerting, manage lineage & SLAs, and run post-incidents to land permanent fixes -Leadership:Self-directed;sets technical direction for a domain, drives multi-quarter epics, mentors multiple engineers/analysts, leads design reviews, and raises the hiring/promo bar -Software fundamentals:Proficient Python and data tooling; strong testing, CI/CD, code review hygiene; privacy/security awareness -AI/LLM enablement:Experience designing or integrating AI-assisted analytics (e.g., chat-to-SQL over a semantic layer, RAG on dbt/Looker docs) with guardrails for access control/PII and an evaluation plan; can quantify adoption or ticket reduction Nice to Have -Ad-tech domain expertise(RTB auction dynamics, mediation, attribution, and LTV) -Production ops for analytics infra:GitOps (Argo CD), IaC (Terraform), Kubernetes-based data services; incident playbooks for data/BI -Streaming & CDC: Kafka/Kinesis with Flink or Spark Structured Streaming to power near-real-time analytics -JVM stack:Scala/Java for Spark jobs/UDFs or high-throughput data services -Feature/ML data interfaces: feature marts or stores (e.g., Feast), batch/online syncing, model telemetry hooks Privacy & governance at scale: row/column-level security, tokenization, policy-as-code; familiarity with GDPR/CCPA impacts -Data observability&lineage tooling:Datadog, Prometheus/Grafana, OpenLineage/DataHub/Amundsen; automated freshness/volume/uniqueness checks -Experimentation:Experience building the foundations for A/B testing-event definitions, consistent metrics, and safeguards for valid results -
一、团队介绍 我们是京东云事业部IaaS业务部AI Infra团队,致力于前沿的大模型技术创新与应用。我们专注于研发业界领先的大模型算法,构建极致高效的大模型训练与推理平台,提供高吞吐高可用、低成本低延迟的大模型服务。我们的核心使命是高效支持和驱动京东集团内外部的大模型业务生态及智能体应用,涵盖业界主流开源模型和京东自研模型的训练与推理服务。我们团队秉承技术驱动、创新为本的理念,为每一位成员提供广阔的成长空间和富有挑战性的项目。 二、职位描述 1、构建AI云推理架构: 探索PD分离、KV池化、通信优化等技术,设计并实现适用于AI原生的分布式推理服务架构,应对高并发、低延迟挑战。 2、开发核心推理平台能力: 打造AI原生网关及高可用系统,核心技术点包括但不限于:异构资源调度、身份认证与鉴权、请求智能限流、动态模型路由、推理容器/镜像加速、安全变更管控、系统深度可观测性等。 3、参与推理全栈应用实践: 积极涉足推理服务上下游应用开发,如构建RAG(检索增强生成)系统、探索提示词工程优化实践、参与AI模型市场(MCP)建设或AIGC应用落地等。 三、职位要求 1、教育背景: 计算机科学、软件工程、人工智能或相关STEM领域的硕士及以上学历。 2、技术基石: 2a、扎实的计算机科学基础和良好的工程实践能力; 2b、精通至少一种主流编程语言(如Python,C++),具备出色的编码和调试能力。 2c、熟悉主流大模型推理引擎和优化技术(如 vLLM, SGLang, TensorRT-LLM等)。 3、经验优先: 3a、拥有云计算系统、机器学习平台、分布式计算、中间件等领域的相关开发或落地经验者优先。 3b、在机器学习/系统领域会议(如 ATC,ASPLOS, OSDI, MLSys,WWW等)发表论文。 3c、作为核心贡献者深度参与知名开源项目,如 vLLM, SGLang, TensorRT-LLM等。 3d、在相关国际竞赛中取得突出成绩。 4、软性素质: 4a、沟通协作: 具备出色的沟通表达能力和高效的团队协作精神。 4b、技术追求: 对技术有强烈的好奇心与钻研精神,追求卓越。 4c、解决问题: 具备优秀的自驱力,能主动发现问题、分析问题并创造性地解决问题。


