-
职位描述: 1. 分布式深度学习训练、推理系统核心技术研发; 2. 分布式系统优化,底层性能(GPU计算、存储、通信)优化; 4. 深度学习框架、超大规模分布式训练、推理等前沿问题的探索与研究,实现技术创新与突破。 职位要求: 推理优化或者分布式训练相关人选,精通CUDA的优先
-
职位描述: 1. 分布式深度学习训练、推理系统核心技术研发; 2. 分布式系统优化,底层性能(GPU计算、存储、通信)优化; 4. 深度学习框架、超大规模分布式训练、推理等前沿问题的探索与研究,实现技术创新与突破。 职位要求: 推理优化或者分布式训练相关人选,精通CUDA开发
-
1. 面向不同的应用场景开发高性能 CUDA 程序 2. 和编译器团队紧密配合,针对硬件体系结构对算法进行分析,设 计,和优化 3. 对现有 CUDA 程序进行改写和适配 岗位要求: 1. 计算机/电子工程/数学/物理,本科及以上学历 2. 精通数据级并行程序设计和 GPGPU 编程,例如 CUDA、OpenCL 3. 精通 C/C++代码的编译、调试、分析和性能优化流程 4. 熟悉计算机体系结构,具有并行算法编程,调试,与优化经验
-
负责视频处理算法以及编码解码在公有云,私有云以及服务器上的并行化开发和部署。 2. 具体工作内容包含但不限于以下内容: 1)把单线程的算法模型改为多线程软件,提高实时性并且充分利用CPU资源, 2)使用OpenGL/OpenCL/汇编等方法充分利用服务器的计算能力, 3)利用公司现有服务器通过Docker,Openstack等方式部署视频处理软件, 4)利用API或者SDK在公有云上开发和部署视频运用。 任职要求 1. 在并行计算相关领域有丰富的工作经验: 1)多线程编程 2)多进程编程 3)OpenGL, OpenCL,Intel汇编
-
岗位职责: 1. 负责AI平台的整体架构设计,确保其满足用户及市场需求。 2. 负责AI平台核心代码开发,优化团队代码质量。 3. 持续跟踪AI和大模型领域的技术趋势,推动平台的创新和升级 4. 协同其他团队成员,包括产品、开发、测试、运营等,推进项目按时、高质量地交付。 职位描述: 1. 硕士或以上学历,6年以上研发经验,3年以上AI相关大型平台或项目架构设计经验; 2. 熟悉机器学习、深度学习、计算机视觉等AI相关技术,对大语言模型有深入理解和实践经验; 3. 熟悉大语言模型的训练流程,包括数据预处理、模型设计、参数调优等; 4. 熟悉TensorFlow、PyTorch等主流深度学习框架,具备良好的编程能力; 5. 有大规模文本数据集处理经验,能够针对特定任务进行数据集的构建和优化; 6. 具备良好的研究能力,能够跟踪和掌握大语言模型的最新研究进展; 7. 有跨模态语言模型、多模态模型等研究经验者优先。 8. 熟悉主流的算力卡驱动,例如 cuda,对昇腾系列适配有经验者优先
-
岗位职责: 1.负责腾讯音乐集团相关产品推荐算法的设计实现与优化; 2.负责完善现有推荐系统的基础算法及并行计算框架; 3.负责音乐平台业务的基于用户/音乐特性的数据挖掘及推荐策略设计实现; 4.负责能够根据业务数据变化不断设计并调整算法策略来提升算法质量,并最终提升用户体验。 岗位要求: 1.硕士及以上学历; 2.计算机,统计,信息,数学等相关专业毕业优先; 3.扎实可靠的编程能力,精通C/C++/GO至少一门编程语言; 4.熟悉业内推荐算法及数据挖掘领域的技术热点和进展,对互联网在线音乐的推荐系统架构设计有深入了解; 5.了解Hadoop/Spark生态相关技术优先; 6.具备规模分布式数据存储与计算开发经验者优先; 7.沟通能力佳,表达能力出众者,音乐爱好者优先。
-
职位职责: 1、负责端侧模型推理框架开发,包括模型压缩、优化技术,在端侧的接入、适配、算子开发工作,使之符合业务要求,提高性能收益; 2、负责探索和落地 AI 模型工程部署前沿技术,包括但不限于稀疏计算、编译优化。 职位要求: 1、具备扎实的计算机科学功底和编程能力,了解常见并行计算算法,具有良好的编程习惯; 2、熟悉transformers、stable diffusion等主流模型原理; 3、良好的团队协作能力; 4、创新性强,有良好的动手实现能力,对技术有热情; 5、加分项:了解模型剪枝、量化等优化方法原理,具备相关模型优化经验。
-
工作职责 1.负责自动驾驶数据平台、仿真平台、标注平台、训练平台及相关工具链的架构设计和研发工作,打造符合前瞻、量产智驾技术研发需要的数据闭环 2.负责大规模、可伸缩计算集群系统的解决方案的设计和搭建,以及核心技术的研究、开发和优化,负责平台长期运维支持和架构优化 3.负责自动驾驶软件系统框架架构设计和开发,与硬件、算法和测试团队合作,持续集成并优化自动驾驶系统 4.负责量产车型的数据驱动影子模式、数据记录等车端功能设计、系统架构和开发 工作要求 1.学历要求:**本科及以上学历,英语CET-4及以上, 2.工作经验:具有6年及以上相关工作经验,特别优秀者可适当放宽 3.其他: ① 计算机科学与技术、软件工程专业、自动化控制专业、人工智能等相关专业优先 ② 满足以下条件之一: 1)熟悉软件开发流程、具备扎实的算法和数据结构、算法、操作系统、网络、数据库等知识 2)熟悉几何、计算机图形学、动态系统建模等理论和方法 3)精通C/C++/Go/Python/nodejs一种或多种编程语言,熟悉HTML/CSS/React/REST 4)熟悉Linux/RTOS环境下开发与调试,有嵌入式操作系统和实时操作系统的内核或驱动开发经验,有多进程多线程、中间件、计算机视觉应用(OpenCV)、CUDA、TensorRT等开发经验优先 5)有丰富的Gin/Pylons/Django Web框架开发经验 6)熟悉PyTorch,TensorFlow,TensorRT等深度学习框架,有模型训练、调优相关经验 7)熟悉Spark/K8S相关技术,有相关开发经验,有过海量数据系统开发经验优先,有过集群系统开发、部署和优化经验优先 8)熟悉软件开发流程以及DevOps完整流程,熟悉DevOps相关系统原理,有相关工具和使用经验、如Jenkins,Argo, K8S,Docker,Kubernetes等 ③ 工作认真负责,具有良好的团队合作能力、沟通协调能力和学习能力 ④ 有Tier 1或主机厂相关工作经验优先
-
Job Title: Technical Officer(SAERF) Department: Sustainable Atmospheric Environment Research Facility(SAERF), HKUST(GZ) Job Posting Details Formally established in June 2022, the Hong Kong University of Science and Technology (Guangzhou)(HKUST(GZ)) is a cooperatively-run university between the Chinese mainland and the Hong Kong Special Administrative Region. HKUST(GZ) has obtained approval from the Ministry of Education (MoE) and become the first legally-independent educational institution co-established by the Mainland and Hong Kong since the announcement and implementation of the “Outline Development Plan for the Guangdong-Hong Kong-Macao Greater Bay Area” and the “Overall Plan for Deepening Globally Oriented Comprehensive Co-operation amongst Guangdong, Hong Kong and Macao in Nansha of Guangzhou”. With a spirit of pioneering innovation, HKUST(GZ) charts new territories in cross-disciplinary education and explores new frontiers in pedagogies, aiming to serve as a role model of the mainland-Hong Kong integrated educational development and become a world-famous high-level university, endeavoring to nurture future-oriented, high-level and innovative talents. In response to the increasingly complex challenges faced by the rapidly changing world, HKUST(GZ) adopts a brand-new and cross-disciplinary academic structure featuring “Hub” and “Thrust” to substitute the conventional one characterized by “school” and “department”, facilitating cross-disciplinary integration while vigorously developing emerging and frontier disciplines. This is a groundbreaking move in the higher education community across the globe. 专业要求: 计算机科学与技术、软件工程、计算机工程或相关理工科专业。 工作职责 1. 设计、部署和管理高性能计算 (HPC) 集群,支持大气模拟、气候建模和大规模环境分析等计算密集型建模任务。 2. 构建并维护强大的环境数据库,整合传感器数据、管理元数据、确保数据质量,并为研究人员提供无缝的数据访问和分析支持。 3. 负责系统管理工作,包括服务器安装配置、操作系统管理维护、安全监控及软件更新升级,确保计算环境稳定安全运行。 4. 配置和维护本地及远程网络与数据基础设施,保障传感器、存储系统、HPC资源与终端用户之间的高效数据流传输。 5. 评估并实施新兴技术(如云计算、容器化方案-Docker、可扩展存储),持续增强机构的技术能力和效率。 6. 为研究人员提供技术支持与合作,包括问题调试、系统优化以及HPC工具和数据工作流程的培训指导。 7. 协助设备采购的技术规划和预算编制,负责供应商评估选择及物流协调管理事宜。 8. 领导并指导初级工程师,负责日常系统维护及用户支持工作。 9. 积极参与机构战略发展,推动数据驱动的环境研究发展,提升数据集的可访问性与互操作性,保障设施技术生态的长期可持续性。 10. 完成领导交办的其他任务。 任职要求 1. 计算机科学、软件工程、大气科学、环境工程或相关理工科专业硕士及以上学位。 2. 熟悉气象与环境数据全生命周期管理流程,掌握气候模型验证及卫星遥感数据分析方法论。 3. 具备大规模计算集群的架构设计及性能调优能力,精通主流并行计算框架与分布式任务调度系统。 4. 具有公有云服务部署实施经历(至少一种主流云平台)。 5. 5主导过复杂系统从需求分析到生产落地的完整交付周期,能独立设计测试验证方案并组织技术培训。 6. 熟练应用关系型数据库及时空数据库解决方案,了解实时数据流处理技术框架的实现原理。 7. 拥有跨学科协作经验,可有效转化科研需求为技术方案。 8. 能适应中英双语工作环境, 具有良好的中英文书写和口语能力优先。
-
工作职责: 1.负责视频广告引擎系统的架构设计、核心模块研发与性能调优,支撑每日数亿级流量下的高并发广告请求,保障系统的极致性能与高可用性 2.根据视频广告业务发展的需求,主导重点业务和技术方向的项目:深入业务,通过策略优化驱动收入增长;攻克系统瓶颈,在底层性能优化等核心技术难题上有突破; 3.持续优化现有系统,包括品牌广告引擎和程序化交易平台系统,提高系统稳定性和性能,更好的支持广告业务的发展 4.持续完善广告后端服务的周边基础服务,包括但不限于高性能推理服务、自动化排查工具与全链路监控体系,提升团队整体研发效率与系统稳定性 任职要求: 1.**本科及以上学历,5年以上C/C++方向的大规模高并发系统开发背景,有广告/搜索/推荐系统开发经验优先,熟悉openresty者优先。 2.精通网络编程、多线程及并发技术,对系统性能调优有浓厚兴趣和丰富经验,能解决复杂的底层技术挑战。对数据敏感,可以通过技术手段提升核心业务指标。 3.具备优秀的技术架构能力、问题分析与解决能力,能独立负责复杂模块并从推动完成其高质量交付。 4.有大型分布式系统设计经验,参与过大型开源项目,具有并行计算开发经验的优先考虑 5.有良好的学习能力和团队协作精神,在技术方向有钻研精神,善于分享。工作积极有责任,认同企业文化,愿意拼搏努力。
-
职位职责: 1、负责商业化实时数据流(百万级QPS)及实时数仓系统的开发与迭代; 2、负责商业化内部数据应用产品的开发与迭代,如BI、埋点平台、实验平台等; 3、负责巨量引擎各平台数据产品的数据链路及查询服务开发与迭代,为客户提供有价值高质量的数据能力。 职位要求: 1、具备良好的沟通能力和自我学习能力,具备较强的责任心和主人翁意识,积极推动问题解决和项目进展; 2、具备扎实的Java语言基础,具有良好的编码和文档习惯,对代码美感的追求孜孜不倦; 3、熟悉并行计算或者分布式计算原理,熟悉高并发、高稳定性、可线性扩展、海量数据的系统特点和技术方案; 4、对性能调优,算法效率和分布式计算的资源管理策略有较深的理解; 5、熟悉ZooKeeper/Kafka/Paimon/Hudi等平台者优先。
-
职责: 1.负责最右推荐产品的研发,用推荐产品/技术来提升用户体验和活跃度 2.应用机器学习、自然语言处理等技术,基于海量用户日志和内容,建立用户画像,构建内容质量及内容标签体系 3.以数据挖掘和数据分析为基础,发现新的产品改进点,驱动产品改进,探索新的产品形态; 4.跟踪业界最新的机器学习算法和研究趋势,并将其应用于实际的生产环境 要求: 1.信息检索,计算机视觉,机器学习、分布式系统方向的计算机专业的研究生或优秀本科生; 熟悉常见的分布式编程范式以及设计模式;有一定的分布式计算系统与机器学习相结合的理论和实践基础; 2.对技术研究和应用抱有浓厚兴趣,有强烈的上进心和责任感,善于思考和运用新知识; 3.扎实的C/C++和python编码功底,熟悉MPI/CUDA等高性能计算框架; 4.在ACM/ICPC, Google Jam, Top Coder,百度之星等比赛取得优异成绩的优先; 加分项: 1.思考过TensorFlow/MXNet/Caffe/Theano/Torch等的架构代码和设计逻辑的优先; 2.对大规模分布式机器学习系统实践经验者优先; 3.有发表NIPS/ACL/AAAI/ICML/IJCAI/EMNLP/SIGKDD/ICCV/CVPR/OSDI/SOSP等顶会论文的优先; 4.如果您乐于设计和实现高性能优雅的系统,而又想拥抱大规模机器学习带来的可能性,欢迎加入我们。
-
工作职责: 1、负责大模型昇腾算子适配、开发、调优、验证、评测; 2、负责响应客户AI大模型平台优化评测需求,参与大模型方案调优验证、联调适配工作; 3、负责昇思mindspore推理性能评测、评测与优化方案编写; 4、负责以Ascend C语言进行算子融合功能开发、要求性能达到或超过GPU方案; 5、领导安排的相关工作。 任职要求: 1、计算机科学、网络工程、信息安全等相关专业。本科学历以上,有相关工作经验优先。 2、熟练C++,Python编程,具备良好的代码风格; 3、掌握常用的算法和数据结构、了解常见的机器学习算法,熟练使用C++标准模板库; 4、熟悉 Linux 系统和基于 git 的版本管理; 5、熟悉MLIR/LLVM/vLLM,了解CUDA、CANN技术; 6、熟悉 TensorFlow /Pytorch等深度学习框架; 7、具有编译器开发经验或者异构编程开发经验。
-
岗位职责: 1、负责GPU资源调度与优化,提升计算效率; 2、参与深度学习框架与模型的并行优化; 3、分析性能瓶颈,提出并实施有效的优化方案; 4、跟踪GPU技术发展,引入新技术以提升产品性能。 任职要求: 1、深入理解GPU架构,具备扎实的编程能力; 2、熟悉CUDA、OpenCL等并行计算编程模型; 3、熟悉SGlang、vLLM框架,了解Unsloth、Llama-Factory、MS-SWIFT; 4、具备深度学习或高性能计算领域相关经验。
-
工作内容: • 研发稳定高效的 LLM 推理系统,支持低延迟和高吞吐 • 设计和优化分离式推理框架,实现低延迟、高吞吐 • 开发和优化分布式 KV 缓存(KV Cache)框架 • 进行 CUDA 内核优化,提高计算效率和 GPU 资源利用率 岗位要求: • 熟悉大语言模型(如 LLaMA、Qwen)推理流程 • 了解主流模型推理加速技术(模型量化、算子融合、P/D 分离、Prefix Caching、Speculative Decoding、KV Cache 压缩与调度) • 掌握 vLLM、TensorRT-LLM 等主流推理加速框架,能分析并优化其加速技术 • 熟悉 Hugging Face Transformers 及常见深度学习库 • 具备 GPU 高性能计算优化能力,熟悉 CUDA 并行计算、访存优化、低比特计算 • 深入理解计算机体系结构,具有基于 CUDA 的 GPU 性能优化经验 • 熟悉深度学习算法、神经网络架构及算子计算 加分项: • 了解至少一种深度学习训练框架(如 PyTorch、TensorFlow)及其模型文件解析方式 • 具备软硬件联合设计经验 • 有 P/D 分离系统、分布式 KV Cache 系统优化经验 • 熟悉底层性能优化(Cutlass、NCCL 等)


