-
1. 面向不同的应用场景开发高性能 CUDA 程序 2. 和编译器团队紧密配合,针对硬件体系结构对算法进行分析,设 计,和优化 3. 对现有 CUDA 程序进行改写和适配 岗位要求: 1. 计算机/电子工程/数学/物理,本科及以上学历 2. 精通数据级并行程序设计和 GPGPU 编程,例如 CUDA、OpenCL 3. 精通 C/C++代码的编译、调试、分析和性能优化流程 4. 熟悉计算机体系结构,具有并行算法编程,调试,与优化经验
-
职位描述: 1. 分布式深度学习训练、推理系统核心技术研发; 2. 分布式系统优化,底层性能(GPU计算、存储、通信)优化; 4. 深度学习框架、超大规模分布式训练、推理等前沿问题的探索与研究,实现技术创新与突破。 职位要求: 推理优化或者分布式训练相关人选,精通CUDA的优先
-
职位描述: 1. 分布式深度学习训练、推理系统核心技术研发; 2. 分布式系统优化,底层性能(GPU计算、存储、通信)优化; 4. 深度学习框架、超大规模分布式训练、推理等前沿问题的探索与研究,实现技术创新与突破。 职位要求: 推理优化或者分布式训练相关人选,精通CUDA开发
-
工作职责 1.负责自动驾驶数据平台、仿真平台、标注平台、训练平台及相关工具链的架构设计和研发工作,打造符合前瞻、量产智驾技术研发需要的数据闭环 2.负责大规模、可伸缩计算集群系统的解决方案的设计和搭建,以及核心技术的研究、开发和优化,负责平台长期运维支持和架构优化 3.负责自动驾驶软件系统框架架构设计和开发,与硬件、算法和测试团队合作,持续集成并优化自动驾驶系统 4.负责量产车型的数据驱动影子模式、数据记录等车端功能设计、系统架构和开发 工作要求 1.学历要求:**本科及以上学历,英语CET-4及以上, 2.工作经验:具有6年及以上相关工作经验,特别优秀者可适当放宽 3.其他: ① 计算机科学与技术、软件工程专业、自动化控制专业、人工智能等相关专业优先 ② 满足以下条件之一: 1)熟悉软件开发流程、具备扎实的算法和数据结构、算法、操作系统、网络、数据库等知识 2)熟悉几何、计算机图形学、动态系统建模等理论和方法 3)精通C/C++/Go/Python/nodejs一种或多种编程语言,熟悉HTML/CSS/React/REST 4)熟悉Linux/RTOS环境下开发与调试,有嵌入式操作系统和实时操作系统的内核或驱动开发经验,有多进程多线程、中间件、计算机视觉应用(OpenCV)、CUDA、TensorRT等开发经验优先 5)有丰富的Gin/Pylons/Django Web框架开发经验 6)熟悉PyTorch,TensorFlow,TensorRT等深度学习框架,有模型训练、调优相关经验 7)熟悉Spark/K8S相关技术,有相关开发经验,有过海量数据系统开发经验优先,有过集群系统开发、部署和优化经验优先 8)熟悉软件开发流程以及DevOps完整流程,熟悉DevOps相关系统原理,有相关工具和使用经验、如Jenkins,Argo, K8S,Docker,Kubernetes等 ③ 工作认真负责,具有良好的团队合作能力、沟通协调能力和学习能力 ④ 有Tier 1或主机厂相关工作经验优先
-
岗位职责: 1. 负责AI平台的整体架构设计,确保其满足用户及市场需求。 2. 负责AI平台核心代码开发,优化团队代码质量。 3. 持续跟踪AI和大模型领域的技术趋势,推动平台的创新和升级 4. 协同其他团队成员,包括产品、开发、测试、运营等,推进项目按时、高质量地交付。 职位描述: 1. 硕士或以上学历,6年以上研发经验,3年以上AI相关大型平台或项目架构设计经验; 2. 熟悉机器学习、深度学习、计算机视觉等AI相关技术,对大语言模型有深入理解和实践经验; 3. 熟悉大语言模型的训练流程,包括数据预处理、模型设计、参数调优等; 4. 熟悉TensorFlow、PyTorch等主流深度学习框架,具备良好的编程能力; 5. 有大规模文本数据集处理经验,能够针对特定任务进行数据集的构建和优化; 6. 具备良好的研究能力,能够跟踪和掌握大语言模型的最新研究进展; 7. 有跨模态语言模型、多模态模型等研究经验者优先。 8. 熟悉主流的算力卡驱动,例如 cuda,对昇腾系列适配有经验者优先
-
职位职责: 团队介绍:字节跳动直播推荐架构团队,负责抖音全场景直播体裁推荐系统的设计和开发,工作内容覆盖离在线推荐链路全流程,包括策略架构、模型架构、数据架构等子方向,支撑算法团队的高效迭代,解决海量吞吐带来的系统性能/成本/稳定性挑战,在业务中抽象/沉淀基础服务/框架、服务组件以及效率工具等核心基建。 1、策略架构,负责推荐在线链路的服务建设和迭代,串联请求处理全流程,解决链路延迟、吞吐瓶颈、数据的高效传递等核心问题,支持业务策略的快速和可持续迭代,不断优化系统的性能/成本/稳定性,动态逼近优化上界,提升策略ROI; 2、模型架构,负责精粗召等推荐模型的在线推理、离线训练以及部分平台化工作,支持模型的持续复杂化演进,解决计算和存储瓶颈,突破模型复杂度X海量离在线样本X模型数量带来的巨大工程挑战,紧贴前沿框架、算法和加速硬件,支撑推荐算法的持续突破。 职位要求: 1、扎实的编程能力,有优秀的设计和代码能力,对解决具有挑战性问题充满激情; 2、理解GPU硬件架构、GPU软件栈(CUDA/CUTLASS、Triton Lang),具备GPU性能分析经验; 3、深入研究过至少一种机器学习框架(Tensorflow/PyTorch或其他自研框架)的底层架构和机制。 【加分项】 1、熟悉各类深度学习网络和算子底层实现细节; 2、训练方向,有大规模分布式训练经验; 3、熟悉MLIR、XLA、TVM等深度神经网络编译/优化器; 4、能使用数学工具分析深度学习训推的优化算法。
-
职责: 1.负责最右推荐产品的研发,用推荐产品/技术来提升用户体验和活跃度 2.应用机器学习、自然语言处理等技术,基于海量用户日志和内容,建立用户画像,构建内容质量及内容标签体系 3.以数据挖掘和数据分析为基础,发现新的产品改进点,驱动产品改进,探索新的产品形态; 4.跟踪业界最新的机器学习算法和研究趋势,并将其应用于实际的生产环境 要求: 1.信息检索,计算机视觉,机器学习、分布式系统方向的计算机专业的研究生或优秀本科生; 熟悉常见的分布式编程范式以及设计模式;有一定的分布式计算系统与机器学习相结合的理论和实践基础; 2.对技术研究和应用抱有浓厚兴趣,有强烈的上进心和责任感,善于思考和运用新知识; 3.扎实的C/C++和python编码功底,熟悉MPI/CUDA等高性能计算框架; 4.在ACM/ICPC, Google Jam, Top Coder,百度之星等比赛取得优异成绩的优先; 加分项: 1.思考过TensorFlow/MXNet/Caffe/Theano/Torch等的架构代码和设计逻辑的优先; 2.对大规模分布式机器学习系统实践经验者优先; 3.有发表NIPS/ACL/AAAI/ICML/IJCAI/EMNLP/SIGKDD/ICCV/CVPR/OSDI/SOSP等顶会论文的优先; 4.如果您乐于设计和实现高性能优雅的系统,而又想拥抱大规模机器学习带来的可能性,欢迎加入我们。
-
职位职责: 团队介绍:团队负责抖音集团内容审核、内容理解等方向的架构支持工作,业务范围覆盖抖音、今日头条、剪映等多个重要业务线,工作内容涵盖特征计算编排、大模型推理/训练框架、RAG等大模型应用、GPU/CPU资源治理、数据平台等系统建设及优化,与算法团队一起推进大模型在业务场景的应用落地,解决大模型应用过程中的各种工程挑战。 1、负责大模型推理系统架构设计及优化,密切配合算法部门,持续优化大模型研发和部署效率; 2、负责跟踪探索多种大模型推理技术,包括量化、蒸馏、TRT-LLM&vLLM、Kernel优化等理论研究和实践开发,极致提升推理性能; 3、负责GPU资源管理和治理,提升GPU资源使用效率。 职位要求: 1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先; 2、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI等比赛获奖者优先; 3、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护; 4、熟悉至少一种主流的机器学习框架(TensorFlow/PyTorch),熟悉CUDA编程和算法的并行化改造,对GPU加速卡有基本了解;熟悉主流大模型结构,具有大模型训练和推理优化经验者优先; 5、熟悉模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、TRT-LLM&vLLM推理优化等,有相关实践经验优化; 6、有强烈的工作责任心,良好的沟通协作能力,对解决具有挑战性问题充满激情,能和团队一起探索新技术,推进技术进步。
-
工作职责: 1、负责大模型昇腾算子适配、开发、调优、验证、评测; 2、负责响应客户AI大模型平台优化评测需求,参与大模型方案调优验证、联调适配工作; 3、负责昇思mindspore推理性能评测、评测与优化方案编写; 4、负责以Ascend C语言进行算子融合功能开发、要求性能达到或超过GPU方案; 5、领导安排的相关工作。 任职要求: 1、计算机科学、网络工程、信息安全等相关专业。本科学历以上,有相关工作经验优先。 2、熟练C++,Python编程,具备良好的代码风格; 3、掌握常用的算法和数据结构、了解常见的机器学习算法,熟练使用C++标准模板库; 4、熟悉 Linux 系统和基于 git 的版本管理; 5、熟悉MLIR/LLVM/vLLM,了解CUDA、CANN技术; 6、熟悉 TensorFlow /Pytorch等深度学习框架; 7、具有编译器开发经验或者异构编程开发经验。
-
ACM专项招聘,ACM金牌、银牌选手,不限经验,不限学历,不限技术栈,40-100万年薪 ,实习全职均可。 代码决胜,AI破局——同花顺AIGC战队,寻找下一个核心引擎 岗位介绍: 【岗位一】金融AI软件工程师 职责核心: 1、构建市场情绪分析与事件驱动的智能投研系统 2、开发基于知识图谱与Multi-Agent的金融内容生成平台 3、实现从数据挖掘到多模态内容创作的AI闭环 4、跟踪并落地Multi-Agent、Deep Search等前沿金融AI技术 【岗位二】AIGC模型应用工程师 职责核心: 1、负责图像、视频生成等AIGC模型的研发与工程落地 2、优化模型训练与推理性能,包括分布式训练、量化、剪枝等 3、编写高性能CUDA算子,提升Diffusion/Transformer等模型推理效率 4、构建模型优化工具链,解决模型迭代中的工程化问题 【岗位三】多智能体大模型研发工程师 职责核心: 1、开发基于大模型的AI应用,构建多智能体工作流与工具链 2、优化模型指令与Prompt策略,提升生成内容质量 3、搭建代码增强检索系统(RAG),支持设计规范与组件库的高效生成与校对 4、探索前沿技术在实际业务中的落地应用 要求硬核:扎实的编程功底、优秀的设计能力和代码品味,ACM级算法与工程实现能力。
-
工作内容: 1. 设计开发无人驾驶系统中的规划及决策算法,以安全、高运算效率为导向; 2. 开发高性能高效率的优化及几何算法; 4. 负责规划及决策算法的集成及测试,实现与其他子系统的联调。 任职要求: 1. 熟悉路径规划相关算法(MPC、Apollo EM、Hybrid A*、RRT、lattice planner之一或多个); 2. 具备良好的数学基础(几何,统计,图形学,优化等); 3. 具备良好的机器学习基础(数据收集与分析,特征提取,模型训练及调试,部署等); 4. 具备扎实的C++编程基础(算法,数据结构等); 5. 具备良好的沟通及团队合作能力。 若能满足如下条件的其中一个或多个,会适当加分: 1. 有无人车、 无人机、机器人等相关行业经验,或在人工智能,机器人领域会议和期刊发表过论文; 2. 有编程竞赛经验(NOI,IOI,ACM等); 3. 有将机器学习应用在机器人规划决策方面的经验; 4. 有算法及计算性能优化(如使用cuda,simd加速算法)的经验。
-
岗位职责: 1.熟悉常用推理框架,如tensorrt、migraphx、ppl、onnxruntime、aitemplate等等 2.熟悉模型推理常用优化方法,包括图优化、算子融合等等 3.熟悉模型推理性能分析方法,针对具体模型分析性能瓶颈点 4.至少对一个人工智能领域有深入了解,大模型、多模态、视觉、文本等等 5.熟悉C/C++、Python语言 有以上相关经验欢迎加入我们 有下列经验者优先考虑 1.有cuda算子优化经验 2.有tensorrt/migraphx/onnxruntime等推理框架中的图优化及算子融合经验
-
算法工程师 工作职责: 1. 负责牙科影像设备产品的相关算法研究和开发,将算法的理论研究成果商业化、工程化; 2. 负责三维点云重建、降噪、配准、拼接、分割等算法的开发与优化; 3. 负责曲面重建、纹理映射重合等算法的研发与实现。 工作要求: 1、本科及以上学历,计算机、自动化、数学等相关专业; 2、熟练使用 C++,熟悉 C++11 标准; 3、熟悉算法与数据结构,能恰当使用 STL 中常用的容器; 4、了解 Qt 或 OpenGL 者优先; 5、了解OpenCL或CUDA GPU编程者优先; 6、了解OpenCV、PCL等开源库者优先; 7、了解深度卷积神经网络者优先; 8、有较强的代码规范意识,熟悉 Google C++ Style 者优先; 9、动手能力强,具有良好的沟通能力和团队合作精神,富有探索精神。 Algorithm Engineer Job Responsibilities: 1. Responsible for the research and development of related algorithms of dental imaging equipment products, commercialization and engineering of theoretical research results of algorithms; 2. Responsible for the development and optimization of 3D point cloud reconstruction, noise reduction, registration, stitching, segmentation and other algorithms; 3. Responsible for the development and implementation of algorithms such as surface reconstruction and texture mapping overlap. Work requirements: 1. Bachelor degree or above, major in computer, automation, mathematics, etc.; 2. Proficient in C++ and familiar with the C++11 standard; 3. Familiar with algorithms and data structures and able to properly use common containers in STL; 4. Knowledge of Qt or OpenGL is preferred; 5. Knowledge of OpenCL or CUDA GPU programming is preferred; 6. Knowledge of open source libraries such as OpenCV and PCL is preferred; 7. Knowledge of deep convolutional neural networks is preferred; 8. Strong awareness of code specification and familiarity with Google C++ Style is preferred; 9. Strong hands-on ability, good communication skills, and teamwork spirit, full of exploration spirit.
-
岗位职责: 1、负责GPU资源调度与优化,提升计算效率; 2、参与深度学习框架与模型的并行优化; 3、分析性能瓶颈,提出并实施有效的优化方案; 4、跟踪GPU技术发展,引入新技术以提升产品性能。 任职要求: 1、深入理解GPU架构,具备扎实的编程能力; 2、熟悉CUDA、OpenCL等并行计算编程模型; 3、熟悉SGlang、vLLM框架,了解Unsloth、Llama-Factory、MS-SWIFT; 4、具备深度学习或高性能计算领域相关经验。
-
岗位职责: 1.工业仿真物理模型及应用开发。 2.仿真计算框架开发,包括非结构网格、结构网格自适应等框架开发。 3.工业仿真计算程序高性能改造及并行加速优化。 岗位要求: 1.计算力学、计算物理、应用数学等相关专业,硕士研究生以上学历。 2.数值方法:熟练掌握有限元等离散方法,熟练掌握主流的迭代或直接代数求解方法。 3.数据结构、算法及语言:对数值计算中常用数据结构和算法有良好理解,掌握C/C++/python等高级编程语言,熟悉MPI/OpenMP/CUDA等并行编程接口中的一种或多种,熟练掌握和运用C++语言者优先。 4.Linux系统:熟练使用Linux Shell命令,熟练掌握ICC/GCC系列编译器使用,理解必要的编译方法和流程。


