-
职位职责: 1、核心研发工作: 1)负责集合通信库(CCL)设计、开发与优化,支持多卡/多机场景下的高性能通信; 2)基于RDMA和Scale-up等互联技术,研发高速通信库及相关工具; 3)探索通信与计算的协同优化,设计通信算子与计算算子的融合方案; 2、性能优化与问题解决: 1)分析并优化AI集群中单机内/多机间的集合通信性能(如AllReduce、All2All等),突破软硬件性能瓶颈; 2)解决分布式训练/推理场景中的通信问题,适配复杂应用场景需求; 3)利用Triton等工具开发高性能通信计算融合算子,优化端到端通信延迟; 3、技术协作与生态建设: 1)与训练、推理、自研软硬件等团队协作,优化AI模型通信效率,支撑整体系统性能提升; 2)洞察集合通信技术趋势,推动自研通信库的架构演进与生态适配。 职位要求: 1、本科及以上,计算机、电子工程相关专业; 2、扎实的分布式系统知识,熟悉大规模AI集群架构、网络通信原理及RDMA技术; 3、熟悉常见集合通信算法(如Ring、Tree、Halving-Doubling),了解集合通信库(NCCL等)实现原理; 4、具备复杂问题分析能力,能独立完成性能调优与故障排查。
-
职位职责: 1、核心研发工作: 1)负责集合通信库(CCL)设计、开发与优化,支持多卡/多机场景下的高性能通信; 2)基于RDMA和Scale-up等互联技术,研发高速通信库及相关工具; 3)探索通信与计算的协同优化,设计通信算子与计算算子的融合方案; 2、性能优化与问题解决: 1)分析并优化AI集群中单机内/多机间的集合通信性能(如AllReduce、All2All等),突破软硬件性能瓶颈; 2)解决分布式训练/推理场景中的通信问题,适配复杂应用场景需求; 3)利用Triton等工具开发高性能通信计算融合算子,优化端到端通信延迟; 3、技术协作与生态建设: 1)与训练、推理、自研软硬件等团队协作,优化AI模型通信效率,支撑整体系统性能提升; 2)洞察集合通信技术趋势,推动自研通信库的架构演进与生态适配。 职位要求: 1、本科及以上,计算机、电子工程相关专业; 2、扎实的分布式系统知识,熟悉大规模AI集群架构、网络通信原理及RDMA技术; 3、熟悉常见集合通信算法(如Ring、Tree、Halving-Doubling),了解集合通信库(NCCL等)实现原理; 4、具备复杂问题分析能力,能独立完成性能调优与故障排查。
-
职位职责 1. 参与CDN平台设计、研发、建设、维护等; 2. 参与高性能分布式CDN缓存系统的设计与研发; 3. 参与流量智能调度系统的设计与研发。 职位要求 1. 熟悉CDN原理和技术,有CDN缓存与调度系统经验; 2. 熟练掌握C/C++/Go等开发语言,掌握Lua/Python/shell等脚本语言; 3. 熟悉负载均衡和缓存系统(OpenResty/ATS),有分析其代码实现或模块编写经验者优先; 4. 熟悉Linux内核,有内核性能优化/网络IO优化/磁盘IO优化经验的优先; 5. 熟悉CDN系统不同模块负载与瓶颈,有系统级调优经验者优先; 6. 积极乐观,责任心强,工作认真细致,具有良好的团队沟通与协作能力; 7. 热爱编程,有强烈的求知欲、好奇心和进取心 ,能及时关注和学习业界最新技术。 注:办公地点可选 成都/杭州
-
岗位职责: linux后台程序高性能开发。领域为金融市场交易。 要求: 1)精通c++, 深入理解linux系统原理; 2) 具备性能优化实战经验 3) 熟悉多线程编程 4) 高性能计算所背景优先。
-
岗位职责:(部分匹配即可) 1、针对大模型推理、训练等场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率; 2、能够使用Profiler手段,分析训练瓶颈,使用分布式策略调优、算子优化等手段来提升训练性能; 3、提升分布式推理下模型并行(ModelParalleism)、数据并行(Data Paralelism)等场景下的性能; 4、支撑异构AI芯片上的调度框架设计与优化,提升系统的实时性、吞吐率、算力利用率等指标; 5、针对不同端侧设备的硬件特性(CPU、GPU、NPU 等)进行镜像和训推框架适配,针对特定硬件架构和推理引擎进行性能优化; 6、深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法; 7、探索前沿技术方向(如混合专家模型MoE、强化学习算法等),推动AI工程化落地的效率提升。 岗位要求:(部分满足即可) 1、熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化等; 2、熟悉TensorRT-LLM、LMDeploy、vLLM、SGLang等大模型推理框架,有实际性能调优经验(如KV Cache优化、动态批处理、Attention算子定制等); 3、扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术; 4、至少熟练使用C++/Python/Golang中一种,具备良好的算法设计与代码实现能力; 5、熟悉Pytorch,Deepspeed等主流分布式框架的使用和原理,熟练掌握TensorFlow、PyTorch等深度学习框架; 6、了解深度学习算法基本原理,熟悉深度学习训练框架及其模型文件的解析; 7、了解通信架构原理、有分布式优化和通信优化经历者优先; 8、了解深度学习模型的量化压缩、推理加速等优化技术; 9、了解通信架构原理、有分布式优化和通信优化经历者优先。
-
1.负责CDN服务日常运维和技术支持工作; 2.负责CDN服务的稳定性保障,包括监控和紧急故障响应、分析与处理,3.负责内部业务的CDN对接支撑工作,包括沟通和梳理业务需求,给出解决方案并推进实施;4.负责对外服务商协调CDN资源,包括沟通和对标技术要求,对交付结果进行有效验证职位要求: 岗位要求 1.熟悉CDN架构、节点、调度、产品及优化,熟悉CDN技术体系,了解国内外常见的CDN服务商; 2.扎实的运维能力,能够快速定位复杂的CDN缓存、调度、质量等问题并推动解决; 3.熟悉Linux系统,熟练shel编程:熟悉TCP协议,深入理解HTTP协议; 4.工作认真、负责、细致,有较好的抗压能力、良好的沟通能力,工作积极主动;
-
CDN运营,技术总监,负责统筹运营各项工作,
-
岗位职责: 1、负责快手CDN平台建设和运维管理工作; 2、负责快手CDN监控系统、自动化运维系统的部署、维护工作; 3、负责快手CDN整体质量和稳定性保障工作; 4、负责快手动态加速、边缘计算等业务基础支持工作; 5、负责快手CDN成本优化相关工作。 任职要求: 1、本科以上学历,计算机或相关专业,2年以上CDN厂商运维或技术支持相关经验; 2、精通Linux、熟悉tcp/ip、http协议、quic协议及主流web server; 3、熟悉nginx、squid、lighttpd等开业软件; 4、具备较强的问题分析、排查、解决和沟通协调能力,善于跨部门沟通; 5、做事认真、仔细、负责,具备一定的抗压能力,可以做到7*24响应处理各类应急事件; 6、掌握Shell、python、go等至少一门语言; 7、了解P2P协议、P2P网络架构,有性能优化相关经验优先,有过CDN/P2P开发经验优先。
-
职责 -负责深度学习推理引擎的优化工作,主要针对GPU、CPU以及自研语音芯片 -负责深度学习算法在多终端工程优化和落地 -负责深度学习模型训练框架的高性能计算优化工作 要求 -精通C/C++编程,编程习惯和功底扎实优秀 -对深度学习算法有一定了解,具备将复杂问题进行数学建模的意识和能力 -对高性能计算\分布式计算\异构计算\编译系统等有了解,有过mpi、gcc、gpu等开发经验加分 -了解多线程加速,DSP相关移植,单指令多数据加速,进程间通信,有过DSP的指令集以及加速方法开发经验的加分; -沟通能力和团队合作意识强,热爱挑战,踏实勤奋
-
【岗位职责】 ·参与GPU-RDMA端网协议与算法的设计、开发与调优工作。 ·参与GPU高速网络通信库的设计、开发与卸载加速工作。 ·实现高性能网络的状态监控、配置校验和故障定位。 ·与团队成员协作,进行技术攻关,提升系统可扩展性和稳定性。 ·与芯片厂商合作,开展网络新硬件、新协议和新架构设计。 ·跟踪和研究面向GPU集群的分布式系统优化技术和BDMA网络通信技术 【岗位要求】 ·计算机科学、通信工程或相关领域的学士、硕士或博士学位。 ·扎实的编程能力,熟练掌握至少一种编程语言,如C、C++、Golang等。 ·深刻理解高性能网络协议栈、网络处理器体系结构、数据中心网络、分布式系统。 ·精通集合通信、拥塞控制、流量调度、路由查找、网络校验、拓扑设计等。 ·熟悉Linux内核协议栈、DPDK、RoCEv2、NCCL、MPI、UCX等底层驱动和通信接口。
-
职责描述: 1.参与CDN项目的业务需求调研和需求评估,撰写相关技术文档。 2.负责CDN业务需求概要设计、详细设计、开发计划等的编制并实施。 3.负责CDN业务需求模块开发,解决开发过程中的技术问题,确保按时开发CDN需求版本的交付。 4.配合测试团队验证版本功能,配合运维同事上线CDN业务版本。 任职要求: 1.计算机相关专业,本科或以上学历,两年以上CDN行业相关工作经验。 2.精通C/C++,Golang等开发语言。 3.熟悉Nginx/OpenResty源码,有Nginx模块开发或者服务端Lua开发经验。 4.了解HLS、RTMP、RTSP、HTTP-FLV,DASH等流媒体协议。 5.具备大型CDN网络规划经验,丰富的CDN相关的排查故障能力及故障解决能力。 6.强烈责任心,良好的沟通技能,团队合作能力,具有求知欲及自主学习能力。 7.有ATS开发经验的 优先;
-
工作职责: 1. 参与公司高性能计算算法平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 参与公司高性能分布式算法库的开发,大规模矩阵求解,优化问题等。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。 具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验优先。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
-
工作职责: 1.负责解决云产品(CDN)现网疑难问题,深入分析,推动问题解决方案落地; 2.负责业务大数据数据分析,资源质量数据分析,提升客户跑量; 3.负责梳理提炼客户的日常问题和需求,优化处理效率,推动客户诉求的落地; 4.通过培训,知识库建设,工具平台建设,流程优化等手段,提升一线服务团队专业度。 任职资格: 1.本科及以上学历,计算机及相关专业,3年以上工作经验; 2.具备熟悉大数据平台系统,有丰富的Kafka、HDFS、Hive/Impala、Flume等集群运维经验优先; 3.有云计算/CDN/云游戏等大规模基础服务平台的架构设计、运维经验优先; 4.精通TCP/IP协议,HTTP协议; 5.熟练Linux内核、docker,能够快速部署,配置及排错; 6.具备并擅长 Python、Perl、shell、SQL等开发能力优先; 7.热爱技术,自我驱动,主动思考,不断钻研和探索新领域,有较好的技术敏感度、风险识别能力和全局意识。
-
工作职责: 【岗位职责】 1、负责公司共享CDN产品业务的客户拓展和销售工作,主要为流媒体直播点播、文件下载等带宽需求客户,拓展和维护客户关系; 2、参加客户需求的招投标,进行前期的标书准备工作; 3、跟进在服务客户的日常对账回款,扩容需求。 任职资格: 【任职要求】 1、本科及以上学历,5年以上TOB大客户销售经验; 2、有云计算或CDN,PCDN销售经验,具备一定互联网客户资源者优先; 3、具备较强的开发挖掘客户经验和能力; 4、市场感觉敏锐,具备较强的客户沟通能力和商务处理能力,有较好的亲和力和语言表达能力,能适应短期出差。
-
1.负责机器学习分布式训练方向的工作,系统开发、高性能优化 2.熟悉分布式训练框架,熟悉数据并行、模型并行、流水线并行等常见并行策略 3.有大规模分布式训练性能优化的相关经验,支持过多机多卡的分布式并行任务训练和性能调优 4.熟悉cuda编程,网络吞吐性能优化,可对神经网络特定layer进行深层优化


