• 20k-40k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、核心研发工作: 1)负责集合通信库(CCL)设计、开发与优化,支持多卡/多机场景下的高性能通信; 2)基于RDMA和Scale-up等互联技术,研发高速通信库及相关工具; 3)探索通信与计算的协同优化,设计通信算子与计算算子的融合方案; 2、性能优化与问题解决: 1)分析并优化AI集群中单机内/多机间的集合通信性能(如AllReduce、All2All等),突破软硬件性能瓶颈; 2)解决分布式训练/推理场景中的通信问题,适配复杂应用场景需求; 3)利用Triton等工具开发高性能通信计算融合算子,优化端到端通信延迟; 3、技术协作与生态建设: 1)与训练、推理、自研软硬件等团队协作,优化AI模型通信效率,支撑整体系统性能提升; 2)洞察集合通信技术趋势,推动自研通信库的架构演进与生态适配。 职位要求: 1、本科及以上,计算机、电子工程相关专业; 2、扎实的分布式系统知识,熟悉大规模AI集群架构、网络通信原理及RDMA技术; 3、熟悉常见集合通信算法(如Ring、Tree、Halving-Doubling),了解集合通信库(NCCL等)实现原理; 4、具备复杂问题分析能力,能独立完成性能调优与故障排查。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 【团队介绍】我们致力于建设行业**的无代码/低代码平台,加速企业数字化进程。让懂业务的人无需开发、快速构建出贴合业务需求的应用,助力业务人员自我价值最大化;将研发人员从低效重复的工作中解放出来,改变低效的研发模式;打通企业数据、减少数据孤岛,让企业掌握快速创新的主动权。 1、负责零代码/低代码平台系统开发,制定技术方案,高质量交付、提升用户体验; 2、封装复用性高、可维护性好的前端组件,通过开发工具/框架、改进流程,保证前端开发的高效性,不断优化团队前后端分离架构,提高团队开发效率和质量; 3、关注前端技术前沿,及时把新技术转化为业务开发中的生产力。 职位要求: 1、本科及以上学历,计算机、软件相关专业,具备丰富的前端研发经验; 2、热爱前端开发,具备良好的团队协作精神和高度的责任心; 3、前端基础扎实,熟悉主流的前端开发框架,有前端工程化的实践经验,有架构设计能力; 4、至少深入掌握一个主流库或框架,如React、Vue等,有二次开发经验; 5、有SaaS或PaaS领域经验者更佳,有开源项目经验者优先。
  • 企业服务,金融 / 不需要融资 / 15-50人
    工作职责 1. 负责高频量化交易平台总体设计与开发(行情采集、策略执行、风控、订单路由、交易后处理),保证微秒级延迟、纳秒级抖动。 2. 通过代码与硬件协同调优、性能剖析,持续提升系统吞吐与资本/基础设施 ROI。 3. 深入优化网络栈、CPU 缓存、内存管理、无锁并发等;定期组织 latency war-room 与故障复盘。 4. 构建可水平扩展、可热升级的 24×7 高可用架构;设计多活容灾方案,实现零数据丢失、亚秒级恢复。 5. 推动量化业务与技术的深度融合,与策略研究、市场微观结构团队紧密协作,提升交易策略的落地速度与收益稳定性。 职位要求 1.开发语言:Java/Kotlin/Rust,有多编程语言经验者优先。 2.JVM 深度:熟悉 JVM/JIT 及 ZGC、Shenandoah 等 GC,在微秒级场景中具备优化经验。 3.系统基础:扎实的 OS、网络协议栈、并发模型与内存管理知识;熟悉 Linux 内核和内核旁路技术。 4.掌握无锁/无等待队列、RingBuffer、内存屏障、CPU cache line 对齐等。 有 Tick-to-Trade < 10 µs 系统开发或改进经验者优先。
  • 30k-60k·14薪 经验不限 / 硕士
    IT技术服务|咨询,人工智能服务 / 天使轮 / 50-150人
    工作职责: 1. 参与公司高性能计算算法平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 参与公司高性能分布式算法库的开发,大规模矩阵求解,优化问题等。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。 具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验优先。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
  • 25k-50k 经验3-5年 / 本科
    IT技术服务|咨询,人工智能服务 / 天使轮 / 50-150人
    工作职责: 1. 参与公司高性能计算算法平台的搭建、开发和优化。 2. 参与公司HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 4. 参与公司高性能分布式算法库的开发,大规模矩阵求解,优化问题等。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。 具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验优先。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
  • 智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 工作职责: 1. 参与高性能计算平台的搭建、开发和优化。 2. 参与HPC建设的相关技术研究、设计和实现,例如并行计算、低延迟网络、并行文件系统等。 3. 研究和开发深度学习相关的通信、计算等技术,致力于GPU或其他异构硬件的高性能系统开发。 职位要求: 1. 计算机、电子、通信专业,硕士及以上学历。 2. 精通C++语言,具有3年及以上的linux环境下C/C++多线程和多进程开发经验, 熟练掌握Linux环境下C++网络编程技术。具有linux环境下丰富的代码调试经验。 3. 熟练掌握计算机系统相关原理和结构,了解常见处理器(X86、ARM等)、缓存、传输总线、存储介质的基础知识。 4. 具有OpenMP、MPI、RDMA等高性能计算相关技术的开发经验,通过对Linux内核的优化,开发出基于CPU的高性能、低延迟抖动系统。 5. 具有多年的cuda并行计算开发经验,能够基于相关GPU框架(Tensorflow、Pytorch)进行性能或通信上的优化,以提升相关系统在海量金融数据(TB级)下的高速传输和计算。 6. 具有优秀的团队沟通和协作能力、责任心强,善于学习,有较强的自我驱动,具有独立分析并解决问题的能力。
  • 15k-25k·13薪 经验3-5年 / 大专
    金融 / 不需要融资 / 2000人以上
    职责描述: 1.负责证券行情分布式后端、股票高频交易系统等开发 2.参与系统架构优化、线程布局优化、内存优化等综合性工作 3.参与系统可用性、自动化、可维护性持续提升等工作 4.参与公司业务多元化,共享公司发展结果,表现优异者可晋升合伙人 任职要求: 1、能够跨组,跨部门紧密协作 2、至少有两种开发语言的开发经验 3、有分布式系统架构编写经验,在整个系统开发中有完整认知 4、熟练掌握linux和系统调优,不断优化性能,开发行业一流的低延迟、高并发系统 岗位主要负责行情数据的处理,加工衍生其他指标等等数据,或者加工数据库数据,给用户提供决策平台 目前用到的技术栈有 zookeeper,libevent,zeromq,leveldb等等
  • 30k-60k·18薪 经验在校/应届 / 本科
    企业服务 / 上市公司 / 150-500人
    【岗位职责】 1.聚焦量化策略研究所使用的分布式存储技术,设计、研发、优化、维护大规模、高性能、可扩展的分布式文件存储、对象存储和缓存系统 2.参与业界一流的HPC系统设计,追踪前沿硬件和相关技术,如NVMe、IB、RoCE等设计、搭建行业领先的低延迟、高性能分布式文件和缓存系统 3.开发方便易用的工具、文件格式和读写API,提升性能,不断提高用户体验和效率 4.与量化算法研究员合作,诊断量化研究全流程中的存储问题,进行系统性能调优 5.与其他团队一起配合,清晰定义HPC的技术概念、使用规范并进行有效沟通 6.帮助团队成员成长,促进组织内的知识共享 【岗位要求】 1.海内外知名高校本科及以上学历,计算机相关专业,5年以上存储相关经验 2.技术要求 a.精通C/C++,熟悉Python,掌握常见的算法和数据结构 b.具备大规模分布式系统的设计、开发、测试、部署、监控、运维经验c.熟悉存储方案、开源系统、协议和技术,比如对象存储、文件系统、高性能缓存.S3、NFS、数据库等。熟悉其架构、原理、调优、运维等多方面知识d.熟悉HPC通信协议和技术,如TCP/RDMA/ROCE/GPUDirect 3.优秀的代码阅读、调试和调优能力,享受解决问题的过程 4.具有优秀的书面表达与沟通协调能力,善于理解和帮助用户
  • 40k-70k·16薪 经验3-5年 / 本科
    企业服务 / 未融资 / 15-50人
    工作职责: 负责高性能计算平台开发,不断优化和研究计算性能、集群性能等,于探索已知技术的物理极限。 职位要求: 熟悉计算机系统结构,了解 x86_64 处理器核心结构,Cache Coherence Protocol,AVX2/FMA扩展指令 熟练掌握Linux C/C++高性能编程(多进程,多线程),丰富的 Linux 平台 debug/profile/tuning 经验 熟练掌握 GNU 编译调试工具链,具备面向 OS/CPU 架构的高性能,低延迟,低抖动程序开发能力; 有以下经验之一是加分项: 具有cython/boostpython混合语言开发经验; 具有Linux内核开发调优经验; 具有CUDA高并发计算程序开发经验; 具有TCP/IP Socket 开发调试经验; 具有solarflare Efvi/OpenOnload编程经验或者 Intel DPDK开发经验 具有python/C++ TB ~ PB 级大规模数据处理经验; 具有MPI/infiniband/RDMA/RoCE高性能分布式计算系统开发经验; 具有深度学习框架 Tensorflow/pytorch 开发调优经验;
  • 15k-30k 经验1-3年 / 本科
    企业服务,人工智能,通讯电子 / 天使轮 / 50-150人
    职位描述 1. 负责大模型分布式系统和多GPU优化系统研发,探索面向大模型的分布式优化新技术; 2. 负责分布式系统软件的设计和开发,提升多GPU(同一节点和跨网络多节点)高性能网络通信性能; 职位要求 1、本科及以上学历,计算机/电子相关专业优先,至少2年分布式、通信系统优化经验; 2、熟练掌握C、C++、Go等一种或多种编程语言,熟悉计算机体系架构、分布式并行计算和异构计算框架; 3、熟悉OpenMPI, OpenSHEM, MPICH,NCCL,UCX等一种或多种分布式通信软件者优先; 4、了解RDMA,PCIE Peer2Peer, GPU Direct等芯片互联和网络传输编程相关知识者优先; 5、了解常见的深度学习分布式优化方法者优先;
  • 企业服务,人工智能,通讯电子 / 天使轮 / 50-150人
    【岗位职责】 ·参与GPU-RDMA端网协议与算法的设计、开发与调优工作。 ·参与GPU高速网络通信库的设计、开发与卸载加速工作。 ·实现高性能网络的状态监控、配置校验和故障定位。 ·与团队成员协作,进行技术攻关,提升系统可扩展性和稳定性。 ·与芯片厂商合作,开展网络新硬件、新协议和新架构设计。 ·跟踪和研究面向GPU集群的分布式系统优化技术和BDMA网络通信技术 【岗位要求】 ·计算机科学、通信工程或相关领域的学士、硕士或博士学位。 ·扎实的编程能力,熟练掌握至少一种编程语言,如C、C++、Golang等。 ·深刻理解高性能网络协议栈、网络处理器体系结构、数据中心网络、分布式系统。 ·精通集合通信、拥塞控制、流量调度、路由查找、网络校验、拓扑设计等。 ·熟悉Linux内核协议栈、DPDK、RoCEv2、NCCL、MPI、UCX等底层驱动和通信接口。
  • 35k-45k·13薪 经验不限 / 博士
    移动互联网,教育 / 上市公司 / 500-2000人
    高性能计算博士后 研究方向: 1、开展高性能计算和AI交差课题相关研究; 2、大规模分布式训练性能优化,如高质量高性能的优化器; 3、AI神经网络研究,设计低计算量高质量的神经网络; 4、鼓励发表高水平研究成果。 职位要求: 1、年龄在35周岁以下,获得博士学位不超过三年(含应届),计算机及其他相关理工类专业;; 2、熟悉ARM64、X86、GPU、NPU体系结构; 3、熟悉并行编程框架(MPI/OpenMP/CUDA/OpenCL等),有高性能计算开发、调优、算法设计开发经验者优先; 4、熟悉PyTorch、TensorFlow等框架,对训练框架做过深度优化者优先; 5、有较强的独立科研能力与团队合作能力,以**作者在相关领域发表过高水平论文。
  • 电商 / 上市公司 / 2000人以上
    【职位描述】 1、负责高性能计算、大数据、低代码相关行业分析、产品调研 2、负责Paas、低代码平台产品原型设计 3、负责与AI、机器人等相关业务对接,分析需求、设计相关产品支持 4、负责规划沟通PaaS、低代码平台产品开发落地 【职位要求】 1、本科及以上学历,熟悉ToB/C平台型产品 2、有技术背景,做过技术相关工作,对开发和流程有自己的理解 3、熟练掌握 AxureRP 等原型工具的使用,有平台型产品的设计经验 4、具备良好的沟通和协调能力,跨部门协作能力,推动能力,很强的团队合作精神 5、具备良好的产品规划、设计与项目落地能力 6、熟悉 云原生、CICD、数据治理、数据仓库等技术原理,具有实践经验者优先 7、对事业充满激情,自我驱动力强,能够承受较大的工作压力 8、有Paas平台,低代码,可视化编程产品经验者优先
  • 40k-60k 经验10年以上 / 本科
    物联网 / A轮 / 150-500人
    岗位职责: 1、负责公司低代码核心产品功能的设计、开发与维护; 2、深入理解产品需求和用户场景,具备跨业务域抽象建模能力,过程方法沉淀意识;可以不断挖掘数据价值,拓宽应用场景,赋能产品创新; 3、主导技术攻坚、架构设计和性能优化,具备高可用、高性能、高并发系统的设计能力,有不错的效率意识和质量意识; 4、可指导一般开发工作,包括拆解高复杂度业务问题,技术评审和代码。 岗位要求 1、计算机/通信等相关专业本科以上学历,10年以上相关工作经验; 2、精通Java,包括JVM原理/多线程/IO等; 3、熟练使用Spring/Mybatis/Springboot等开源框架,了解其底层原理; 4、熟悉常见的关系数据库(MySQL、PostgreSQL),具备库表结构及SQL良好的设计能力,并有实际的生产调优经验; 5、熟悉微服务与分布式架构,熟悉Spring Cloud、Dubbo等框架,能熟练的使用缓存、消息队列等中间件解决性能和分布式问题; 6、有良好的编码习惯和规范性意识,熟练运用设计模式和领域建模等方法论,对系统可维护性有深刻认识; 7、有实际带团队经验,能发挥出整体作用。 加分项: 1、 有低代码从业经验优先; 2、 熟悉编译原理、AST语法树等知识结构; 3、使用过DDD改造复杂系统设计的经验。
  • 智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 职责描述: 1. 大规模分布式深度学习模型训练平台搭建及优化; 2. 分布式深度学习训练算法设计及实现,包括large batchsize generalization, 分布式梯度融合算法实现及优化; 3. 高性能计算集群任务调度系统,MPI集群通信优化, RDMA通信优化; 任职要求: 1. 有良好的计算机基础,计算机或相关专业本科以上学历,良好的英语资料阅读能力; 2. 熟悉MPI,NCCL, RDMA优化者优先; 3. 有高并发、高可用分布式系统优化经验者优先,有分布式机器学习系统优化经验者优先,有高性能存储系统优化经验者优先; 4. 有深度学习相关经验,有RNN,CNN模型训练经验,熟悉常用的深度学习软件(如Tensorflow,pyTorch等)者优先; 5. 在相关方向知名国际会议发表过论文者优先,参加过深度学习相关比赛经验者优先;