LLM推理加速算法工程师35k-70k

苏州经验5-10年本科及以上算法工程师
岗位所属职位类型
全职

  • 软件服务|咨询
  • PyTorch
  • 研究导向
  • 搜索|推荐
  • 计算机相关专业
  • 业务导向
ZOOMAI
分享到微信
微信扫一扫,用小程序打开分享
职位诱惑:

上市股票RSU

职位描述:

工作内容:
• 研发稳定高效的 LLM 推理系统,支持低延迟和高吞吐
• 设计和优化分离式推理框架,实现低延迟、高吞吐
• 开发和优化分布式 KV 缓存(KV Cache)框架
• 进行 CUDA 内核优化,提高计算效率和 GPU 资源利用率






岗位要求:
• 熟悉大语言模型(如 LLaMA、Qwen)推理流程
• 了解主流模型推理加速技术(模型量化、算子融合、P/D 分离、Prefix Caching、Speculative Decoding、KV Cache 压缩与调度)
• 掌握 vLLM、TensorRT-LLM 等主流推理加速框架,能分析并优化其加速技术
• 熟悉 Hugging Face Transformers 及常见深度学习库
• 具备 GPU 高性能计算优化能力,熟悉 CUDA 并行计算、访存优化、低比特计算
• 深入理解计算机体系结构,具有基于 CUDA 的 GPU 性能优化经验
• 熟悉深度学习算法、神经网络架构及算子计算






加分项:
• 了解至少一种深度学习训练框架(如 PyTorch、TensorFlow)及其模型文件解析方式
• 具备软硬件联合设计经验
• 有 P/D 分离系统、分布式 KV Cache 系统优化经验
• 熟悉底层性能优化(Cutlass、NCCL 等)

工作地址

苏州 - 工业园区 - 娄葑- 金鸡湖大道1355号国际科技园三期7A查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官是大牛
    面试官很nice
    面试效率高
    [面试过程]
    两位面试官问我问题,没有笔试,直接问,首先做自我介绍,然后根据自己之前做的项目问技术,对自我的表现不是很满意,但是还是特别特别希望进该公司,无论薪资高低,我想跟着面试官学习,如果这次面试不上,如果有机会的话,我还是回去面试的,
    (165)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    福利待遇杠杠的
    面试官很nice
    环境高大上
    [面试过程]
    面试官都挺厉害的,会针对简历上的内容进行面试,遇到不会的问题也会解释、讨论,学习的氛围很好,公司新环境nice,团队氛围很活跃,股票期权,员工工作都很积极投入,是一家比较有前景的公司。
    企业回复(8)
    评价回复人头像
    2018-02-06
    ZOOMZOOM公司人事主管
    感谢您的肯定,一起加油!
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    先做面试题。面试题不是很难,但是里面有两个小题没有答出来。其他的全部打出来了。 <br />然后三个人同时面试,主要是界面的问题,GDI绘图,以及windows消息机制,触发什么消息。 <br />三个面试官都不错。但是我对windows界面方向没兴趣,所以最后没谈妥。 <br />其中一个面试官觉得题目做的太好了,想让我考虑一下。我直接说没兴趣,要有兴趣早就研究透了。
    [其他评价]
    公司不错,办公环境很好吧。
    企业回复(5)
    评价回复人头像
    2017-02-17
    ZOOMminal.jia公司人事主管
    感谢您的应聘,谢谢您的肯定,祝您工作顺利。
软视视频软件(杭州)有限公司

ZOOM

  • 软件服务|咨询,IT技术服务|咨询

    领域
  • 上市公司

    发展阶段
  • 2000人以上

    规模
  • http://zoom.us

    公司主页

相似职位