语音算法工程师-飞书AI30k-60k

北京经验不限本科及以上大数据开发工程师
岗位所属职位类型
全职

  • 算法
字节跳动
分享到微信
微信扫一扫,用小程序打开分享
收藏
职位诱惑:

六险一金,团队氛围好,大牛带队

职位描述:

职位职责:
1、负责核心算法研发:
1)负责语音识别(ASR)算法的设计与优化,构建高精度、低延时的语音处理系统;
2)主导语种识别(LID)、说话人分离(SSD)等语音相关技术的研发与落地;
3)深入探索Whisper/FunASR等开源语音项目,结合业务需求进行技术创新与改进;
2、负责技术应用与优化:
1)将语音算法应用于会议转录、实时字幕、语音消息等ToB办公场景;
2)优化语音模型在云端的推理性能,提升资源利用效率;
3)建设语音领域的高质量数据集及评测体系;
3、工程能力建设:
1)深入使用Python进行算法开发,熟练应用PyTorch/TensorFlow搭建训练Pipeline;
2)构建高性能推理框架,探索TensorRT/Triton/OnnxRuntime等加速工具的应用;
4、跨团队协作:
1)与产品团队合作挖掘用户需求,推动语音技术在产品中的创新应用;
2)与工程团队协作完成模型部署,解决端到端落地中的技术挑战;
5、技术前瞻性研究:
1)持续跟踪ICASSP/INTERSPEECH等顶会最新进展;
2)探索语音与大模型结合的创新方向。
职位要求:
1、3年以上语音算法研发经验,主导过ASR/LID/SSD任一方向的完整项目;
2、精通Python及常用AI工具链(NumPy/Pandas等),深度掌握PyTorch/TensorFlow框架;
3、熟悉语音信号处理全流程(前端处理/特征提取/声学建模/语言模型);
4、对语音技术有强烈热情,能持续跟踪领域前沿动态;
5、具备优秀的问题拆解能力,擅长解决数据/训练/部署中的复杂问题;
6、良好的跨团队沟通能力,能将技术语言转化为业务价值。

加分项:
1、有Whisper/FunASR等开源项目二次开发经验;
2、掌握CUDA编程,具备TensorRT/Triton等推理框架实战经验;
3、在ASR领域**会议发表论文或持有相关专利;
4、具备多语种(中/英/日)语音处理经验。

工作地址

北京 - 海淀区- 中国大陆北京市海淀区学清路10号院1号楼学清嘉创大厦B座,邮编:100036查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    面试了一小时,面试官很专业,数仓理论没准备好,很遗憾
    (71)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    面试官是大牛
    福利待遇杠杠的
    [面试过程]
    过程很棒,面试官都是技术型的,聊得很开心
    (39)
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    面试效率高
    [面试过程]
    在算法题上纠结太久,细节没处理好。面试官很不错
    (129)
抖音视界(北京)有限公司

字节跳动

相似职位