• 30k-60k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责核心算法研发: 1)负责语音识别(ASR)算法的设计与优化,构建高精度、低延时的语音处理系统; 2)主导语种识别(LID)、说话人分离(SSD)等语音相关技术的研发与落地; 3)深入探索Whisper/FunASR等开源语音项目,结合业务需求进行技术创新与改进; 2、负责技术应用与优化: 1)将语音算法应用于会议转录、实时字幕、语音消息等ToB办公场景; 2)优化语音模型在云端的推理性能,提升资源利用效率; 3)建设语音领域的高质量数据集及评测体系; 3、工程能力建设: 1)深入使用Python进行算法开发,熟练应用PyTorch/TensorFlow搭建训练Pipeline; 2)构建高性能推理框架,探索TensorRT/Triton/OnnxRuntime等加速工具的应用; 4、跨团队协作: 1)与产品团队合作挖掘用户需求,推动语音技术在产品中的创新应用; 2)与工程团队协作完成模型部署,解决端到端落地中的技术挑战; 5、技术前瞻性研究: 1)持续跟踪ICASSP/INTERSPEECH等顶会最新进展; 2)探索语音与大模型结合的创新方向。 职位要求: 1、3年以上语音算法研发经验,主导过ASR/LID/SSD任一方向的完整项目; 2、精通Python及常用AI工具链(NumPy/Pandas等),深度掌握PyTorch/TensorFlow框架; 3、熟悉语音信号处理全流程(前端处理/特征提取/声学建模/语言模型); 4、对语音技术有强烈热情,能持续跟踪领域前沿动态; 5、具备优秀的问题拆解能力,擅长解决数据/训练/部署中的复杂问题; 6、良好的跨团队沟通能力,能将技术语言转化为业务价值。 加分项: 1、有Whisper/FunASR等开源项目二次开发经验; 2、掌握CUDA编程,具备TensorRT/Triton等推理框架实战经验; 3、在ASR领域**会议发表论文或持有相关专利; 4、具备多语种(中/英/日)语音处理经验。
  • 30k-45k 经验3-5年 / 本科
    物联网 / 天使轮 / 50-150人
    岗位职责: 1. 负责语音合成(TTS)的算法研究和工程实现,以及语音识别、数字人方向的算法研发、实现、优化和测试; 2. 负责虚拟人交互场景下的AIGC音频大模型、个性化实时情感对话语音合成、低资源音色克隆、变声、说话人识别和分割、语种识别、关键词唤醒等技术研发,实现语音算法的设计、开发和性能测试; 3. 制定产品语音算法相关性能的测试方法、测试流程和测试指标; 4. 负责跟进行业前沿技术发展趋势,跟踪国际最新算法发展方向和相应技术,产出新的科研成果,并落地于实际产品。 任职要求: 1. 本科或硕士以上学历,人工智能、语音、自然语言处理、机器学习、计算机等相关专业方向,基础扎实; 2. 熟悉语音合成或音色转换等相关技术,深刻理解 TTS 原理,熟悉TTS前端TN、G2P、韵律预测等,熟悉开源架构声学模型 Tacotron、FastSpeech、VITS和声码器WaveGlow、WaveRNN、HifiGAN等,并能够进行修改和应用; 有自然语音处理/语音信号处理等相关背景优先; 3. 熟悉主流的语音识别模型算法,如RNN-T、conformer,熟悉kaldi / K2 / wenet / espnet 等工具; 4. 有较强的算法实现能力,熟练掌握 Python/C++/Shell编程,熟悉Linux系统,至少熟练使用一种深度学习训练框架,如Pytorch、Tensorflow等; 5. 熟悉WebRTC、Speex、OPUS、librosa、BeamformIt等开源音频处理工具和库者优先; 6. 学习能力强,优秀的分析问题和解决问题的能力,工作积极主动、学习能力和动手能力强,性格随和、善于交流和分享; 加分项: 1. 有相关项目经历或音色克隆变声相关项目经验优先。 福利待遇: 五险一金,高额公积金,周末双休,法定节假日休息,十三薪,年假5天,每周三下午茶,不定时团建。
  • 30k-40k 经验1-3年 / 本科
    电商平台,IT技术服务|咨询,内容社区 / 未融资 / 15-50人
    岗位职责: 1、负责语音合成、转换、克隆等相关技术开发及优化; 2、跟踪国内外语音合成相关前沿算法、推动算法业务落地。 职位要求: 1、本科及以上学历,计算机、人工智能、语音合成、语音识别、语音信号处理、模式识别等相关专业; 2、熟悉语音合成相关主流算法,熟悉pytorch/tensorflow/espnet等深度学习训练框架; 3、熟悉常用TTS框架,包括但不限于前端、声学模型、声码器,能够对语音合成算法进行实验和优化; 4、熟练掌握 Python/C/C++ 至少其中一种编程语言; 5、具有优秀的分析问题与解决问题能力,具备良好的敬业精神与责任心,良好的沟通能力与团队合作意识。 加分项:有情感语音合成/语音转换/AI技术在虚拟数字人相关算法的研发工作(包括但不限于动作、表情、口型)等经验者优先。
  • 35k-60k 经验3-5年 / 硕士
    工具类产品 / A轮 / 150-500人
    语音算法工程师 职位描述: 1、负责公司全流程的智能语音场景的规划和实施; 2、负责 AIGC 相关的特定音色、情绪的语音合成相关算法研究和工程实现,主攻语音合成方向; 3、负责跟进行业前沿技术发展趋势,跟踪国际前沿算法发展方向和相应技术,能够在业务场景中进行落地应用。 职位要求: 1、硕士及以上学历优先,计算机、数学、统计等专业优先; 2、在 ICASSP、INTERSPEEC 发表过相关论文研究者优先; 3、熟悉语音识别的原理框架以及 Transformer, Tacotron, WaveNet, FastSpeech, VALL-E 等相关算法在语音合成中的应用; 4、熟练掌握 Kaldi, Wenet, SRiLM, TensorFlow 等社区开源工具中的一种及以上; 5、熟练掌握 C/C++, Python, Go, Java 等编程语言中的一种或几种,对数据结构和算法设计有深刻理解; 6、熟悉语音合成声学模型相关算法,能够独立完成相关算法的设计和实现,有相关经验者优先 ; 7、较强的自学能力和独立思考能力,善于思考和表达自己的想法,同时又具备良好的团队合作精神。
  • 25k-50k·14薪 经验不限 / 硕士
    工具 / D轮及以上 / 2000人以上
    一 语音识别方向 岗位职责 1.语音识别算法模块开发及性能优化。 2.根据业务需求提供算法方案,并针对业务中出现的问题给出解决方案,保证方案正常交付。 3.大规模语音识别模型训练及效果优化。 4.跟进学术界工业界最新成果并落地,持续提升语音识别效果。 岗位要求 1. 2 年及以上语音识别算法工作经验。 2.***硕士及以上学历, 计算机、通信、电子工程相关专业。 3.具备良好的编程习惯, C++/python 至少一门语言达到熟练程度。并能熟练运用 torch/tensorflow 框架中的至少一种。 4.熟悉声学模型、语言模型、解码器中的一个或多个并有实际优化、落地经验。 5.有大参数量大数据量模型训练经验者优先考虑。 6.良好的沟通能力,能够团队协作,完成目标;能够不断学习、自我迭代,并具备一定的抗压能力。 二 语音合成方向 岗位职责 1.语音合成算法模块开发及性能优化。 2.根据业务方需求提供算法方案, 并解决执行过程中出现的问题, 保证方案正常交付。 3.提供高性能端上语音合成方案,满足低算力硬件推理需求。 4.跟进工业界、学术界最新成果并落地,持续提升语音合成效果。 岗位要求 1. 2 年及以上语音合成算法工作经验。 2.***硕士及以上学历,电子工程、通信、计算机、自动控制等相关专业。 3.具备良好的编程习惯, C++/python 至少一门语言达到熟练程度。并能熟练运用 torch/tensorflow 框架中的至少一种。 4.有嵌入式设备开发语音合成算法经验者优先考虑。 5.良好的沟通能力,能够团队协作,完成目标;能够不断学习、自我迭代,并具备一定的抗压能力。
  • 20k-30k 经验1年以下 / 硕士
    移动互联网,人工智能 / D轮及以上 / 150-500人
    岗位职责: 1)负责语音转写、语音关键词检索等技术的研发; 2)负责语音识别技术的产品化落地。 岗位要求: 1)研究生以上学历,语音处理、模式识别、人工智能、计算机应用等相关专业。 2)熟悉语音转写算法,从事过语音处理或关键词检索项目研发。 3)熟悉Linux下C/C++开发,有一定的软件开发项目经验。 4)掌握深度学习算法和工具使用。 5)有责任心,有团队合作意识。
  • 12k-24k 经验1-3年 / 硕士
    移动互联网 / 未融资 / 50-150人
    1、岗位职责: ① 负责模型的优化训练; ② 负责A.I.前沿技术的研究及工程实现; ③ 负责核心算法与系统方案在业务落地并推广; 2、岗位要求: ① *****本科及以上学历,应用数学、计算机、信号处理、自动化等相关专业,具备一定的数理统计、模式识别、图像处理等理论知识; ② 具备较好的C/C++或Python编程能力,熟悉数据结构、Linux操作系统等,有一定的代码开发经历,能够快速实现相关算法; ③ 熟悉常见深度学习算法和理论,熟练掌握至少一种常见的深度学习框架(pytorch 、tensorflow等); ④ 从事过A.I.相关的研发任务,包括研究论文发表、研发项目经历等 ⑤ 后期能接受部分出差; 3、有以下经验或履历者优先考虑: ① 在人工智能会议(包括但不限于ACL、COLING、IJCAI、AAAI、ICLR、NIPS、CVPR、ICCV、InterSpeech、ICASSP或期刊上发表过文章; ② 在Kaggle、天池等国内外知名评测任务或比赛中成绩优秀者; ③ 在智能语音、计算机视觉、自然语言处理等相关方向有较丰富的实际系统研究和开发经验者; ④ 有kaldi 、Espnet 等工具使用经验者优先。 优秀者****
  • 10k-20k·13薪 经验在校/应届 / 硕士
    移动互联网,电商 / B轮 / 150-500人
    岗位职责 1. 算法研究。跟踪国际最新的语音前端相关算法,包括波束形成、单声道降噪、语音活动检测、回声消除、去混响、声源定位等,并针对实际需求选取适合的方法开发算法原型 2. 算法实现。将验证过的算法原型在对应的嵌入式平台上实现,或是配合软件工程师进行算法实现 3. 协同测试。配合测试工程师在实际环境对相关算法进行测试验证 4. 文档编写。编写算法原型、嵌入式平台代码的技术文档,以及对上述各个阶段的关键问题进行记录 任职资格 1. 重点院校硕士及以上学历。有良好的数学基础。熟练掌握微积分、线性代数、概率统计的相关理论和分析方法 2. 熟练掌握信号与系统基本理论和分析方法 3. 熟练掌握C/C++/MATLAB/Python 4. 英语达到六级以上水平,能够流畅阅读英文文献 5. 有麦克风阵列信号处理相关项目学习实践经验者优先 6. 为人诚实并富有责任心,乐于学习并具有团队合作精神和良好的沟通能力
  • 28k-56k 经验不限 / 本科
    金融、企业服务 / 未融资 / 15-50人
    岗位JD: 职位名称:语音算法工程师 公司名称:XX科技 职位描述: 我们正在寻找一位有经验的语音算法工程师,负责开发和实现领先的语音算法,为公司提供高质量的人工智能语音服务。 职位要求: - 具备计算机科学、信号处理等相关专业的学士及以上学历; - 熟练掌握语音识别、语音合成等相关技术,了解语音识别、语音合成的工作原理和算法; - 熟悉至少一种编程语言,如Python、C++等,具备良好的编程能力; - 具备扎实的数学基础,熟悉概率论、统计学等相关知识; - 具备较强的沟通能力和团队合作精神,能够与团队成员和客户进行有效的沟通和合作; - 具有相关项目经验,能够独立完成项目开发。 岗位职责: - 开发和实现领先的语音算法,包括语音识别、语音合成等; - 参与算法设计,研究新的算法和技术,并将其应用到产品中; - 维护和升级现有的算法,确保算法的准确性和性能; - 参与项目开发,与团队成员和客户进行有效的沟通和合作; - 分享算法和技术知识,协助团队成员共同成长。 我们提供具有竞争力的薪酬和福利待遇,包括弹性工作时间、培训和职业晋升机会等。如果你对这个岗位感兴趣,并且符合上述要求,请提交你的简历和个人陈述,我们期待你的加入。
  • 14k-20k 经验在校/应届 / 硕士
    智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 工作内容: 1、负责语音合成、情感语音识别、音乐生成、语音增强等相关算法的研究和开发工作; 2、探索语音领域前沿技术,跟进国际前沿研究成果; 岗位要求: 1、硕士以上学历,信号处理、计算机、电气工程或相关专业背景,掌握语音相关算法基础理论知识; 2、一年以上深度学习音频方向相关工作经验; 3、熟悉一种以上深度学习框架(如Tensorflow、PyTorch),至少熟练掌握Python、C/C++、Jave等一门编程语言; 4、在至少一个音频领域有深入研究,例如语音合成、音乐合成、声纹识别、语音增强等; 5、具有团队协作能力,有责任心、沟通能力强者优先。
  • 14k-20k 经验在校/应届 / 硕士
    智能硬件 / 不需要融资 / 2000人以上
    工作地点杭州之江实验室新园区 工作内容: 1、负责语音合成、情感语音识别、音乐生成、语音增强等相关算法的研究和开发工作; 2、探索语音领域前沿技术,跟进国际前沿研究成果; 岗位要求: 1、硕士以上学历,信号处理、计算机、电气工程或相关专业背景,掌握语音相关算法基础理论知识; 2、一年以上深度学习音频方向相关工作经验; 3、熟悉一种以上深度学习框架(如Tensorflow、PyTorch),至少熟练掌握Python、C/C++、Jave等一门编程语言; 4、在至少一个音频领域有深入研究,例如语音合成、音乐合成、声纹识别、语音增强等; 5、具有团队协作能力,有责任心、沟通能力强者优先。
  • 70k-80k 经验在校/应届 / 硕士
    人工智能服务,IT技术服务|咨询 / D轮及以上 / 500-2000人
    工作职责: 1.参与语音识别、音频分类相关算法的研究; 2.参与语音技术及产品相关的研发工作; 3.跟踪国际最新的语音识别相关先进技术和前沿技术发展趋势。 任职要求: 1.硕士及以上学历,熟悉经典数据结构和算法; 2.熟悉linux操作系统,有使用Shell, Perl, Python等脚本语言的实际经验优先; 3.有语音识别、语音合成的项目实践经验者优先; 4.熟悉常用的深度学习模型和机器学习方法优先; 5.具有良好的自主创新、团队合作以及沟通能力。 工作地点:北京、上海、深圳、新加坡;
  • 25k-40k·16薪 经验3-5年 / 本科
    工具 / 上市公司 / 2000人以上
    工作职责 -跟踪kws前沿相关技术 -负责定制唤醒、自定义唤醒等技术研发和业务支持 -负责声源定位技术的研发和业务支持 -负责AEC技术的研发和业务支持 任职资格 -熟悉深度学习,有唤醒和语音识别经验加分 -编程能力强,至少熟练掌握C/C++/Python等一门编程语言 -吃苦耐劳,抗压能力强
  • 30k-45k·15薪 经验3-5年 / 本科
    人工智能 / A轮 / 15-50人
    岗位职责: 1. 负责语音识别、语音生成、声纹与风格迁移等语音相关算法的设计与实现; 2. 探索自然语言、探索新技术在业务中的落地和创新,并迅速进行转化; 3. 根据产品需求,跟踪技术前沿并进行有效预研与落地实现; 岗位要求: 1. 计算机相关专业本科以上学历; 2. 2+年深度语音算法经验,3+年 Python或C++经验; 3. 有 pytorch 和 tensorflow 的使用与部署经验; 4. 有专研精神,能独立进行前沿技术攻关,习惯阅读英文文献; 加分: NLP、音频信号处理、ICASSP和Interspeech等论文发表
  • 22k-28k·15薪 经验1-3年 / 硕士
    VXI
    软件服务|咨询 / 不需要融资 / 2000人以上
    岗位职责: 1、负责语音合成前端的前沿算法研究; 2、组织最新的语音合成基础技术研发,提升整体合成质量和效率; 3、负责语音合成前端的效果分析和优化工作、以及语音合成音库的机器辅助标注工作; 任职要求: 1、计算机、信号处理等相关专业本科及以上学历; 2、具有机器学习、模式识别和自然语言处理方面的知识,具有自然语言处理或语音合成前端研发经验; 3、具备熟练的 C、C++ 或 python 编程能力; 4、熟悉 CRF(条件随机场)和 RNN(循环神经网络)等主流韵律信息建模算法、熟悉 TensorFlow 或 Theano 等工具者优先考虑; 5、有较丰富的工程经验,良好的逻辑思维,具备极强的责任心和精益求精的工作态度; 6、良好团队协作精神和一定的抗压能力; 加分项: 1、对多语种或方言发音规律和音韵学有了解者优先 2、对语音识别等其它相关技术有深入了解和实际经验