-
职位职责: 1、深入参与语音大模型的构建,搭建具有通用性和扩展性的大模型数据生产、评测体系,深度配合算法、产品团队进行NLP/ASR方向自研探索和业务落地; 2、结合行业趋势及业务应用场景,迭代更新标评标准及题库,与产品算法团队协同,积极探索自动化数据生产/模型评估、数据合成等方法,提高数据标注/评测效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式; 3、培训和管理标注团队,以数据质量与生产效率为导向,通过PE、代码、Agent、机标模型优化等形式完成数据预处理、数据清洗与分析,持续提升数据处理效率并降低人工投入,确保大语言模型训练数据有效; 4、为字节跳动产品提供语言学专业支持,用AI技术影响数亿用户。 职位要求: 1、计算语言学、语言学、汉语言文学等相关专业,硕士或博士学位优先; 2、中文基础扎实,语感良好,情绪感知力强,对语音敏感,英文能力良好者(专八/雅思7.5分以上)优先; 3、对话AI深度用户,能够敏锐识别并理解人机交互中对话节奏、附和、主动推进等表现能力,具备访谈、咨询等经验加分; 4、会基础编程/有深度学习经验/了解大模型原理或评测方案者优先; 5、思维活跃、擅长交流、有探索精神、耐心细致、渴望挑战真实业务场景中的对话系统问题。
-
职位职责: 1、负责AI大模型语音产品交付,包括PE、Agent、运营物料等交付; 2、负责优化外呼、质检等语音机器人效果,通过模型评测、模型优化等方式推动机器人效果提升; 3、负责推进标准方案在业务侧的落地,保证效果及业务目标达成; 4、负责持续监控和跟进语音机器人上线后效果,并针对性优化。 职位要求: 1、1年以上AI语音运营经验,有大模型智能外呼、大模型智能质检经验优先; 2、具有处理和分析数据的能力,并熟悉大模型、数据挖掘等相关领域; 3、会基础编程/有深度学习经验/了解NLP技术者(如ChatGPT的原理)优先; 4、思维活跃、学习能力强、有探索精神、耐心细致、渴望挑战真实业务场景中的对话系统问题。
-
岗位JD: 职位名称:语音识别算法工程师 公司背景: 公司是一家专注于语音识别领域的高科技公司,致力于为各行业提供高质量的人工智能语音服务。公司发展迅速,拥有丰富的语音识别项目经验和先进的语音识别技术。 职位描述: 职位主要职责: 1. 负责公司语音识别算法的研究、实现和维护,提高算法性能和准确性; 2. 根据项目需求,参与算法设计和评估,并确保算法满足项目需求; 3. 参与开发和维护公司核心算法,保证算法的稳定性和可靠性; 4. 协助项目经理完成项目计划,并确保项目按时完成; 5. 参与与客户的技术沟通和需求确认,确保客户需求得到准确满足。 职位要求: 1. 硕士及以上学历,计算机、电子、通信、自动化等相关专业; 2. 具备2-4年语音识别项目经验,有知名公司背景优先考虑; 3. 熟悉语音识别算法,包括深度学习、传统算法等; 4. 熟悉主流深度学习框架,如TensorFlow、PyTorch等; 5. 具备良好的编程能力,熟悉至少一种编程语言; 6. 具备较强的沟通能力和团队合作精神,能够独立工作和承担责任。 福利待遇: 1. 具有竞争力的薪资待遇,根据个人能力和业绩给予; 2. 为员工提供完善的社会保险和商业保险; 3. 提供丰富的培训机会和职业晋升空间; 4. 提供各类带薪假期、生日福利等。
-
工作职责: 1、负责语音识别/语音唤醒相关算法研究和开发 2、负责语音识别/语音唤醒引擎相关工具的开发与维护,以及相关工具文档的撰写 3、负责与产品部门对接引擎输出,提供技术支持 任职资格: 1、语音识别/语音唤醒算法2年以上工作经验 2、熟悉主流语音识别/语音唤醒算法,具有模型训练经验和模型调优能力 3、负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等 4、精通Kaldi、Pytorch、Espnet、Wenet、DeepSpeech、Speechbrain等一种或多种算法框架,有端到端搭建语音识别系统的经验 5、专业背景:计算机,通信工程,电子信息工程等相关专业硕士及以上 6、熟悉 Linux 环境开发,熟悉C/C++ 开发者优先 7、在interspeech/icassp等会议有发表过文章者优先考虑 8、较强的英文论文阅读能力,沟通能力和良好的团队合作精神
-
工作职责: 1、负责语音识别大模型方向的算法创新,模型训练及落地 2、分析业务反馈的语音识别生产问题,并提供优化解决方案 3、 负责语音识别推理引擎的功能研发及性能优化 任职资格: 1、对以下一种或多种语音识别领域有较深入的研究:端到端语音识别算法,自监督学习算法,说话人角色区分(speaker diarization),对模型原理有较深入的理解。 2、熟悉pytorch/tensorflow 深度学习框架,以及python/c++编程语音,具备较强的编程能力,能够对论文中的算法进行复现。同时具备一定的工程能力,熟悉模型工程落地的常用方案 3、具备模型调优能力,针对模型的训练结果进行分析,并调整模型训练参数进行进一步优化改进 4、有语音顶会论文发表经验优先 5、硕士及以上学历
-
负责多语言语音识别效果优化 负责语音识别模型加速、上线 负责多语言语言模型构建、解码器开发与维护 岗位要求: 信号处理、计算机、电子信息、自动化、模式识别等相关专业 有深度学习相关研究或工作经验 Linux环境下开发与调试经验,熟悉c/c++ 具有创新力和批判性思维 良好的沟通能力 负责任、有激情、认真以及结果导向 抗压能力强,适应创业公司节奏,希望博取未来 有语音识别、语音合成、声纹识别等实际工作经验者优先考虑
-
岗位职责: 1、负责语音合成、转换、克隆等相关技术开发及优化; 2、跟踪国内外语音合成相关前沿算法、推动算法业务落地。 职位要求: 1、本科及以上学历,计算机、人工智能、语音合成、语音识别、语音信号处理、模式识别等相关专业; 2、熟悉语音合成相关主流算法,熟悉pytorch/tensorflow/espnet等深度学习训练框架; 3、熟悉常用TTS框架,包括但不限于前端、声学模型、声码器,能够对语音合成算法进行实验和优化; 4、熟练掌握 Python/C/C++ 至少其中一种编程语言; 5、具有优秀的分析问题与解决问题能力,具备良好的敬业精神与责任心,良好的沟通能力与团队合作意识。 加分项:有情感语音合成/语音转换/AI技术在虚拟数字人相关算法的研发工作(包括但不限于动作、表情、口型)等经验者优先。
-
岗位职责: 1、负责语音合成前端的前沿算法研究; 2、组织最新的语音合成基础技术研发,提升整体合成质量和效率; 3、负责语音合成前端的效果分析和优化工作、以及语音合成音库的机器辅助标注工作; 任职要求: 1、计算机、信号处理等相关专业本科及以上学历; 2、具有机器学习、模式识别和自然语言处理方面的知识,具有自然语言处理或语音合成前端研发经验; 3、具备熟练的 C、C++ 或 python 编程能力; 4、熟悉 CRF(条件随机场)和 RNN(循环神经网络)等主流韵律信息建模算法、熟悉 TensorFlow 或 Theano 等工具者优先考虑; 5、有较丰富的工程经验,良好的逻辑思维,具备极强的责任心和精益求精的工作态度; 6、良好团队协作精神和一定的抗压能力; 加分项: 1、对多语种或方言发音规律和音韵学有了解者优先 2、对语音识别等其它相关技术有深入了解和实际经验
-
职位描述 职位描述(包括但不限于以下) 1. 负责语音合成(TTS)和语音转换(VC)的算法研究; 2. 负责跟进行业前沿技术发展趋势,跟踪国际最新算法发展方向和相应技术; 职位要求 1、语音合成、语音识别、语音信号处理和模式识别等相关专业硕士及以上学历; 2、掌握pytorch/tensorflow/espnet等任意一种常用深度学习框架; 3、熟悉常用TTS框架,包括但不限于前端、声学模型、声码器,能够对语音合成算法进行实验和优化; 4、熟练掌握 Python/C/C++ 至少其中一种编程语言; 5、了解当前语音合成的方法,能够跟踪最新的研究方向,流畅阅读英文文献。 优先考虑 1. 有情感语音合成/语音转换/语音驱动口型表情等经验者优先。 2. 有ACM获奖经历者优先。
-
1、说话人识别引擎的研发; 2、语音识别引擎的研发; 3、深度学习系统的调试调参和模型架构创新。 任职要求: 1、 研究生或以上学历,计算机相关专业,有2年以上深度学习经验、语音项目研发经验或者自认为有对等能力者; 2、 对计算机相关基础知识有较好理解,代码基础强,熟练掌握Python; 3、 熟悉深度学习框架的使用,包括Tensorflow和Pytorch; 4、 对Transformer等最新神经网络架构有深入了解,发表过语音识别、深度学习相关论文者优先; 5、 对语音识别或机器学习有长期投入意愿。 6、每周至少坐班3天,实习时长不少于3个月
-
工作地点杭州之江实验室新园区 工作内容: 1、负责语音合成、情感语音识别、音乐生成、语音增强等相关算法的研究和开发工作; 2、探索语音领域前沿技术,跟进国际前沿研究成果; 岗位要求: 1、硕士以上学历,信号处理、计算机、电气工程或相关专业背景,掌握语音相关算法基础理论知识; 2、一年以上深度学习音频方向相关工作经验; 3、熟悉一种以上深度学习框架(如Tensorflow、PyTorch),至少熟练掌握Python、C/C++、Jave等一门编程语言; 4、在至少一个音频领域有深入研究,例如语音合成、音乐合成、声纹识别、语音增强等; 5、具有团队协作能力,有责任心、沟通能力强者优先。
-
岗位职责 • 为不同的业务场景,研发、维护、优化不同类型的声学模型、前端模块和声码器。针对嵌入式平台与云平台优化模型推理延迟。 • 研发个性化TTS,包括语音克隆,语音转换和多语种合成语音转换化和多语种合成。 • 持续跟进业界最新研究成果,并探索适用于实际落地的方案。 基础能力 • 硕士及以上学历,人工智能、计算机、信号处理、计算机语言学等相关专业,熟悉TTS全链路技术。 • 精通Python,熟悉C/C++。熟练使用PyTorch/TensorFlow, 并具备实际部署经验。 专业经验 • 具有TTS经验,至少参与过1个完整项目落地(学术或工业场景均可)。 • 深入理解主流声学模型(Tacotron2、FastSpeech系列、LightSpeech、Diffusion-based模型)及声码器(HiFi-GAN、WaveRNN)的实现原理。 • 有轻量化模型开发经验,了解模型蒸馏、参数量化(INT8)等技术。 加分项 • 对语音克隆、情感合成、多语种合成等方向有深入研究,并发表过相关论文。 • 熟悉语音数据标注与清洗工具链,有自动化数据处理经验。 • 有语音大模型框架复现经验。 工作地点 • 成都/上海
-
岗位职责 - 负责多语种上严谨的前端+情感速度音色可控的端到端声学模型+还原度极高的声码器各个模块 - 神经网络语音合成的速度调优 - 对录音数据收集工作给出指导性意见 任职需求 - 具有语音合成研发相关知识和从业经验,对语音合成效果具有极高的追求 - 对新技术有热情和动力去尝试和掌握 - 本科以上学历,计算机或相关专业; - 良好的沟通能力。 加分项 - 在INTERSPEECH、ICASSP、ASRU等语音顶会上发表过论文 - 负责过语音合成技术在线上产品中真正投入使用
-
岗位职责: 1) 负责Android应用层的智能语音软件开发 2) 与产品团队紧密配合,讨论并充分理解需求,并完成开发; 3) 进行程序单元.功能的测试,查出软件存在的缺陷并保证其质量; 4) 主持代码评审,合理安排代码重构,不断改进代码质量; 5) 指导团队其他成员,为项目的顺利实施提供支持 岗位要求: 1) 计算机及其相关专业,本科及以上学历,具备5年以上Android应用开发经验; 2) 具有2年及以上的对话管理模块开发经验 3) 精通android开发平台及框架原理,熟悉framework层的架构设计方法及核心的系统Service(ActivityManagerService, WindowManagerService, PackageManagerService等)运行机制; 5) 精通Android UI .界面开发.图片处理等开发; 6) 熟悉android的存储方式,如sqlite数据库.文件等 加分项: 1) 有行业主流语音识别公司任职经验者优先 2) 熟悉NLP者优先
-
岗位职责: 1、标注NLU、ASR、TTS数据; 岗位要求: 1、汉语言相关专业; 2、熟悉智能语音产品,比如智能音箱、手机语音助手、翻译机等等。了解智能语音技术(唤醒、识别、自然语言理解等技术)优先; 3、 熟练操作office; 4、工作积极主动、踏实。


