• 30k-50k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责核心算法研发: 1)负责语音识别(ASR)算法的设计与优化,构建高精度、低延时的语音处理系统; 2)主导语种识别(LID)、说话人分离(SSD)等语音相关技术的研发与落地; 3)深入探索Whisper/FunASR等开源语音项目,结合业务需求进行技术创新与改进; 2、负责技术应用与优化: 1)将语音算法应用于会议转录、实时字幕、语音消息等ToB办公场景; 2)优化语音模型在云端的推理性能,提升资源利用效率; 3)建设语音领域的高质量数据集及评测体系; 3、工程能力建设: 1)深入使用Python进行算法开发,熟练应用PyTorch/TensorFlow搭建训练Pipeline; 2)构建高性能推理框架,探索TensorRT/Triton/OnnxRuntime等加速工具的应用; 4、跨团队协作: 1)与产品团队合作挖掘用户需求,推动语音技术在产品中的创新应用; 2)与工程团队协作完成模型部署,解决端到端落地中的技术挑战; 5、技术前瞻性研究: 1)持续跟踪ICASSP/INTERSPEECH等顶会最新进展; 2)探索语音与大模型结合的创新方向。 职位要求: 1、3年以上语音算法研发经验,主导过ASR/LID/SSD任一方向的完整项目; 2、精通Python及常用AI工具链(NumPy/Pandas等),深度掌握PyTorch/TensorFlow框架; 3、熟悉语音信号处理全流程(前端处理/特征提取/声学建模/语言模型); 4、对语音技术有强烈热情,能持续跟踪领域前沿动态; 5、具备优秀的问题拆解能力,擅长解决数据/训练/部署中的复杂问题; 6、良好的跨团队沟通能力,能将技术语言转化为业务价值。 加分项 1、有Whisper/FunASR等开源项目二次开发经验; 2、掌握CUDA编程,具备TensorRT/Triton等推理框架实战经验; 3、在ASR领域**会议发表论文或持有相关专利; 4、具备多语种(中/英/日)语音处理经验。
  • 15k-25k·15薪 经验不限 / 本科
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    岗位要求: 1、积极配合算法研发团队,收集,清洗,整理数据,并进行数据标注,建立算法测试/训练数据集,为算法研发人员提供数据支撑; 2、负责算法的准确性,性能,稳定性,可用性等的测试和评测,完成算法和产品的集成测试,编写测试用例和测试报告; 3、能够依据算法的不同,从服务业务的功能、效果、稳定性进行测试设计与执行,根据业务的不同制定不同的测试策略,使用不同的测试方法,分析定位问题; 4、参与产品需求评审,具有较好的业务理解能力和沟通能力,测试严谨认真负责。 任职资格: 1、本科及其以上学历,超过1年TTS\ASR\NLP的相关测试经验; 2、了解自然语言处理,或语音识别的相关测试方法和基础知识,了解asr、nlp、tts的测试流程 3、熟悉测试流程以及测试相关技术者优先; 4、掌握Python语言,使用jmeter、potman等测试工具; 5、有较强的创新能力,良好的沟通能力以及团队协作能力; 6、良好的责任心、逻辑性、沟通能力,团队合作精神,独立并积极主动。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责AI大模型语音产品交付,包括PE、Agent、训练数据等构造与交付; 2、负责优化智能外呼、销售助手等语音机器人效果,通过模型评测、PE调优等方式推动机器人效果提升; 3、负责推进标准方案在业务侧的落地,保证效果及业务目标达成; 4、负责持续监控和跟进语音机器人上线后效果,并针对性优化。 职位要求: 1、1年以上AI语音产品运营经验,有大模型智能外呼、大模型销售助手产品经验优先; 2、具有处理和分析数据的能力,并熟悉大模型、数据挖掘等相关领域的基本方法; 3、具备基础代码能力,有一定的大模型精调经验; 4、思维活跃、学习能力强、有探索精神、耐心细致、渴望挑战真实业务场景中的对话系统问题。
  • 4k-6k 经验不限 / 硕士
    科技金融,人工智能服务 / 上市公司 / 500-2000人
    岗位职责: 1. 语音识别,声纹识别方向 需求: 1. 熟悉C++和Python 2. 熟悉机器学习和深度学习算法 3. 熟练使用Pytorch或TensorFlow 4. 有Kaldi,DeepSpeech,ESPNet经验优先 5. 每周实习时间保证4天以上
  • 11k-20k 经验1-3年 / 大专
    社交平台,内容社区,新媒体 / 不需要融资 / 50-150人
    一、 岗位职责  负责公司出海语音社交App的运营工作  1. 主要负责管理和招募公会、经纪。扩展公会&新用户资源;  2. 协调好公会和经纪等多方保持良好合作;  3. 系统化地培训公会和主播;  4. 策划房间活动,增加氛围及用户粘性;  5. 收集及分析信息,形成产品功能或者活动需求;  6. 独立进行产品运营数据分析,及时调整运营策略与运营活动节奏,并针对发现的问题推动产研部门进行解决。  二、 岗位要求  1. ***专科或以上学历;1年以上的海外泛娱乐运营经验;  2. 有印尼语或英语CET-4或以上,英语口语能跟外国人进行日常沟通交流;(可直接使用印尼语/阿拉伯语等小语种更佳);  3. 熟悉海外语聊房运营套路者,有营收经验者优先;  4. 对数据敏感,能熟练使用数据分析工具者优先。识别问题,解决问题,赋能产品;  5. 具备优秀团队合作精神。踏实工作、积极承担,主动反馈,责任心强,执行能力强;
  • 10k-18k 经验1-3年 / 本科
    社交平台,内容社区,新媒体 / 不需要融资 / 50-150人
    一、 岗位职责 负责公司出海语音社交App的运营工作 1. 主要负责管理和招募公会、经纪。扩展公会&新用户资源; 2. 协调好公会和经纪等多方保持良好合作; 3. 系统化地培训公会和主播; 4. 策划房间活动,增加氛围及用户粘性; 5. 收集及分析信息,形成产品功能或者活动需求; 6. 独立进行产品运营数据分析,及时调整运营策略与运营活动节奏,并针对发现的问题推动产研部门进行解决。 二、 岗位要求 1. ***专科或以上学历;1年以上的海外泛娱乐运营经验; 2. 有阿拉伯语或英语CET-4或以上,英语口语能跟外国人进行日常沟通交流;(可直接使用阿拉伯语等小语种更佳); 3. 熟悉海外语聊房运营套路者,有营收经验者优先; 4. 对数据敏感,能熟练使用数据分析工具者优先。识别问题,解决问题,赋能产品; 5. 具备优秀团队合作精神。踏实工作、积极承担,主动反馈,责任心强,执行能力强;
  • 18k-25k·13薪 经验3-5年 / 本科
    医疗丨健康 / B轮 / 150-500人
    岗位职责 诊室语音交互系统开发 1. 构建语音转文字(ASR)系统,支持医患对话实时转录(需适配儿童语音特点及医疗术语),支持病历文书的智能生成。 2. 构建智慧诊室空间,使用语音识别技术与系统进行交互,控制诊疗过程。 3. 特殊音频识别,例如患者哭闹或医患沟通异常,情感识别。 4. 对医患沟通场景(诊室、电话)等进行音频质控。 5. 音轨匹配,智能识别位置、参与人和医疗过程。 6. 使用TTS构建多场景陪练。 7. 跨部门协作。与口腔医生、产品经理沟通需求,快速验证算法可行性并反馈结果。 任职要求 1. 技术基础:     - 本科及以上学历,计算机/软件工程/生物医学工程等相关专业。     - 熟练使用Python,熟悉PyTorch或TensorFlow基础。     - 熟悉docker、cuda、flask等技术 2. 沟通与问题分析能力:     - 有良好的沟通能力与需求分析能力,能够与口腔医生、产品经理紧密沟通,准确理解临床需求,并拆解为可落地的AI算法问题。 3. 应用经验:     - 有1年以上AI项目落地经验,了解模型训练-部署流程     - 熟练掌握语音处理技术(如FunASR、Kaldi、Whisper等)
  • 10k-20k 经验1-3年 / 本科
    文娱|内容,社交 / 未融资 / 15-50人
      【语音APP开发工程师】 职位描述: 1. 负责语音APP的产品设计、开发、测试及优化,以满足产品功能和性能要求; 2. 研究语音识别、语音合成、语音唤醒等前沿技术,并应用于实际项目中; 3. 基于Android和iOS平台进行语音APP开发,确保应用的稳定性和兼容性; 4. 与产品、设计、测试团队紧密合作,确保项目进度和质量; 5. 跟进新技术和新工具的发展,持续优化现有产品和技术。 职位要求: 1. 本科及以上学历,计算机相关专业,2年以上语音APP开发经验; 2. 熟悉Android和iOS平台的开发环境和工具,具备扎实的编程基础; 3. 熟悉语音识别、语音合成、语音唤醒等相关的语音技术,有实际项目经验者优先; 4. 熟悉网络编程、多线程、内存管理等技术,能解决常见的技术难题; 5. 具备良好的沟通能力和团队协作精神,有较强的学习能力和解决问题的能力; 6. 有音频处理、语音识别、语音合成等相关领域研究经验者优先。 我们提供: 1. 具有竞争力的薪酬待遇和晋升空间; 2. 完善的培训体系和职业发展路径; 3. 五险一金、年终奖、员工福利等; 4. 宽松的工作氛围和人性化的管理; 5. 广阔的职业发展平台和持续的技术提升机会。 欢迎有志之士加入我们的团队,共同创造更美好的未来!
  • 软件服务|咨询,工具类产品,人工智能服务 / 未融资 / 50-150人
    职位描述: 我们是一家致力于智能硬件创新的科技公司,专注于开发智能语音鼠标等前沿外设产品。现诚聘一位嵌入式固件开发工程师,负责智能语音鼠标的固件设计、开发和优化工作。理想的候选人应具备丰富的嵌入式开发经验,精通蓝牙BLE通讯和HID协议,并有语音鼠标或类似智能外设项目的开发经验。 岗位职责: 1、负责智能语音鼠标的固件开发,包括蓝牙BLE通讯、2.4GHz无线接收器通讯、语音功能集成等。 2、设计和实现蓝牙HID协议,确保鼠标与多种设备(如PC、手机、平板)的兼容性和稳定性。 3、优化固件性能,降低功耗,提升用户体验。 4、与硬件团队协作,调试和解决硬件与固件的交互问题。 5、编写测试用例,进行固件功能测试和性能优化。 6、参与产品需求分析,提供技术解决方案,并推动项目按时交付。
  • 15k-25k 经验不限 / 本科
    人工智能服务 / A轮 / 50-150人
    蔚蓝由一群希望致力于为社会带来最好的人工智能和机器人科技创新的工程师一手打造,我们希望通过科技创新来让我们的世界变得更加美好。蔚蓝向此目标迈出的第一步是打造面向所有家庭和企业的个人机器人,以加快人工智能和机器人领域的技术革新,这将使我们能够更好的加速世界向可持续创造与生产的转变。 您所选择的蔚蓝团队,是一支以特种作战标准严格要求自己的科技创新创业团队。您将参与的是一项对社会有意义、有价值的伟大事业,您将加入的是一支艰苦努力、不断创新的特种作战团队,您将负责的是一款激动人心的、具有划时代意义的科技创新产品,您将面对巨大的综合性挑战和极速的事业发展机遇。我们要求您兼具卓越的专业能力和不畏艰难、勤奋拼搏的奋斗者品质,在别人都无能为力决定放弃的时候,您坚信办法总比困难多。 我们信奉专业的人才能创造专业的结果,因此,我们只招募专业的人从事专业的事情。在坚定认同我们共同事业的前提下,我们要求您必须能够自我管理、目标驱动、结果导向,必须能够科学、系统、严谨的处理关键工作,必须能够给出有效、高效、长效的解决方案,确保我们总是可以在激烈的市场竞争中克服困难、突破挑战、创造价值。 我们将保障团队的每一位成员能够在此前提下快速成长和发展,保障每一位成员能够多产多得、共创共赢。 职位介绍 您将负责开发语音识别、自然语言处理和语音合成等技术,实现人机交互和语音交互功能,提高用户体验和机器的智能化水平。 职位描述 1.负责机器人语音交互系统开发,包含声纹识别、情绪识别、意图理解、语音交互逻辑等算法研发; 负责语音交互算法的开发和优化,实现高效、准确的语音识别和语音合成; 2.参与系统架构和算法设计,对整个语音交互系统进行优化和改进; 3.参与语音交互产品的规划、设计和开发,与产品经理、硬件工程师等进行协作; 4.负责处理语音数据,如采集、处理、压缩、存储等,确保数据质量和保密性; 5.参与语音交互技术的研究和创新,跟踪最新技术动态,进行技术评估和应用。 职位要求 1.本科及以上学历,计算机、通信、电子等相关专业,2年以上语音处理算法相关经验,扎实的数学基础和算法能力,熟练掌握信号处理、语音识别、语音合成、自然语言处理等相关技术;硕士及以上学历的计算机、通信、电子等相关专业的海内外名校毕业生优先; 2.熟练掌握C++、Python等编程语言,有良好的编码能力和代码风格; 熟悉常用的语音处理工具和库,如Kaldi、WeNet、Whisper等,并能够进行二次开发;熟悉深度学习模型的训练、优化和部署,熟悉常用深度学习框架,如TensorFlow、PyTorch等; 3.熟悉音频编解码技术,如PCM、MP3、AAC等,以及音频采集、处理和压缩等相关技术; 熟悉语音交互技术的发展趋势和应用场景,有一定的项目经验,能够独立完成语音交互模块的开发和优化; 4.熟悉深度学习模型的训练和优化,对语音领域的深度学习模型有深入理解;熟悉自然语言处理(NLP)领域的技术,包括文本预处理、序列标注、语言模型等方面的知识;有语音识别(ASR)和语音合成(TTS)方面的研究经验; 5.有团队协作经验,良好的沟通和组织协调能力,有较强的学习和理解能力; 6.熟悉智能硬件的语音交互技术和应用场景,有智能音箱、智能手机、车载语音系统等相关产品的开发经验者优先;熟悉语音唤醒、说话人识别、情感识别等领域的技术和应用; 熟悉语音识别模型的训练和调优,熟练掌握声学模型、语言模型、发音词典等方面的知识;有大规模语音数据处理和挖掘的经验,熟悉语音数据标注和清洗技术者优先。
  • 30k-45k 经验3-5年 / 本科
    物联网 / 天使轮 / 50-150人
    岗位职责: 1. 负责语音合成(TTS)的算法研究和工程实现,以及语音识别、数字人方向的算法研发、实现、优化和测试; 2. 负责虚拟人交互场景下的AIGC音频大模型、个性化实时情感对话语音合成、低资源音色克隆、变声、说话人识别和分割、语种识别、关键词唤醒等技术研发,实现语音算法的设计、开发和性能测试; 3. 制定产品语音算法相关性能的测试方法、测试流程和测试指标; 4. 负责跟进行业前沿技术发展趋势,跟踪国际最新算法发展方向和相应技术,产出新的科研成果,并落地于实际产品。 任职要求: 1. 本科或硕士以上学历,人工智能、语音、自然语言处理、机器学习、计算机等相关专业方向,基础扎实; 2. 熟悉语音合成或音色转换等相关技术,深刻理解 TTS 原理,熟悉TTS前端TN、G2P、韵律预测等,熟悉开源架构声学模型 Tacotron、FastSpeech、VITS和声码器WaveGlow、WaveRNN、HifiGAN等,并能够进行修改和应用; 有自然语音处理/语音信号处理等相关背景优先; 3. 熟悉主流的语音识别模型算法,如RNN-T、conformer,熟悉kaldi / K2 / wenet / espnet 等工具; 4. 有较强的算法实现能力,熟练掌握 Python/C++/Shell编程,熟悉Linux系统,至少熟练使用一种深度学习训练框架,如Pytorch、Tensorflow等; 5. 熟悉WebRTC、Speex、OPUS、librosa、BeamformIt等开源音频处理工具和库者优先; 6. 学习能力强,优秀的分析问题和解决问题的能力,工作积极主动、学习能力和动手能力强,性格随和、善于交流和分享; 加分项: 1. 有相关项目经历或音色克隆变声相关项目经验优先。 福利待遇: 五险一金,高额公积金,周末双休,法定节假日休息,十三薪,年假5天,每周三下午茶,不定时团建。
  • 10k-20k 经验1-3年 / 本科
    移动互联网,社交 / 不需要融资 / 50-150人
    语音合成工程师 对语音合成,比如 VITS,fastspeech2,hifigan,paddlespeech,wenet,espnet等开源代码架构有一定的了解, 独立完成过语音合成模型训练。 熟练掌握 python、pytorch。 具备良好的沟通和团队合作能力,能够与公司各类技术研发人员进行高效合作,共同完成应用目标。 薪资:8-20k
  • 30k-45k·15薪 经验3-5年 / 本科
    人工智能 / A轮 / 15-50人
    岗位职责: 1. 负责语音识别、语音生成、声纹与风格迁移等语音相关算法的设计与实现; 2. 探索自然语言、探索新技术在业务中的落地和创新,并迅速进行转化; 3. 根据产品需求,跟踪技术前沿并进行有效预研与落地实现; 岗位要求: 1. 计算机相关专业本科以上学历; 2. 2+年深度语音算法经验,3+年 Python或C++经验; 3. 有 pytorch 和 tensorflow 的使用与部署经验; 4. 有专研精神,能独立进行前沿技术攻关,习惯阅读英文文献; 加分: NLP、音频信号处理、ICASSP和Interspeech等论文发表
  • 25k-40k·16薪 经验3-5年 / 本科
    工具 / 上市公司 / 2000人以上
    工作职责 -跟踪kws前沿相关技术 -负责定制唤醒、自定义唤醒等技术研发和业务支持 -负责声源定位技术的研发和业务支持 -负责AEC技术的研发和业务支持 任职资格 -熟悉深度学习,有唤醒和语音识别经验加分 -编程能力强,至少熟练掌握C/C++/Python等一门编程语言 -吃苦耐劳,抗压能力强
  • 20k-40k·16薪 经验不限 / 本科
    工具 / 上市公司 / 2000人以上
    工作职责 -负责语音大模型算法的设计与实现,开展国际领先的前沿算法探索 -负责语音大模型算法模型训练数据飞轮建设 -负责语音交互相关的多模态算法研发 -负责语音大模型下游算法研发 职责要求 -精通Linux平台C/C++编程,对数据结构和算法设计有深刻的理解 -精通python等脚本语言,熟悉主流深度学习框架 -具备优秀的逻辑思维能力,较强的沟通能力和学习能力 -对钻研技术有极大热情的同学优先