• 50k-100k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责抖音直播中低延迟音频理解和生成模型的能力建设,为实时对话智能体提供音频技术支持,包括但不限于ASR、TTS、端到端语音大模型、音频分类等; 2、负责关键场景的算法优化,构建高质量低延迟的智能体系统,提升业务效果; 3、跟进业界前沿的音频技术,探索多模态感知交互能力的边界并落地产品。 职位要求: 1、计算机、人工智能、模式识别等相关专业本科及以上学历; 2、熟悉Linux系统和常用的数据结构,熟练使用Python/C++等至少一种编程语言,熟练使用TensorFlow/PyTorch等至少一种深度学习框架; 3、深入理解端到端语音大模型的原理和架构,熟悉常见的语音大模型,如Whisper等,对语音识别、合成、对话理解等技术有扎实的理论基础; 4、在语音、人工智能领域的会议和期刊,如ICASSP、Interspeech、NIPS、ICML、ICLR等发表过论文,或在相关竞赛中取得优异成绩者优先; 5、优秀的分析和解决问题的能力,对解决具有挑战性的问题充满激情,良好的沟通和团队合作能力。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责为抖音客服业务VOIP和热线等语音交互场景提供专业的音频技术支持与研发,运用端到端的语音大模型实现更高效、智能的客服音频交互体验; 2、负责端到端语音大模型在客服应用中的落地与优化,搭建智能音频理解和处理在客服领域的系统级解决方案; 3、跟进客服产品业务的语音/音频需求,持续改进产品的音频质量体验;结合实际业务场景,对模型进行针对性训练和调优,确保语音识别、合成等功能能精准适配客服对话需求,提升对话理解和回复的准确性; 4、跟踪研发业界先进的音频进展,探索语音/音频领域最新技术的研发并落地产品。 职位要求: 1、深入理解端到端语音大模型的原理和架构,熟悉常见的语音大模型,如Whisper等,对语音识别、合成、对话理解等技术有扎实的理论基础; 2、具备优秀的编程能力,熟练使用Python等主流编程语言,熟悉深度学习框架,如PyTorch或TensorFlow,能够进行模型的开发、训练和部署; 3、有语音大模型实际应用项目经验,特别是在音频通信、客服系统等领域,有相关经验者优先; 4、在语音处理、人工智能相关领域的高水平会议和期刊,如ICASSP、Interspeech等发表过论文,或在相关竞赛中取得优异成绩者优先。
  • 40k-80k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、设计开发大规模因果模型,支持多场景多目标的十亿用户级建模要求,优化娱乐直播用户的留存和体验; 2、设计开发激励策略,刻画策略对用户的长期影响,量化单次激励对于用户的长期增益、优化投放和激励策略,设计在无偏数据以及成本约束下的激励策略; 3、研究突破业务激励增长算法难题,包括大规模离散特征深度学习、因果模型、关系网络、运筹优化策略等研究方向,为业务增长赋能。 职位要求: 1、具备扎实的编码能力和机器学习理论基础,拥有良好的代码习惯和文档编写能力; 2、掌握机器学习的理论基础,熟悉经典的算法模型 (GBDT/LR/FM/DNN等) 和相关工具框架 (Tensorflow/PyTorch等); 3、能熟练使用Hive/S预估、因果推断、Uplift建模、统筹优化等项目中有实际的工作经验更佳; 4、优秀的理解沟通和团队协作能力,能快速理解业务背景,对数据敏感,以数据事实为基准,有较强责任心。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:国际化内容安全平台团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,以人工智能技术支持业务发展,力求更高效、更敏捷、更全能地维护站内生态安全。 1、负责大规模多模态基础模型(LLM/VLM)的预训练与后训练,探索在视频理解算法在国际化视频内容安全场景中的前沿应用; 2、主导大模型的SFT、RLHF等关键技术研发,提升模型在复杂视频内容安全任务中的对齐能力和泛化能力; 3、设计与维护多模态标注与评估体系,推动高质量数据建设,提升模型的可解释性与可靠性; 4、与基础架构、数据、平台团队紧密协作,优化分布式训练与推理效率,提升GPU资源利用率; 5、支持内容安全的业务需求,将大模型能力有效落地到真实审核场景中,持续提升风险检测、合规理解和审核自动化水平。 职位要求: 1、扎实的机器学习与深度学习基础,具备大规模模型研发经验,熟悉Transformer、Diffusion、RLHF等相关技术; 2、至少2年以上在大模型、计算机视觉或多模态方向的研发经验,具备大规模训练实践经验; 3、有较强的工程实现能力和代码调优能力,熟练掌握PyTorch或TensorFlow; 4、具备跨团队沟通和项目推动能力,能在复杂场景下提出创新解决方案并落地; 5、在**会议/期刊(NeurIPS,ICML,ICLR,CVPR,ICCV,ACL等)有论文发表者优先。
  • 30k-60k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、参与海外电商风控算法的设计与优化,为每一位用户、达人和商家保驾护航; 2、通过表征学习、图模型、深度学习、迁移学习、多任务学习等技术,提升问题发现的效率,从而快速阻断风险,优化电商社区生态各项指标; 3、通过大模型技术挖掘电商内容、交易和运营数据,通过RAG/SFT/RL/ReAct/Reflection等方法,提升风险识别的准召、解释和风险感知能力; 4、结合内容电商的业务特性,进行模型和算法创新,打造业界领先的内容电商风控算法体系。 职位要求: 1、两年以上算法研发经历,计算机相关专业本科及以上学历; 2、熟悉C++/Java/Python,具备优秀的编码能力,至少熟悉一种常见的机器学习/深度学习平台; 3、对业务和数据敏感,能够从数据上发现风险,提出解决方案,并验证效果; 4、有钻研精神,主观能动性强,能适应快速变化的业务需求,具备良好的团队合作精神和沟通技巧; 5、具有电商相关工作经验优先,具有反作弊或安全策略相关经验,对黑灰产对抗有一定了解者优先。
  • 30k-60k 经验1-3年 / 硕士
    社交媒体 / 上市公司 / 2000人以上
    1、参与图像、视频内容生成、理解、检索,自然语言理解等方向前沿技术研究 2、根据业务场景,给出相关算法层面解决方案并进行研发 3、完成相关模型搭建/调优/训练等相关工作,积极推动所负责能力的性能优化及工程化落地 4、持续关注相关领域最新进展,并进行前沿算法思想的落地验证 岗位要求: 1.计算机、数学等相关专业,硕士及以上学历,1-3年工作经验 2.数学基础扎实,能独立对现有算法进行定制优化提升 3.熟悉一般扩散模型、多模态模型,在图像生成、视频理解、多模态等方向有较为深入的研究,熟悉TensorFlow, Pytorch等框架 4.熟悉C/C++/python等语言,能熟练使用上述语言之一进行项目开发 5.了解数字图像处理一般方法,并有与深度学习相结合的实践经验; 加分项: 1.拥有扩散模型、多模态模型训练、调优经验者优先; 2.有AIGC方向项目商用落地经验者优先; 3.在国际期刊、会议上发表论文者优先
  • 30k-60k 经验不限 / 硕士
    社交媒体 / 上市公司 / 2000人以上
    职位描述: 1. 多模态大模型:探索跨模态的信息对齐方法,研究多模态大模型的预训练、指令微调、RLHF(拒绝学习与强化学习)等技术,评估和提高多模态数据质量,进行数据清洗 2. 内容理解:探索适合微博的实体识别、属性抽取、关系分类等技术,探索图文/视频多模态的内容分类、信息抽取、智能摘要等技术 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业的硕士生/博士生 2. 熟悉BLIP2、LLaVA、MiniGPT、VisualGLM、Qwen-VL等LMM模型结构及训练方法; 3. 熟练掌握tensorflow、pytorch等深度学习框架,扎实的编程基础
  • 30k-60k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责抖音与多模态大模型技术的结合落地,探索抖音结合AI的创新产品升级;基于对直播、短视频、评论等已有内容体裁的内容理解和二次创作生成,形成抖音下新的互动内容体裁,供创作者调试和推荐分发;为抖音下各场景业务目标负责,如交易场景的GMV、知识陪伴场景的互动效率等; 2、基于创作者历史资产(直播回放或短视频)进行多模态分类打标、高光提取、智能剪辑;基于口播稿、创作者形象等特定情况,生成口、动作驱动的真人视频,形成可调度的创作者个性化资产; 3、基于不同场景的业务诉求,设计Agent规划能力,形成视频编排脚本,优化围绕主题、剧情、商品的生成内容走向;支持实时交互下的视频调度和基础QA; 4、持续探索MLLM、LLM、Diffusion等通用大模型在各任务下的适配性,通过Post-Train(SFT、RL)优化,增强模型在业务领域下的效果和适配能力;Follow基于大模型的上层应用技术,Agent、Auto-Prompt、RAG等; 5、上述场景的各类模型训练、模型应用相关的基础建设,包括但不限于模型训练、数据工程、训练推理框架迭代、维护模型评估指标体系。 职位要求: 1、在CV、VLM、MLLM等领域有成熟的项目落地经验,有短视频、图文、直播算法领域经验优先; 2、学习能力和业务理解能力强,具有一定创新能力,对新领域能快速调研落地,独立设计产出技术方案; 3、具有扎实的机器学习基础,对深度学习、大语言模型、多模态模型、生成式模型等内容理解与生成技术有深入的理解,数理功底扎实,自学能力强; 4、有扎实的编码能力,熟练使用相关机器学习框架和工程框架; 5、在计算机科学会议和期刊如NIPS、ICML、CVPR、ICCV、ECCV、IJCAI、AAAI、KDD、SIGIR、WWW、ACL、PAMI、IJCV等发表过论文或有竞赛经验者优先。
  • 30k-60k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、探索多模态理解和生成大模型在文档智能领域的应用,包括但不限于视觉富文档解析、文档关键信息提取、视频摘要、视觉文档翻译等; 2、跟进领域内前沿技术,研发高效、可扩展的多模态大模型架构,解决文档智能领域中的技术挑战,推动新技术在业务中落地; 3、针对关键技术问题进行深入研究,发表顶会论文和申请专利。 职位要求: 1、计算机等相关专业优先; 2、有较强的编程能力,熟悉C++、Python等编程语言; 3、在计算机视觉算法、多模态算法、机器学习算法等领域有较深入的研究或有较多实际项目应用经验者优先; 4、在计算机视觉领域发表过论文; 5、具有良好的沟通协作能力,工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:抖音内容理解团队负责抖音集团内容算法工作,业务覆盖抖音、今日头条、西瓜视频、剪映等业务,承接业务在内容理解、LLM应用、新业务方向探索等方向的工作。技术上涵盖了CV,NLP,音频,LLM等算法方向。团队承载业务需求同时还负责底层基础算法技术,负责为抖音各个技术方向提供长期有深度的技术支撑,推动如基础预训练模型、视频生成等基础技术研究等工作,并产出了较多的学术论文、技术报告、开源能力等工作。得益于抖音集团业务数量庞大的多模态业务数据和业务需求,团队能够有资源和机会去做出行业领先的技术创新,用最新的技术去改变影响用户和改变行业格局。 1、研究方向:提升视频、音频、图像、文本及多模态的大模型基础能力,在业务领域与通用领域取得行业领先的效果,建设体系化的模型能力提升方法论;探索理解大模型与生成大模型能力结合互补模式,探索并落地一体化模型并取得更高的模型效果;推动多模态内容理解能力在搜索、推荐、广告等场景的落地应用; 2、负责抖音、直播、今日头条等业务场景下的开集内容理解工作,建设多模态大模型、生成式模型等前沿模型技术能力,接近人类感知认知模型能力,产出相应的研究成果; 3、负责抖音等业务场景通用多模态大模型的模型训练和基础建设,包括但不限于模型训练、数据工程、训练推理框架迭代、维护模型评估指标体系; 4、跟进行业最新技术进展,探索多模态方向的新技术研究与落地。 职位要求: 1、计算机/软件/人工智能/数学等相关专业的优先; 2、具有扎实的机器学习基础,对深度学习、大语言模型、多模态模型、生成式模型等内容理解与生成技术有深入的理解,数理功底扎实,自学能力强; 3、有扎实的编码能力,熟练使用相关机器学习框架和工程框架; 4、在多模态大模型领域有经验,在短视频、图文算法领域有经验者优先; 5、在计算机科学高水平会议和期刊如NIPS、ICML、CVPR、ICCV、ECCV、IJCAI、AAAI、KDD、SIGIR、WWW、ACL、PAMI、IJCV等发表过论文或有竞赛经验者优先。
  • 30k-60k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责抖音系产品中视频、直播、图文等不同体裁下评论(文评、图评、音评等)、弹幕等互动内容的安全、体验、增长、创新工作; 2、面向互动内容中存在的对抗表达、隐晦表达、知识依赖等语义挑战,时序性、多模态、交互性等结构挑战,研发大模型驱动的机审系统,提升互动内容的安全、画风、生态的治理能力,有效降低互动内容的潜在风险; 3、分析和挖掘互动内容中蕴含的用户真实意图,探索基于大模型增强的统一内容理解技术,优化排序和分发策略以调控互动体验,提升平台口碑与用户粘性,支持在推荐、搜索、推送、广告、精选等场景中的应用; 4、探索技术驱动的创新互动内容产品形态,如智能总结、主播助理等,促进互动效率提升与用户增长; 5、基础技术方面持续探索LLM/MLLM等通用大模型在内容安全和理解领域的适配,从Pre-Train、Post-Train(SFT、RL)等方面优化,增强模型的感知和推理能力;同时探索围绕大模型相关的应用技术能力,如Auto-Prompt Engineering、Embedding、Incontext Learning、RAG等。 职位要求: 1、具有扎实的人工智能方面的基础知识,对CV、VLM、MLLM等技术有深入的理解,数学功底扎实,学习能力强; 2、有扎实的编码能力,熟悉主流的深度学习训练框架、工程框架等; 3、在CV、VLM、MLLM领域有成熟的项目落地经验,在短视频、图文、直播算法领域有经验者优先; 4、在计算机科学高水平会议和期刊如NIPS、ICML、CVPR、ICCV、ECCV、IJCAI、AAAI、KDD、SIGIR、WWW、ACL、PAMI、IJCV等论文发表或有竞赛经验者优先; 5、具有独立的分析问题和解决问题的能力,对解决具有挑战性问题充满激情;对技术有热情,追求极致,自驱力强;6、有良好的团队合作意识、沟通表达能力。
  • 电商平台 / C轮 / 2000人以上
    岗位职责: 1、负责电商流量策略相关算法的落地和优化,包括但不限于新品冷启、爆款打造等,与运营、产品、分析等团队深度合作,持续优化流量效率和平台生态。 2、负责流量分配调控系统的建设,与产品协作将算法能力平台化。 岗位要求: 1、熟悉常用机器学习/运筹学算法,有搜推广和流量调控算法经验优先。 2、至少精通一门编程语言(Python、Scala、Java等),能熟练使用一种以上大数据处理模型和框架。 3、逻辑清晰,具备较好的数据敏感度和业务思维。 4、良好的沟通能力,具有跨团队的多方密切合作意识。
  • 30k-60k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、构建用户画像体系,用户基础属性以及兴趣偏好等画像数据的建模和挖掘; 2、多模态理解和多种用户属性挖掘,构建知识图谱基础数据资产; 3、探索图谱在各种日常场景的中的应用; 4、通过 NLP、多模态、Graph 等领域的前沿技术,不断提升知识图谱构建的效率和业务应用的效果。 职位要求: 1、熟悉统计机器学习理论,熟悉常见分类、聚类机器学习和深度学习算法; 2、具备数据挖掘、NLP、知识图谱、Graph相关算法原理知识背景; 3、熟悉C++/Java/Python等,具备优秀的编码能力,至少熟悉一种常见的机器学习/深度学习平台; 4、有钻研精神,突出的数据分析能力,主观能动性强,能适应快速变化的业务需求,具备良好的团队合作精神和沟通技巧; 5、有用户画像、知识图谱、数据应用开发经验者优先。
  • 30k-60k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、探索多模态理解和生成大模型在文档智能领域的应用,包括但不限于视觉富文档解析、文档关键信息提取、视频摘要、视觉文档翻译等; 2、跟进领域内前沿技术,研发高效、可扩展的多模态大模型架构,解决文档智能领域中的技术挑战,推动新技术在业务中落地; 3、针对关键技术问题进行深入研究,发表顶会论文和申请专利。 职位要求: 1、计算机等相关专业优先; 2、有较强的编程能力,熟悉C++、Python等编程语言; 3、在计算机视觉算法、多模态算法、机器学习算法等领域有较深入的研究或有较多实际项目应用经验者优先; 4、在计算机视觉领域发表过论文; 5、具有良好的沟通协作能力,工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责今日头条系产品中视频、图文、微头条、评论、账号等不同体裁的内容安全算法工作; 2、针对Multimodal、Long-context等内容特点,从Pre-Train、Post-Train(SFT、RL)等方面优化,增强模型的感知和推理能力;同时探索围绕大模型相关的应用技术能力,如Auto-Prompt Engineering、Embedding、Incontext Learning、RAG等; 3、研发基于大模型驱动的内容安全机审系统,优化内容安全业务流程和效率; 4、研发内容风险感知和应急系统,优化内容安全业务的保障和处置能力。 职位要求: 1、具有扎实的人工智能方面的基础知识,对CV、VLM、MLLM等技术有深入的理解,数学功底扎实,学习能力强; 2、有扎实的编码能力,熟悉深度学习训练框架、工程框架等; 3、在CV、VLM、MLLM领域有成熟的项目落地经验,在短视频、图文、直播算法领域有经验者优先; 4、在计算机科学高水平会议和期刊如NIPS、ICML、CVPR、ICCV、ECCV、IJCAI、AAAI、KDD、SIGIR、WWW、ACL、PAMI、IJCV等论文发表或有竞赛经验者优先; 5、具有独立的分析问题和解决问题的能力,对解决具有挑战性问题充满激情,对技术有热情,追求极致,自驱力强;有良好的团队合作意识、沟通表达能力。