• 50k-70k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、结合对直播场景的深入理解,进行直播多模态大模型的建设,面向主播开播的全流程,通过直播间内容理解、智能辅播、主播成长陪伴、智能复盘、智能创作等能力的建设和落地,打造面向直播全流程、自迭代的智能直播专家落地; 2、深入分析研发全生命周期的痛点问题,实现代码智能生成、技术方案智能设计、智能运维提效等全生命周期的提效助手,构建智能研发大模型; 3、密切跟进LLM领域最新研究成果,积极参与新业务的探索研究,结合对业务场景的充分理解,寻找最佳解决方案。 职位要求: 1、本科及以上学历,人工智能、计算机、模式识别等相关专业; 2、有NLP、CV、数据处理相关复杂系统的落地经验,具备较强的前沿创新能力; 3、具有优秀的编程基础,熟练使用Python/C++等至少一种编程语言,熟练使用TensorFlow/PyTorch等至少一种深度学习框架; 4、熟练掌握常见开源模型调优训练、推理加速框架,熟悉LLaMA、ChatGLM等开源大模型原理与实现; 5、优秀的分析和解决问题的能力,对解决具有挑战性的问题充满激情,良好的沟通和团队合作能力。 加分项: 1、具备业界大模型的训练、调优和交付经验,在多模态大模型、代码大模型上有实战经验者更优; 2、具备业界的大模型应用产品落地经验,在其中发挥关键的架构设计、模型优化作用; 3、具有长视频理解、图文交互等大模型应用落地经验,在其中发挥关键的架构设计、模型优化作用; 4、具有研发提效相关的大模型应用落地经验,在其中发挥关键的架构设计、模型优化作用。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:国际化内容安全平台团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,以人工智能技术支持业务发展,力求更高效、更敏捷、更全能地维护站内生态安全。 1、参与多模态大模型(LLM/VLM)的研发与优化,深入探索视频理解、跨模态语义对齐、风险检测与生成式内容安全等技术方向,推动前沿研究成果在实际业务中的应用; 2、协助完成大模型的预训练、指令微调(SFT)、对齐与主动学习(RLHF)等流程设计与实现,不断提升模型在国际化产品复杂多样视频安全数据集上的鲁棒性、泛化性和可解释性; 3、参与标注与评测体系的建设与优化,设计科学的数据标注策略与评价指标,支持高质量、规模化内容安全数据集的构建,推动模型效果在真实业务场景中的持续迭代和验证; 4、与团队成员及跨部门协作伙伴紧密合作,推动算法在实际审核、风控与事件响应环节中的落地,优化线上模型性能、时效与资源效率,确保平台在全球范围内的安全与合规性。 职位要求: 1、扎实的机器学习与深度学习基础,具备模型研发经验; 2、具备良好的机器学习与深度学习基础,熟悉Transformer架构和大模型基本原理; 3、具备强烈的技术热情,以大模型技术研究为原动力,同时具备快速学习能力与良好的团队协作精神,能够主动探索前沿技术并推动其在实际业务中的应用; 4、具备文本、图像、视频或多模态方向的研究或项目经验,有大模型相关实践经验者优先; 5、熟悉至少一种主流深度学习框架(PyTorch/TensorFlow),具备良好的编程能力; 6、在顶会/顶刊有相关论文或在相关比赛中取得优异成绩者优先。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责抖音直播实时互动相关的多模态内容理解工作,打造业界领先的多模态内容理解大模型; 2、基于CNN、VLM等技术推进模型训练、微调、评测及高效部署,推动模型在下游业务上的应用,包括并不限于多模态对话、多模态互动内容生成、Caption文本生成等,助力业务规模应用落地; 3、规划实现并优化海量多模态数据的预处理、清洗、标注、特征提取及高效融合方法。 职位要求: 1、本科及以上学历,计算机相关专业; 2、在计算机视觉/多模态某领域有深入的研究或项目经验,在**学术会议有论文发表者或获得竞赛优胜者优先; 3、熟悉多模态大模型(VLM)、大语言模型(LLM)、RL相关的算法技术,熟悉大模型相关的数据构造方法、Post Training算法,对多模态数据处理具备优秀的独立开发与调试能力; 4、有大规模模型训练、压缩、蒸馏、微调等经验,熟悉Megatron、Deepspeed等框架者优先; 5、对视觉CoT有研究经验者优先,对类GPT-4o实时对话的多模态流式计算有落地经验者优先; 6、优秀的分析和解决问题的能力,对解决具有挑战性的问题充满激情,良好的沟通和团队合作能力。
  • 30k-60k 经验1-3年 / 硕士
    社交媒体 / 上市公司 / 2000人以上
    1、参与图像、视频内容生成、理解、检索,自然语言理解等方向前沿技术研究 2、根据业务场景,给出相关算法层面解决方案并进行研发 3、完成相关模型搭建/调优/训练等相关工作,积极推动所负责能力的性能优化及工程化落地 4、持续关注相关领域最新进展,并进行前沿算法思想的落地验证 岗位要求: 1.计算机、数学等相关专业,硕士及以上学历,1-3年工作经验 2.数学基础扎实,能独立对现有算法进行定制优化提升 3.熟悉一般扩散模型、多模态模型,在图像生成、视频理解、多模态等方向有较为深入的研究,熟悉TensorFlow, Pytorch等框架 4.熟悉C/C++/python等语言,能熟练使用上述语言之一进行项目开发 5.了解数字图像处理一般方法,并有与深度学习相结合的实践经验; 加分项: 1.拥有扩散模型、多模态模型训练、调优经验者优先; 2.有AIGC方向项目商用落地经验者优先; 3.在国际期刊、会议上发表论文者优先
  • 30k-60k 经验不限 / 硕士
    社交媒体 / 上市公司 / 2000人以上
    职位描述: 1. 多模态大模型:探索跨模态的信息对齐方法,研究多模态大模型的预训练、指令微调、RLHF(拒绝学习与强化学习)等技术,评估和提高多模态数据质量,进行数据清洗 2. 内容理解:探索适合微博的实体识别、属性抽取、关系分类等技术,探索图文/视频多模态的内容分类、信息抽取、智能摘要等技术 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业的硕士生/博士生 2. 熟悉BLIP2、LLaVA、MiniGPT、VisualGLM、Qwen-VL等LMM模型结构及训练方法; 3. 熟练掌握tensorflow、pytorch等深度学习框架,扎实的编程基础
  • 30k-60k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责抖音系产品中视频、直播、图文等不同体裁下评论(文评、图评、音评等)、弹幕等互动内容的安全、体验、增长、创新工作; 2、面向互动内容中存在的对抗表达、隐晦表达、知识依赖等语义挑战,时序性、多模态、交互性等结构挑战,研发大模型驱动的机审系统,提升互动内容的安全、画风、生态的治理能力,有效降低互动内容的潜在风险; 3、分析和挖掘互动内容中蕴含的用户真实意图,探索基于大模型增强的统一内容理解技术,优化排序和分发策略以调控互动体验,提升平台口碑与用户粘性,支持在推荐、搜索、推送、广告、精选等场景中的应用; 4、探索技术驱动的创新互动内容产品形态,如智能总结、主播助理等,促进互动效率提升与用户增长; 5、基础技术方面持续探索LLM/MLLM等通用大模型在内容安全和理解领域的适配,从Pre-Train、Post-Train(SFT、RL)等方面优化,增强模型的感知和推理能力;同时探索围绕大模型相关的应用技术能力,如Auto-Prompt Engineering、Embedding、Incontext Learning、RAG等。 职位要求: 1、具有扎实的人工智能方面的基础知识,对CV、VLM、MLLM等技术有深入的理解,数学功底扎实,学习能力强; 2、有扎实的编码能力,熟悉主流的深度学习训练框架、工程框架等; 3、在CV、VLM、MLLM领域有成熟的项目落地经验,在短视频、图文、直播算法领域有经验者优先; 4、在计算机科学高水平会议和期刊如NIPS、ICML、CVPR、ICCV、ECCV、IJCAI、AAAI、KDD、SIGIR、WWW、ACL、PAMI、IJCV等论文发表或有竞赛经验者优先; 5、具有独立的分析问题和解决问题的能力,对解决具有挑战性问题充满激情;对技术有热情,追求极致,自驱力强;6、有良好的团队合作意识、沟通表达能力。
  • 7k-10k 经验在校/应届 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:直播团队负责为抖音集团提供直播服务。团队负责直播平台技术和直播业务研发,打造灵活稳定的直播服务平台,为用户提优质直播体验,支持电商、本地生活、游戏、节目、多人互动等不同类型的业务场景。直播业务发展迅猛,处于行业头部地位,业务发展空间巨大。现在加入我们,和优秀的人一起做有挑战的事,你的技术与创意将影响亿级用户,激发创意和丰富生活。 1、参与抖音直播助手项目建设,面向主播开播的全流程,打造全方位、自迭代的智能直播专家,探索直播领域垂类大模型的建设工作; 2、参与研发提效助手项目建设,打造面向软件研发全生命周期的提效助手,完成研发知识资产的建设和模型内化; 3、参与新业务的探索研究,结合对业务场景的充分理解,寻找最佳解决方案。 职位要求: 1、本科及以上学历在读,人工智能、计算机、模式识别等相关专业优先; 2、有NLP、CV、数据处理等相关优质论文发表、比赛获奖或项目经验; 3、具有优秀的编程基础,熟练使用Python/C++等至少一种编程语言,熟练使用TensorFlow/PyTorch等至少一种深度学习框架; 4、熟悉Attention、Transformer、BERT、GPT等常用模型结构,熟悉LLaMA、ChatGLM等开源大模型原理与实现,有开源模型调优训练经验者优先; 5、优秀的分析和解决问题的能力,对解决具有挑战性的问题充满激情,良好的沟通和团队合作能力。
  • 30k-60k 经验不限 / 本科
    社交媒体 / 上市公司 / 2000人以上
    工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
  • 30k-60k 经验1-3年 / 本科
    社交媒体 / 上市公司 / 2000人以上
    工作职责: 1. 多模态大模型:探索跨模态的信息对齐方法,探索多模态大模型的继续预训练、指令微调等技术,探索多模态的数据质量评估和清洗方法。 2. 多模态大模型应用:解决多模态大模型工程化过程中的难题,推动多模态大模型在微博场景落地。 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业,本科及以上学历,研究生优先。 2. 在计算机视觉或多模态理解与生成方面有扎实的知识基础,熟悉主流的多模态大模型或图片、视频生成模型,如LLaVA、Qwen-VL、SD、FLUX、OpenSora等。 3. 在多模态理解或多模态生成等应用方向具备1年左右,或在计算机视觉领域具备2年以上相关工作经验,两者满足其一即可。 4.熟悉Pytorch、Transformers 等常用工具的使用,具备扎实的编程基础。 5. 赛事获奖或开源项目贡献者优先。
  • 30k-60k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责今日头条系产品中视频、图文、微头条、评论、账号等不同体裁的内容安全算法工作; 2、针对Multimodal、Long-context等内容特点,从Pre-Train、Post-Train(SFT、RL)等方面优化,增强模型的感知和推理能力;同时探索围绕大模型相关的应用技术能力,如Auto-Prompt Engineering、Embedding、Incontext Learning、RAG等; 3、研发基于大模型驱动的内容安全机审系统,优化内容安全业务流程和效率; 4、研发内容风险感知和应急系统,优化内容安全业务的保障和处置能力。 职位要求: 1、具有扎实的人工智能方面的基础知识,对CV、VLM、MLLM等技术有深入的理解,数学功底扎实,学习能力强; 2、有扎实的编码能力,熟悉深度学习训练框架、工程框架等; 3、在CV、VLM、MLLM领域有成熟的项目落地经验,在短视频、图文、直播算法领域有经验者优先; 4、在计算机科学高水平会议和期刊如NIPS、ICML、CVPR、ICCV、ECCV、IJCAI、AAAI、KDD、SIGIR、WWW、ACL、PAMI、IJCV等论文发表或有竞赛经验者优先; 5、具有独立的分析问题和解决问题的能力,对解决具有挑战性问题充满激情,对技术有热情,追求极致,自驱力强;有良好的团队合作意识、沟通表达能力。
  • 30k-50k 经验3-5年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 产品介绍:产品覆盖今日头条、头条极速版等各类产品,为上亿用户持续提供优质的资讯、视频等服务。我们通过建立良好的内容生态,鼓励优质的原创内容,为创作者提供优质的服务和创作体验,促进创作和交流,同时我们致力于通过尽可能丰富的内容体裁和尽可能多的分发方式,连接人与信息,丰富大家的精神生活,让人们看到更大的世界。 团队介绍:团队主要负责今日头条、今日头条极速版等多款APP的整体增长工作,为头条去重DAU增长负责。围绕头条资讯认知基础上,深耕传统的增长黑客手段,积极探索新形态下的各种增长方式,从全局增长到细分人群增长、从厂商渠道到字节系内多端联动、从增长到产品及内容。团队具体负责搜索、双列短图文、新体裁等时下最前沿的创新方向,希望兼具用户视角、策略分析能力的你,加入我们,一起收获一份从1到n的成功经验。 1、负责头条搜索全网资源的生态建设,保证头条搜索的内容资源数量和质量; 2、理解用户需求,协同内外部内容及生产力资源,建立行业领先的产品及内容形态,并针对全网需求制定合理的策略和样式,保证用户内容消费体验; 3、对内容做结构化挖掘和利用,充分发挥其价值,深度满足用户的内容消费体验; 4、对泛娱乐内容(影视、小说、音频、故事等)有独到的见解,能够持续找到内容爆点,并结合各种流量手段,带来搜索的规模增长。 职位要求: 1、本科以上学历,关注搜索产品动态与发展,对搜索用户需求有深刻理解; 2、有流量增长、拉新拉活策划经验优先考虑; 3、3年以上搜索或者内容策略产品/运营经验。
  • 移动互联网 / 上市公司 / 2000人以上
    岗位职责 1.我们正在构建原生支持视觉、音频与文本的大规模多模态模型体系,以推动人工智能系统实现对物理世界的全面感知与理解。你将加入语音与音频方向的核心研究团队,围绕以下关键研究任务开展工作:; 2.研发具备通用能力的端到端语音大模型,包括多语言语音识别、语音翻译、语音合成,副语言信息理解,音频理解 等; 3.推进 语音表征学习 与 语音编码/解码 架构研究,构建适用于多任务、多模态的统一声学表征; 4.探索音频和语音在多模态大模型中的表征对齐与融合机制,与图像、文本联合建模; 5.构建并维护高质量的语音多模态数据集、自动标注与数据合成技术。 岗位要求 1.计算机、电子工程、人工智能、语言学或相关领域博士,或硕士加多年相关工作经验; 2.深入理解语音音频信号处理、声学建模、语言模型和大模型架构; 3.熟练掌握 语音识别,语音合成,语音翻译等 一项多多项系统开发流程,具有多语言、多任务或端到端系统经验者优先; 4.对以下方向具备深入研究或实践经验者优先:; 5.语音表征预训练(如 HuBERT, Wav2Vec, Whisper 等); 6.多模态对齐与跨模态建模(音视频和文本); 7.有推动大模型在音频理解任务上达到 SOTA 性能的经验优先; 8.熟练掌握 PyTorch、TensorFlow等深度学习框架,有大规模训练与分布式系统经验者优先; 9.熟练 Transformer 类模型及其在语音、多模态领域的训练和推理。
  • 10k-20k 经验不限 / 大专
    企业服务 / 上市公司 / 2000人以上
    工作地点包括:朝阳合生汇、东方广场、蓝色港湾、龙湖长楹天街、颐堤港、后沙峪、西三旗万象汇、中关村、中粮祥云、华熙LIVE五棵松、首钢园、西红门荟聚、亦庄 主要工作职责 -价值观建立:在日常工作中,践行蔚来价值观,并向团队成员有效传导; -团队工作计划:根据销售策略和团队目标,制定团队工作计划和目标分配,以确保完成销售、服务和交付等目标; -销售达成:执行并确保团队完成h和接待任务,将潜在用户转化为真正用户,完成销售并向客户交付车辆; -用户关系管理:维护现有蔚来车主,定期跟进追踪会员,提供有关愉悦生活方式解决方案,增强现有车主品牌粘性; -市场/用户开拓:开拓潜在客户,与市场同事合作,开展店外营销活动;不断创新、积极主动地吸引潜在用户; -团队管理:监督、辅导团队成员(NIO specialist 和交付专员)的日常工作开展;开展绩效管理,提升并发展员工能力; -开店支持:支持公司新店的开设,确保公司文化和价值观在新团队的传承; -内训支持:承担内部培训师的角色。 任职要求 Qualifications -有一定的零售、行业销售、大客户销售经验(中高端汽车/奢侈品行业优先),能够出色达成销售目标; -优秀的商业拓展能力和商务谈判能力; -对销售数据敏感,优秀的数据分析能力和逻辑分析能力; -认可蔚来汽车的创业公司文化,具备创业公司需要的心理素质; -抗压能力强,能够适应在高速发展的环境中开展销售管理工作,达到公司业绩指标要求; 良好的自我管理能力及自我学习能力。
  • 3k-6k 经验在校/应届 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、支持抖音等国内产品内容算法在VLM相关的基础算法开发和基座模型建设,提升模型的评测分数和下游落地应用效果,支持从训练到在线推理的相关算法能力迭代; 2、从事VLM数据工程、模型结构、训练方法等方向的前沿技术探索和研发,发表学术论文和申请专利; 3、支持包括推荐算法、社区治理、安全审核、对话算法等其他算法团队对VLM基座以及基础多模态技术的需求。 职位要求: 1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先; 2、具有扎实的机器学习基础,在校学习推荐系统、计算机视觉、语音识别、自然语言、大模型相关专业,数理功底扎实,自学能力强; 3、熟悉常用的机器学习训练推理框架,熟练使用Python编程; 4、有LLM/VLM等相关科研和应用经验者,熟悉推荐算法、语音算法、OCR、多模态等内容理解算法优先; 5、在计算机科学高水平会议和期刊如NIPS、ICML、CVPR、ICCV、ECCV、IJCAI、AAAI、KDD、SIGIR、WWW、ACL、PAMI、IJCV等发表过论文或有竞赛经验者优先; 6、每周可实习4天以上,实习时间3个月以上。
  • 30k-50k·15薪 经验5-10年 / 硕士
    工作职责: 1.负责自动驾驶多传感器(摄像头、激光雷达、毫米波雷达)感知融合算法研发,搞定目标检测、跟踪、分割等任务,确保“看得清、认的准”,不允许“传感器各自为政”; 2.优化感知算法在复杂场景下的鲁棒性,比如暴雨、大雾、强光逆光等恶劣天气,以及隧道出入口、地下车库等弱光环境,杜绝“感知失效”; 3.参与感知模型的轻量化与车端部署,在保证精度的前提下降低计算资源占用,让算法在嵌入式平台(如Orin、地平线J6)上“跑得快、不卡顿”; 4.跟进感知数据闭环,与数据团队协作挖掘badcase,比如“远处小目标漏检”、“遮挡目标误判”、“障碍物抖动”,推动模型迭代优化。 任职要求: 1.计算机视觉、机器学习、人工智能等相关专业硕士及以上学历,2年以上自动驾驶感知算法经验,仅参与过单模态的”玩家”,请参看2; 2.精通CNN、Transformer等深度学习架构,熟悉3D目标检测(如PointPillars、VoxelNet)、BEV感知(如BEVFusion, Sparse系列)、Occupancy感知等算法,能对着论文复现核心模块; 3.熟练掌握Python/C++,能玩转PyTorch/TensorFlow,熟悉PCL、OpenCV、Eigen等库,会用卡尔曼滤波、粒子滤波等做传感器融合,代码调试能力强; 4.加分项1:了解传感器标定、时空同步技术,能解决“摄像头与激光雷达数据不同步”“标定参数漂移”等问题,对感知精度有“强迫症级”要求; 5.加分项2:能清晰解释“激光雷达点云稀疏区域的目标检测难点”,并提出优化方案; 6.加分项3:有感知算法量产部署经验,熟悉TensorRT、ONNX Runtime等推理框架,能搞定模型量化、剪枝; 7.加分项4:在CVPR、ICCV、ECCV等顶会发表过感知相关论文,或有Kaggle、Waymo等竞赛获奖经历。