• 15k-25k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、主导制定自研芯片产品从芯片制造、封装到测试的全流程生产策略,安排各环节的时间节点和资源分配,依据需求制定生产计划,推动产能情况,确保生产交付LT最优; 2、合理规划及下发生产工单、管理OSAT产能产效及投料安排,深入监督生产环节,实时跟踪各环节的生产进度,协调解决生产过程中的机台改机、程式建立、设备故障、工艺难题、物料短缺等复杂问题,确保生产效率; 3、与研发团队紧密协作,参与新产品导入(NPI)过程,提供生产可行性分析和改进建议,推动新产品快速、高效地完成交付; 4、参与自研芯片及上游基板、封测厂商的供应商准入评审和绩效考核,进行厂商的设计和制造能力评估; 5、收集识别有效需求,管理FAB及OSAT的FCST释放,管理基板及辅料的备料情况,避免物料短缺及呆滞; 6、了解FAB及OSAT的工艺及生产制造节点,对基板、先进封装及测试机台有一定的了解;对生产交付链路的各类信息系统(如ERP、SAP等)有深刻理解,主导系统的实施和优化,实现生产运营数据的实时监控与分析,为决策提供数据支持。 职位要求: 1、多年芯片行业生产交付管理工作经验,精通芯片从晶圆到封测的全流程工艺和技术,熟悉相关行业标准和规范; 2、具备丰富的供应商管理和供应链优化经验,有成功主导供应商谈判和合作项目的案例; 3、熟练掌握生产运营管理系统,有系统实施或优化的实战经验,具备较强的数据分析和处理能力; 4、对生产交付链路的各类信息系统(如ERP、SAP等)有深刻理解,主导系统的实施和优化,实现生产运营数据的实时监控与分析,为决策提供数据支持; 5、有半导体行业OSAT\FAB\芯片设计公司的生产交付或生产采购工作背景。
  • 15k-25k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、主导制定自研芯片产品从芯片制造、封装到测试的全流程生产策略,安排各环节的时间节点和资源分配,依据需求制定生产计划,推动产能情况,确保生产交付LT最优; 2、合理规划及下发生产工单、管理OSAT产能产效及投料安排,深入监督生产环节,实时跟踪各环节的生产进度,协调解决生产过程中的机台改机、程式建立、设备故障、工艺难题、物料短缺等复杂问题,确保生产效率; 3、与研发团队紧密协作,参与新产品导入(NPI)过程,提供生产可行性分析和改进建议,推动新产品快速、高效地完成交付; 4、参与自研芯片及上游基板、封测厂商的供应商准入评审和绩效考核,进行厂商的设计和制造能力评估; 5、收集识别有效需求,管理FAB及OSAT的FCST释放,管理基板及辅料的备料情况,避免物料短缺及呆滞; 6、了解FAB及OSAT的工艺及生产制造节点,对基板、先进封装及测试机台有一定的了解;对生产交付链路的各类信息系统(如ERP、SAP等)有深刻理解,主导系统的实施和优化,实现生产运营数据的实时监控与分析,为决策提供数据支持。 职位要求: 1、多年芯片行业生产交付管理工作经验,精通芯片从晶圆到封测的全流程工艺和技术,熟悉相关行业标准和规范; 2、具备丰富的供应商管理和供应链优化经验,有成功主导供应商谈判和合作项目的案例; 3、熟练掌握生产运营管理系统,有系统实施或优化的实战经验,具备较强的数据分析和处理能力; 4、对生产交付链路的各类信息系统(如ERP、SAP等)有深刻理解,主导系统的实施和优化,实现生产运营数据的实时监控与分析,为决策提供数据支持; 5、有半导体行业OSAT\FAB\芯片设计公司的生产交付或生产采购工作背景。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:抖音内容理解团队负责抖音集团内容算法工作,业务覆盖抖音、今日头条、西瓜视频、剪映等业务,承接业务在内容理解、LLM应用、新业务方向探索等方向的工作。技术上涵盖了CV,NLP,音频,LLM等算法方向。团队承载业务需求同时还负责底层基础算法技术,推动如基础预训练模型、视频生成等学术和专利相关工作,负责为抖音各个技术方向提供长期有深度的技术支撑。得益于抖音集团业务数量庞大的多模态业务数据和业务需求,团队能够有资源和机会去做出行业领先的技术创新,用最新的技术去改变影响用户和改变行业格局。 1、课题背景:随着大模型技术在多模态内容理解领域的突破,内容特征已逐渐替代传统ID特征成为推荐系统的核心驱动力。然而当前系统面临三重挑战:(1)内容深度解析需求:短视频、直播、评论等场景需要同时处理文本、图像、音频等多模态数据,且需建模用户长短期兴趣与跨领域行为;(2)动态安全威胁:评论区涌现多模态越狱攻击(如隐晦图文组合提示词),传统单模态审核无法应对复杂对抗场景;(3)跨域迁移瓶颈:用户娱乐内容兴趣与电商消费需求间存在语义鸿沟,需建立可解释的跨域映射机制。 2、课题挑战:(1)多模态复杂性:用户行为涉及多模态交互(如视频+评论+购物),需统一框架实现内容理解与用户意图推理;(2)社区生态动态性:自然作者、各种机构、黑灰产等群体会互相交互产生大量复杂的多模态行为,要求算法能够快速准确的理解内容和交互的语义;(3)生态协同需求:DAU-GMV转化率存在成倍提升空间,需突破"娱乐到消费"的跨域兴趣建模技术;(4)技术整合价值:联合优化推荐、安全、跨域三大模块,可降低算力消耗并提升端到端效果。 3、研究方向:大语言模型、多模态大模型、内容理解、推荐系统。 职位要求: 1、2026届及之后毕业,博士在读,人工智能、计算机、数学相关专业者优先; 2、具备扎实的编码能力、数据结构和基础算法功底,熟练运用各种算法框架与工程框架; 3、在国际会议或期刊发表论文者(包括但不限于 ACL、EMNLP、NeurIPS、ICML、ICLR、CVPR 等)优先; 4、拥有扎实的机器学习基础,在深度学习、强化学习、NLP 、多模态方向有深入的理解与研究经历; 5、具备良好的沟通协作能力,能够与团队共同探索新技术,推动技术发展。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:抖音内容理解团队负责抖音集团内容算法工作,业务覆盖抖音、今日头条、西瓜视频、剪映等业务,承接业务在内容理解、LLM应用、新业务方向探索等方向的工作。技术上涵盖了CV,NLP,音频,LLM等算法方向。团队承载业务需求同时还负责底层基础算法技术,推动如基础预训练模型、视频生成等学术和专利相关工作,负责为抖音各个技术方向提供长期有深度的技术支撑。得益于抖音集团业务数量庞大的多模态业务数据和业务需求,团队能够有资源和机会去做出行业领先的技术创新,用最新的技术去改变影响用户和改变行业格局。 1、课题背景:随着大模型技术在多模态内容理解领域的突破,内容特征已逐渐替代传统ID特征成为推荐系统的核心驱动力。然而当前系统面临三重挑战:(1)内容深度解析需求:短视频、直播、评论等场景需要同时处理文本、图像、音频等多模态数据,且需建模用户长短期兴趣与跨领域行为;(2)动态安全威胁:评论区涌现多模态越狱攻击(如隐晦图文组合提示词),传统单模态审核无法应对复杂对抗场景;(3)跨域迁移瓶颈:用户娱乐内容兴趣与电商消费需求间存在语义鸿沟,需建立可解释的跨域映射机制。 2、课题挑战:(1)多模态复杂性:用户行为涉及多模态交互(如视频+评论+购物),需统一框架实现内容理解与用户意图推理;(2)社区生态动态性:自然作者、各种机构、黑灰产等群体会互相交互产生大量复杂的多模态行为,要求算法能够快速准确的理解内容和交互的语义;(3)生态协同需求:DAU-GMV转化率存在成倍提升空间,需突破"娱乐到消费"的跨域兴趣建模技术;(4)技术整合价值:联合优化推荐、安全、跨域三大模块,可降低算力消耗并提升端到端效果。 3、研究方向:大语言模型、多模态大模型、内容理解、推荐系统。 职位要求: 1、2026届及之后毕业,博士在读,人工智能、计算机、数学相关专业者优先; 2、具备扎实的编码能力、数据结构和基础算法功底,熟练运用各种算法框架与工程框架; 3、在国际会议或期刊发表论文者(包括但不限于 ACL、EMNLP、NeurIPS、ICML、ICLR、CVPR 等)优先; 4、拥有扎实的机器学习基础,在深度学习、强化学习、NLP 、多模态方向有深入的理解与研究经历; 5、具备良好的沟通协作能力,能够与团队共同探索新技术,推动技术发展。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 课题背景: 图形渲染技术是游戏、影视、AR/VR等多媒体应用的重要基础设施与核心技术。随着短视频、直播、元宇宙等场景的爆发式增长,以及AI生成能力对传统图形管线的冲击,用户对实时场景下,内容更泛化,制作流程的效率提升,高画质渲染呈现的需求也急剧上升。当下的移动端算力又难以满足高画质、个性化、低门槛的UGC创作诉求。随着AI技术更进一步的发展,正逐步推动着图形渲染从"确定性算法驱动"向"概率化智能生成"的迁移,为渲染技术带来了新的可能性。 课题挑战: 1、提升渲染上限:传统实时图形渲染框架诞生了近三十年,传统实时渲染框架下的各种技术&工具链已经发展得非常成熟。但随着用户对高质量、高画质的效果内容的需求越来越高,图形渲染的场景、光影复杂度也越来越高,传统的图形光栅化渲染管线越来越难以满足用户对画质效果的需求,在算力更为不足的移动端表现地尤为明显。如何应用AI技术提升渲染性能,是一个充满挑战的课题。 2、减低制作门槛:在用户互动场景中,素材、场景建模的制作成本也变得越来越高昂。用户希望低门槛生成个性化内容,但传统图形渲染技术依赖专业人士建模,门槛极高。如何应用AI技术制作低门槛、个性化资产,同样是一个充满挑战的课题。 3、工作范式革新:在短视频拍摄场景中,传统图形引擎是通过视觉算法、图形渲染算法的结合完成图像视频增强。伴随着人工智能的热潮,AI技术在视频生成领域也有了许多突破性进展。以 Sora、Luma、DreamMachine 为代表的生成式视频模型,正在重构视觉内容生产范式,存在对现有视频处理链路革新的可能性,但也面临许多挑战,如视频一致性、物理仿真正确性、运算复杂度高等等。 职位要求: 1、2026届及之后毕业,博士在读,图形学、人工智能算法、计算机、数学相关专业优先; 2、优秀的代码能力、数据结构和基础算法功底,熟练C/C++,熟悉实时图形渲染技术; 3、深入理解神经渲染技术(如NeRF、3DGS)或AIGC-3D技术,具备相关项目科研&落地经验,在SIGGRAPH/SIGGRAPH ASIA/TOG等**期刊会议上发表论文者优先; 4、主动性和自驱力强,愿意接受挑战; 5、优秀的分析问题和解决问题能力,对技术有热情,有良好的沟通表达能力和团队合作精神。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 课题背景: 图形渲染技术是游戏、影视、AR/VR等多媒体应用的重要基础设施与核心技术。随着短视频、直播、元宇宙等场景的爆发式增长,以及AI生成能力对传统图形管线的冲击,用户对实时场景下,内容更泛化,制作流程的效率提升,高画质渲染呈现的需求也急剧上升。当下的移动端算力又难以满足高画质、个性化、低门槛的UGC创作诉求。随着AI技术更进一步的发展,正逐步推动着图形渲染从"确定性算法驱动"向"概率化智能生成"的迁移,为渲染技术带来了新的可能性。 课题挑战: 1、提升渲染上限:传统实时图形渲染框架诞生了近三十年,传统实时渲染框架下的各种技术&工具链已经发展得非常成熟。但随着用户对高质量、高画质的效果内容的需求越来越高,图形渲染的场景、光影复杂度也越来越高,传统的图形光栅化渲染管线越来越难以满足用户对画质效果的需求,在算力更为不足的移动端表现地尤为明显。如何应用AI技术提升渲染性能,是一个充满挑战的课题。 2、减低制作门槛:在用户互动场景中,素材、场景建模的制作成本也变得越来越高昂。用户希望低门槛生成个性化内容,但传统图形渲染技术依赖专业人士建模,门槛极高。如何应用AI技术制作低门槛、个性化资产,同样是一个充满挑战的课题。 3、工作范式革新:在短视频拍摄场景中,传统图形引擎是通过视觉算法、图形渲染算法的结合完成图像视频增强。伴随着人工智能的热潮,AI技术在视频生成领域也有了许多突破性进展。以 Sora、Luma、DreamMachine 为代表的生成式视频模型,正在重构视觉内容生产范式,存在对现有视频处理链路革新的可能性,但也面临许多挑战,如视频一致性、物理仿真正确性、运算复杂度高等等。 职位要求: 1、2026届及之后毕业,博士在读,图形学、人工智能算法、计算机、数学相关专业优先; 2、优秀的代码能力、数据结构和基础算法功底,熟练C/C++,熟悉实时图形渲染技术; 3、深入理解神经渲染技术(如NeRF、3DGS)或AIGC-3D技术,具备相关项目科研&落地经验,在SIGGRAPH/SIGGRAPH ASIA/TOG等**期刊会议上发表论文者优先; 4、主动性和自驱力强,愿意接受挑战; 5、优秀的分析问题和解决问题能力,对技术有热情,有良好的沟通表达能力和团队合作精神。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 课题介绍:大规模推荐系统正在越来越多的应用到短视频、文本社区、图像等产品上,模态信息在推荐系统中的作用也越来越大。 字节实践中发现模态信息能够很好的作为泛化特征支持推荐等业务场景,端到端的超大规模多模态推荐系统的研究具有非常大的想象空间。 期望在算法和工程CoDesign基础上,对多模态Cotrain、7B/13B大规模参数模型、更长序列端到端等方向进一步进行探索。 工程上研究方向包括多模态样本的表征、基于 pytorch 框架的高性能多模态推理引擎、高性能多模态训练框架的构建、异构硬件在多模态推荐系统上的应用;算法上的研究方向包括设计合理的推荐广告和多模态Cotrain结构、Sparse MOE、Memory Network、混合精度等。 1、负责机器学习系统架构的设计开发,以及系统性能调优; 2、负责解决系统高并发、高可靠性、高可扩展性等技术难关; 3、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、任务编排、模型训练、模型推理、模型管理、数据集管理、工作流编排、ML for System等; 4、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、GPU优化技术的引入落地; 5、研究基于机器学习方法,实现对集群/服务资源使用情况的分析和优化。 职位要求: 1、2026届及之后毕业,博士在读,计算机、软件工程等相关专业优先; 2、熟练掌握Linux环境下的C/C++/Go/Python/Java等1至2种以上语言; 3、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护; 4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分,良好的团队合作精神; 5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力; 6、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。 加分项: 1、熟悉Kubernetes架构,有丰富的云原生系统开发经验; 2、熟悉至少一种主流的机器学习框架(TensorFlow/PyTorch/MXNet); 3、熟悉Django、Flask等相关技术,有其后端开发经验; 4、有以下某一方向领域的经验:AI Infrastructure,HW/SW Co-Design,High Performance Computing,ML Hardware Architecture(GPU,Accelerators,Networking),Machine Learning Frameworks,ML for System,Distributed Storage; 5、有大规模云计算平台或私有云产品架构开发经验。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 课题介绍:大规模推荐系统正在越来越多的应用到短视频、文本社区、图像等产品上,模态信息在推荐系统中的作用也越来越大。 字节实践中发现模态信息能够很好的作为泛化特征支持推荐等业务场景,端到端的超大规模多模态推荐系统的研究具有非常大的想象空间。 期望在算法和工程CoDesign基础上,对多模态Cotrain、7B/13B大规模参数模型、更长序列端到端等方向进一步进行探索。 工程上研究方向包括多模态样本的表征、基于 pytorch 框架的高性能多模态推理引擎、高性能多模态训练框架的构建、异构硬件在多模态推荐系统上的应用;算法上的研究方向包括设计合理的推荐广告和多模态Cotrain结构、Sparse MOE、Memory Network、混合精度等。 1、负责机器学习系统架构的设计开发,以及系统性能调优; 2、负责解决系统高并发、高可靠性、高可扩展性等技术难关; 3、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、任务编排、模型训练、模型推理、模型管理、数据集管理、工作流编排、ML for System等; 4、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、GPU优化技术的引入落地; 5、研究基于机器学习方法,实现对集群/服务资源使用情况的分析和优化。 职位要求: 1、2026届及之后毕业,博士在读,计算机、软件工程等相关专业优先; 2、熟练掌握Linux环境下的C/C++/Go/Python/Java等1至2种以上语言; 3、掌握分布式系统原理,参与过大规模分布式系统的设计、开发和维护; 4、有优秀的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分,良好的团队合作精神; 5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力; 6、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。 加分项: 1、熟悉Kubernetes架构,有丰富的云原生系统开发经验; 2、熟悉至少一种主流的机器学习框架(TensorFlow/PyTorch/MXNet); 3、熟悉Django、Flask等相关技术,有其后端开发经验; 4、有以下某一方向领域的经验:AI Infrastructure,HW/SW Co-Design,High Performance Computing,ML Hardware Architecture(GPU,Accelerators,Networking),Machine Learning Frameworks,ML for System,Distributed Storage; 5、有大规模云计算平台或私有云产品架构开发经验。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:风控研发团队致力于解决各个产品(包括抖音、头条等)面临的各种黑灰产对抗问题,涵盖内容、交易、流量、账号等多个方面的风险治理领域。利用机器学习、多模态、大模型等技术对用户行为、内容进行理解从而识别潜在的风险和问题。不断深入理解业务和用户行为,进行模型和算法创新,打造业界领先的风控算法体系。 课题介绍: 1、课题目标:以风控数据为基础,优化提高大模型对于结构化数据(序列数据、图数据)的理解推理能力。 2、课题背景:风控场景下的数据主要为结构化数据,而目前大模型对于文本和图像的理解能力有了很大的提升,如何跟风控场景的非文本、图像数据(结构化数据)结合起来,让大模型能够更好的理解结构化的数据,是一个业界难题。面临着三大挑战 :(1)如何有效地将结构化的信息与nlp语义空间进行对齐,使得模型能够同时理解数据结构和语义信息;(2)如何用适当的指令使得大模型理解结构化数据中的结构信息;(3)如何赋予大语言模型图学习下游任务的逐步推理能力,从而逐步推断出更复杂的关系和属性。 3、课题内容:目前业界对结构化数据探索有:1、图数据理解相关GraphGPT:让大模型读懂图数据(SIGIR'2024) ;2、图数据RAG相关GraphRAG:Unlocking LLM discovery on narrative private data;3、序列数据理解相关StructGPT:面向结构化数据的大模型推理框架(EMNLP-2023)。目前的主要工作都是单一结构数据的理解,在风控场景下还面临几个问题:(1)对各种不同种类的的结构化数据融合理解怎么做,特别是融合图和序列数据的数据理解;(2)针对课题必要性中的问题;(3)对于下游任务的推理能力,目前的研究比较少,针对序列数据的推理能力研究非常少。 4、研究方向:大模型结构化数据理解、大模型结构化数据RAG、大模型思维链。 职位要求: 1、2026届及之后毕业,博士在读,计算机、网络安全、人工智能相关专业优先; 2、优秀的代码能力、扎实的数据结构和算法基础,熟练使用Python,熟悉Pytorch和TF者优先; 3、出色的问题定义、分析和解决能力,发表过CCF-A类论文,在AAAI、NeurIPS、SIGKDD、SIGIR等**期刊会议上发表论文者优先; 4、较强的抗压和沟通协作能力,对技术有追求,愿意和团队一起迎接挑战,追求创新。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:风控研发团队致力于解决各个产品(包括抖音、头条等)面临的各种黑灰产对抗问题,涵盖内容、交易、流量、账号等多个方面的风险治理领域。利用机器学习、多模态、大模型等技术对用户行为、内容进行理解从而识别潜在的风险和问题。不断深入理解业务和用户行为,进行模型和算法创新,打造业界领先的风控算法体系。 课题介绍: 1、课题目标:以风控数据为基础,优化提高大模型对于结构化数据(序列数据、图数据)的理解推理能力。 2、课题背景:风控场景下的数据主要为结构化数据,而目前大模型对于文本和图像的理解能力有了很大的提升,如何跟风控场景的非文本、图像数据(结构化数据)结合起来,让大模型能够更好的理解结构化的数据,是一个业界难题。面临着三大挑战 :(1)如何有效地将结构化的信息与nlp语义空间进行对齐,使得模型能够同时理解数据结构和语义信息;(2)如何用适当的指令使得大模型理解结构化数据中的结构信息;(3)如何赋予大语言模型图学习下游任务的逐步推理能力,从而逐步推断出更复杂的关系和属性。 3、课题内容:目前业界对结构化数据探索有:(1)图数据理解相关GraphGPT:让大模型读懂图数据(SIGIR'2024) ;(2)图数据RAG相关GraphRAG:Unlocking LLM discovery on narrative private data;(3)序列数据理解相关StructGPT:面向结构化数据的大模型推理框架(EMNLP-2023)。目前的主要工作都是单一结构数据的理解,在风控场景下还面临几个问题:(1)对各种不同种类的的结构化数据融合理解怎么做,特别是融合图和序列数据的数据理解;(2)针对课题必要性中的问题;(3)对于下游任务的推理能力,目前的研究比较少,针对序列数据的推理能力研究非常少。 4、研究方向:大模型结构化数据理解、大模型结构化数据RAG、大模型思维链。 职位要求: 1、2026届及之后毕业,博士在读,计算机、网络安全、人工智能相关专业优先; 2、优秀的代码能力、扎实的数据结构和算法基础,熟练使用Python,熟悉Pytorch和TF者优先; 3、出色的问题定义、分析和解决能力,发表过CCF-A类论文,在AAAI、NeurIPS、SIGKDD、SIGIR等**期刊会议上发表论文者优先; 4、较强的抗压和沟通协作能力,对技术有追求,愿意和团队一起迎接挑战,追求创新。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:风控研发团队致力于解决各个产品(包括抖音、头条等)面临的各种黑灰产对抗问题,涵盖内容、交易、流量、账号等多个方面的风险治理领域。利用机器学习、多模态、大模型等技术对用户行为、内容进行理解从而识别潜在的风险和问题。不断深入理解业务和用户行为,进行模型和算法创新,打造业界领先的风控算法体系。 课题介绍: 1、课题目标:以风控数据为基础,优化提高大模型对于结构化数据(序列数据、图数据)的理解推理能力。 2、课题背景:风控场景下的数据主要为结构化数据,而目前大模型对于文本和图像的理解能力有了很大的提升,如何跟风控场景的非文本、图像数据(结构化数据)结合起来,让大模型能够更好的理解结构化的数据,是一个业界难题。面临着三大挑战 :(1)如何有效地将结构化的信息与nlp语义空间进行对齐,使得模型能够同时理解数据结构和语义信息;(2)如何用适当的指令使得大模型理解结构化数据中的结构信息;(3)如何赋予大语言模型图学习下游任务的逐步推理能力,从而逐步推断出更复杂的关系和属性。 3、课题内容:目前业界对结构化数据探索有:(1)图数据理解相关GraphGPT:让大模型读懂图数据(SIGIR'2024) ;(2)图数据RAG相关GraphRAG:Unlocking LLM discovery on narrative private data;(3)序列数据理解相关StructGPT:面向结构化数据的大模型推理框架(EMNLP-2023)。目前的主要工作都是单一结构数据的理解,在风控场景下还面临几个问题:(1)对各种不同种类的的结构化数据融合理解怎么做,特别是融合图和序列数据的数据理解。(2)针对课题必要性中的问题;(3)对于下游任务的推理能力,目前的研究比较少,针对序列数据的推理能力研究非常少。 4、研究方向:大模型结构化数据理解、大模型结构化数据RAG、大模型思维链。 职位要求: 1、2026届及之后毕业,博士在读,计算机、网络安全、人工智能相关专业优先; 2、优秀的代码能力、扎实的数据结构和算法基础,熟练使用Python,熟悉Pytorch和TF者优先; 3、出色的问题定义、分析和解决能力,发表过CCF-A类论文,在AAAI、NeurIPS、SIGKDD、SIGIR等**期刊会议上发表论文者优先; 4、较强的抗压和沟通协作能力,对技术有追求,愿意和团队一起迎接挑战,追求创新。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:风控研发团队致力于解决各个产品(包括抖音、头条等)面临的各种黑灰产对抗问题,涵盖内容、交易、流量、账号等多个方面的风险治理领域。利用机器学习、多模态、大模型等技术对用户行为、内容进行理解从而识别潜在的风险和问题。不断深入理解业务和用户行为,进行模型和算法创新,打造业界领先的风控算法体系。 课题介绍: 1、课题目标:以风控数据为基础,优化提高大模型对于结构化数据(序列数据、图数据)的理解推理能力。 2、课题背景:风控场景下的数据主要为结构化数据,而目前大模型对于文本和图像的理解能力有了很大的提升,如何跟风控场景的非文本、图像数据(结构化数据)结合起来,让大模型能够更好的理解结构化的数据,是一个业界难题。面临着三大挑战 :(1)如何有效地将结构化的信息与nlp语义空间进行对齐,使得模型能够同时理解数据结构和语义信息;(2)如何用适当的指令使得大模型理解结构化数据中的结构信息;(3)如何赋予大语言模型图学习下游任务的逐步推理能力,从而逐步推断出更复杂的关系和属性。 3、课题内容:目前业界对结构化数据探索有:(1)图数据理解相关GraphGPT:让大模型读懂图数据(SIGIR'2024) ;(2)图数据RAG相关GraphRAG:Unlocking LLM discovery on narrative private data;(3)序列数据理解相关StructGPT:面向结构化数据的大模型推理框架(EMNLP-2023)。目前的主要工作都是单一结构数据的理解,在风控场景下还面临几个问题:(1)对各种不同种类的的结构化数据融合理解怎么做,特别是融合图和序列数据的数据理解。(2)针对课题必要性中的问题。(3)对于下游任务的推理能力,目前的研究比较少,针对序列数据的推理能力研究非常少。 4、研究方向:大模型结构化数据理解、大模型结构化数据RAG、大模型思维链。 职位要求: 1、2026届及之后毕业,博士在读,计算机、网络安全、人工智能相关专业优先; 2、优秀的代码能力、扎实的数据结构和算法基础,熟练使用Python,熟悉Pytorch和TF者优先; 3、出色的问题定义、分析和解决能力,发表过CCF-A类论文,在AAAI、NeurIPS、SIGKDD、SIGIR等**期刊会议上发表论文者优先; 4、较强的抗压和沟通协作能力,对技术有追求,愿意和团队一起迎接挑战,追求创新。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:依托抖音集团的科技能力和产品,我们为抖音电商、生活服务、直播等场景提供金融服务,为抖音用户提供更好的支付、消费金融、保险等金融服务。科技创新,普惠大众。 大模型&NLP算法团队,支持财经各业务场景的大模型/NLP算法,负责包括智能客服、智能助理、智能外呼、客户体验体系建设等财经NLP及对话应用场景的建设。通过财经领域知识结合生成式大模型、检索增强生成(RAG)、文本理解等技术。建设财经领域内行业领先的智能对话能力和自然语言理解能力,提升财经用户体验和保险/消金等场景智能售前/售后的转化率和满意度。 课题背景: 尽管现有的预训练语言模型在通用领域的生成任务中表现出色,但由于训练数据专业性不足和训练任务缺乏针对性,其在财经领域的应用仍存在明显短板。这主要体现在难以准确理解财经领域特有的业务知识,以及生成内容无法符合该领域特定的业务规则等方面。例如,在财经对话场景中,模型由于缺乏业务背景知识,可能会误解用户意图,生成违反业务规则或偏离市场实际情况的回答,甚至生成与财经业务不符的内容,从而导致生成结果的可信度不足。因此,如何通过领域自适应学习、领域动态知识注入以及领域可解释性生成等技术,提升模型对财经领域的理解和生成能力,已成为一个亟待解决的关键难题。 课题挑战: 目前的预训练语言模型主要基于通用领域的大规模文本数据进行训练,但在面对垂直领域的挑战时,尤其是依赖精确市场分析和特有业务背景知识的财经领域场景,仍然面临诸多困难。这些模型在理解复杂领域文本、整合专业知识、完成特定任务推理以及生成可靠的领域文本方面,存在明显局限性。 首先,当前的大规模预训练语言模型在财经领域的业务知识理解和整合方面仍存在明显不足。即便是像 GPT-4 等当前最先进的模型,也未能深入学习和掌握财经领域的业务背景、知识体系以及行业规范,导致其在财经对话场景中难以精准把握用户意图,无法准确理解复杂的业务逻辑和上下文关联关系。此外,这些模型缺少领域专家知识的监督机制,生成的文本容易出现业务逻辑错误和事实偏差,甚至违反财经领域特定的业务规则。因此,如何构造针对财经领域的自适应训练任务,增强模型在财经领域的知识理解能力,已成为亟待解决的关键问题。 其次,财经领域高度依赖动态更新的市场信息,而当前的大规模预训练语言模型难以快速适配动态更新的领域知识。由于预训练阶段知识的滞后性,这些模型无法在对话中提供对用户有价值的实时分析与建议。因此,如何改进领域知识注入和动态知识学习的训练方法,提升模型在财经对话场景下快速适应新知识的能力,是大模型快速迁移垂直领域的急迫需求。 最后,现有生成式人工智能在财经对话场景中的透明性和可解释性方面仍显不足,用户难以清晰了解模型生成过程及其依据,导致生成结果特别是在涉及市场预测或投资策略等高风险场景时的可信度受到质疑。因此,如何提升文本生成的透明性和可解释性,提升文本生成可信性,是大模型正式投身生产应用的关键卡点。 职位要求: 1、2026届及之后毕业,博士在读,人工智能、大模型、NLP相关专业优先; 2、优秀的代码能力,掌握常见编程语言和算法,熟悉Pytorch或TF等机器学习编程框架; 3、在大模型、RAG、智能对话或搜索等方向要求有丰富的实践经验,在ACL/EMNLP/SIGIR/WWW等**期刊会议上发表论文者优先; 4、有大模型训练和微调经验的同学优先; 5、出色的问题分析和解决能力,有自主探索解决方案的能力;良好的沟通协作能力,能和团队一起探索新技术,推进技术进步; 6、出色的心理素质与应变能力,面对困难勇于迎接挑战;面对复杂局面沉着、冷静、灵活。
  • 25k-45k 经验1-3年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责国际电商物流产品设计与规划,通过系统化的产品方案设计来有效提升履约链路路由、履行以及整体仓网效率,同时负责物流服务商集成; 2、对不同国家的电商履约商业模式和系统进行深入研究,开发并优化核心物流和供应链系统,以支持国际电商业务; 3、与电商产品和运营、物流运营、数据、算法及其他相关团队合作,推动产品方案设计与市场推广,保障产品功能的有效落地和高速迭代; 4、持续推动适应国际区域的产品升级和创新,有效服务全球本地市场。 职位要求: 1、本科及以上学历,具有电子商务履约或国际物流行业的产品管理经验,有跨地区、跨文化工作经验者优先; 2、对电子商务履约、供应链、跨境物流、国际物流等相关领域有深入了解,有电商公司或国际物流公司工作经验者优先; 3、具备出色的沟通能力、跨团队协作能力和系统项目管理能力; 4、具有创新思维,能够主动创新以解决复杂问题; 5、具有强数据分析能力或精通OR运筹学优先。
  • 25k-45k 经验1-3年 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责国际电商物流产品设计与规划,通过系统化的产品方案设计来有效提升履约链路路由、履行以及整体仓网效率,同时负责物流服务商集成; 2、对不同国家的电商履约商业模式和系统进行深入研究,开发并优化核心物流和供应链系统,以支持国际电商业务; 3、与电商产品和运营、物流运营、数据、算法及其他相关团队合作,推动产品方案设计与市场推广,保障产品功能的有效落地和高速迭代; 4、持续推动适应国际区域的产品升级和创新,有效服务全球本地市场。 职位要求: 1、本科及以上学历,具有电子商务履约或国际物流行业的产品管理经验,有跨地区、跨文化工作经验者优先; 2、对电子商务履约、供应链、跨境物流、海外物流等相关领域有深入了解,有电商公司或国际物流公司工作经验者优先; 3、具备出色的沟通能力、跨团队协作能力和系统项目管理能力; 4、具有创新思维,能够主动创新以解决复杂问题; 5、具有强数据分析能力或精通OR运筹学优先。