-
50k-100k 经验不限 / 博士内容资讯,短视频 / D轮及以上 / 2000人以上职位职责: 团队介绍:V-AI团队当前支持抖音直播、开放平台、V项目(AI分身/小火人等)业务方向,涵盖了自然语言处理、计算机视觉、图形学等技术领域,通过大模型技术来创造新的互动玩法、制作美术资产、提升研发运营效率等,当前已上线和开展中的项目包括直播大模型(助播/伴播/独播)、角色多模态对话大模型、研发智能助手、3D模型生成大模型、动作生成大模型等。 课题介绍: 背景:随着虚拟现实、增强现实、数字孪生等技术的快速应用,3D数字资产已成为构建沉浸式数字空间的核心要素。在影视动画、游戏开发、直播、社交等领域,3D模型与3D动作的需求呈现爆发式增长。然而,传统3D内容生产高度依赖人工建模与动作捕捉技术,存在效率低、成本高、创作门槛高等瓶颈,难以满足直播等场景中大规模、高保真、多样化、高频迭代的3D内容需求。近年来,以生成式人工智能(AIGC)为代表的大模型技术在2D图像与视频生成领域取得突破性进展,但在3D内容生成领域仍面临表征复杂、多模态数据稀缺、物理规律约束严格等难题。如何将大模型技术与3D生成任务深度融合,实现“文本/图像到3D模型”、“文本/语音到动作”的高质量生成,形成建模+驱动的一站式美术资产生成管线以适配直播场景下资产迭代速度快,品质要求高的需求是当前的重要研究内容。 课题挑战: 传统方法依赖人工建模工具或程序化生成算法,存在生成效率与创作自由度之间的固有矛盾。AI技术虽然能很好地弥补人工生成效率不足的问题,但仍然存在如下挑战 1. 表征困难:与一维文本和二维图像可以自然地实现结构化表征不同,3D模型由于其多模态(如几何、纹理、材质等)、结构复杂和高维度等特性,使得其表征更为复杂。而3D动作又与物理世界紧密相关,且动态复杂度高。因此,如何高效地表征3D几何形状和3D动作,同时确保高品质的生成,仍然是亟需突破的课题。 2. 生成困难:模型生成需同时保障结构完整性、拓扑合理性和细节丰富性;动作生成需兼顾运动多样性、物理约束与时空连续性。现有方法易出现模型畸变、贴图瑕疵、动作力度不足和多样性差等问题。 3. 数据不足:3D数据标注成本高、多模态对齐难度大,且现有公开数据集规模有限,导致大模型训练面临数据不足的问题;如何把相关模态数据(图像、视频)利用起来,提升3D模型和3D动作的生成品质也是当前的重大挑战。 4. 评估体系不完善:缺乏统一的3D生成质量量化指标,现有评价多依赖人工主观判断,难以客观衡量生成的几何精度、动作自然度与多模态语义一致性,因此建立完善、客观、可量化的评价体系是保障技术迭代的关键基石。 1、负责抖音、抖音直播及相关产品的大语言模型/多模态大模型/AIGC算法研发,如数字人、3D生成、动作生成、智能对话等相关工作; 2、负责关键场景的算法优化,构建高质量的模型和Agent系统,提升业务效果; 3、跟踪AI前沿技术进展,推动前沿技术的产品化落地。 职位要求: 1、获得博士学位,人工智能、自然语言处理、计算机视觉、计算机图形学相关专业优先; 2、具有优秀的编程能力,熟练使用PyTorch深度学习框架和相关高性能计算框架; 3、具有丰富的自然语言处理、计算机视觉、计算机图形学、强化学习相关研究经验,在Siggraph/CVPR/ICCV/ECCV/ACL/ICLR/ICML/NeurIPS/TPAMI等会议期刊上发表论文者优先; 4、熟悉扩散模型、GPT等生成式模型,有大模型训练、智能对话、3D生成、动作生成、数字人相关领域研发经验、有Unity/Unreal引擎使用经验者优先考虑; 5、具备优秀的分析和解决问题的能力,对解决具有挑战性的问题充满激情,具有良好的沟通和团队合作能力。
-
50k-100k 经验不限 / 博士内容资讯,短视频 / D轮及以上 / 2000人以上职位职责: 团队介绍:V-AI团队当前支持抖音直播、开放平台、V项目(AI分身/小火人等)业务方向,涵盖了自然语言处理、计算机视觉、图形学等技术领域,通过大模型技术来创造新的互动玩法、制作美术资产、提升研发运营效率等,当前已上线和开展中的项目包括直播大模型(助播/伴播/独播)、角色多模态对话大模型、研发智能助手、3D模型生成大模型、动作生成大模型等。 课题介绍: 背景:随着虚拟现实、增强现实、数字孪生等技术的快速应用,3D数字资产已成为构建沉浸式数字空间的核心要素。在影视动画、游戏开发、直播、社交等领域,3D模型与3D动作的需求呈现爆发式增长。然而,传统3D内容生产高度依赖人工建模与动作捕捉技术,存在效率低、成本高、创作门槛高等瓶颈,难以满足直播等场景中大规模、高保真、多样化、高频迭代的3D内容需求。近年来,以生成式人工智能(AIGC)为代表的大模型技术在2D图像与视频生成领域取得突破性进展,但在3D内容生成领域仍面临表征复杂、多模态数据稀缺、物理规律约束严格等难题。如何将大模型技术与3D生成任务深度融合,实现“文本/图像到3D模型”、“文本/语音到动作”的高质量生成,形成建模+驱动的一站式美术资产生成管线以适配直播场景下资产迭代速度快,品质要求高的需求是当前的重要研究内容。 课题挑战: 传统方法依赖人工建模工具或程序化生成算法,存在生成效率与创作自由度之间的固有矛盾。AI技术虽然能很好地弥补人工生成效率不足的问题,但仍然存在如下挑战 1. 表征困难:与一维文本和二维图像可以自然地实现结构化表征不同,3D模型由于其多模态(如几何、纹理、材质等)、结构复杂和高维度等特性,使得其表征更为复杂。而3D动作又与物理世界紧密相关,且动态复杂度高。因此,如何高效地表征3D几何形状和3D动作,同时确保高品质的生成,仍然是亟需突破的课题。 2. 生成困难:模型生成需同时保障结构完整性、拓扑合理性和细节丰富性;动作生成需兼顾运动多样性、物理约束与时空连续性。现有方法易出现模型畸变、贴图瑕疵、动作力度不足和多样性差等问题。 3. 数据不足:3D数据标注成本高、多模态对齐难度大,且现有公开数据集规模有限,导致大模型训练面临数据不足的问题;如何把相关模态数据(图像、视频)利用起来,提升3D模型和3D动作的生成品质也是当前的重大挑战。 4. 评估体系不完善:缺乏统一的3D生成质量量化指标,现有评价多依赖人工主观判断,难以客观衡量生成的几何精度、动作自然度与多模态语义一致性,因此建立完善、客观、可量化的评价体系是保障技术迭代的关键基石。 1、负责抖音、抖音直播及相关产品的大语言模型/多模态大模型/AIGC算法研发,如数字人、3D生成、动作生成、智能对话等相关工作; 2、负责关键场景的算法优化,构建高质量的模型和Agent系统,提升业务效果; 3、跟踪AI前沿技术进展,推动前沿技术的产品化落地。 职位要求: 1、获得博士学位,人工智能、自然语言处理、计算机视觉、计算机图形学相关专业优先; 2、具有优秀的编程能力,熟练使用PyTorch深度学习框架和相关高性能计算框架; 3、具有丰富的自然语言处理、计算机视觉、计算机图形学、强化学习相关研究经验,在Siggraph/CVPR/ICCV/ECCV/ACL/ICLR/ICML/NeurIPS/TPAMI等会议期刊上发表论文者优先; 4、熟悉扩散模型、GPT等生成式模型,有大模型训练、智能对话、3D生成、动作生成、数字人相关领域研发经验、有Unity/Unreal引擎使用经验者优先考虑; 5、具备优秀的分析和解决问题的能力,对解决具有挑战性的问题充满激情,具有良好的沟通和团队合作能力。
-
工作职责 1、 主要负责应用多模态(文本、视频、语音处理)建模、深度学习等技术,为医疗健康产品研发具有科学性、可行性、先进性的算法解决方案,提高AI在心理、慢病等数字疗法领域的诊断和治疗能力,满足医疗健康多场景使用; 2、 负责调研、探索、应用深度学习等技术的最新的研究和技术进展,优化算法建模实验,提高算法模型性能; 3、 参与医疗AI产品的研发,与产品团队、开发团队合作完成创新技术向应用成果的转化; 4、 参与外部研究机构的学术或科研项目,发表论文和申请发明专利。 任职要求 1、计算机、统计学、数学、自动化、生物医学工程等相关专业硕士或以上学历; 2、有2年以上多模态、自然语言处理、深度学习等算法工作经验; 3、具有较好的算法设计与编程开发经验,熟练掌握Python或R编程,熟悉SQL语言; 4、具有良好的沟通能力与多学科团队协作能力; 5、在人工智能领域**期刊、会议上发表过学术论文者优先; 6、在医疗人工智能领域有相关研究经验者优先。
-
1、参与图像、视频内容生成、理解、检索,自然语言理解等方向前沿技术研究 2、根据业务场景,给出相关算法层面解决方案并进行研发 3、完成相关模型搭建/调优/训练等相关工作,积极推动所负责能力的性能优化及工程化落地 4、持续关注相关领域最新进展,并进行前沿算法思想的落地验证 岗位要求: 1.计算机、数学等相关专业,硕士及以上学历,1-3年工作经验 2.数学基础扎实,能独立对现有算法进行定制优化提升 3.熟悉一般扩散模型、多模态模型,在图像生成、视频理解、多模态等方向有较为深入的研究,熟悉TensorFlow, Pytorch等框架 4.熟悉C/C++/python等语言,能熟练使用上述语言之一进行项目开发 5.了解数字图像处理一般方法,并有与深度学习相结合的实践经验; 加分项: 1.拥有扩散模型、多模态模型训练、调优经验者优先; 2.有AIGC方向项目商用落地经验者优先; 3.在国际期刊、会议上发表论文者优先
-
岗位职责: 1、负责行车场景周视感知算法设计和开发工作,包括高速/城区等场景中的障碍物、车道线等感知任务的模型及后处理算法开发工作 2、负责泊车场景环视感知算法设计和开发工作,包括室内、室外等场景中的车位、障碍物等感知任务的模型及后处理算法开发工作 3、负责自动驾驶领域大模型等前沿技术研发工作 任职要求: 1、计算机、汽车工业、机器人、电子或相关专业; 2、熟悉当前主流的深度学习算法,包括但不限于BEV感知、无监督训练、大模型、目标检测、图像分割、多任务学习、多传感融合等领域; 3、熟悉常用的深度学习框架,如PyTorch、TensorFlow、MxNet等,要求至少对其中一种框架较为熟练; 4、至少精通Python或C++编程,熟悉常用的视觉算法库如numpy/opencv等,了解常用的传统图像处理算法。 5、具备针对车载端侧平台检测/分割等算法设计经验和落地能力,有针对自动驾驶场景落地障碍物、车道线、红绿灯、freespace等算法经验者优先。 6、具有正确的价值观、内在驱动力;具有较强的学习能力、沟通能力和团队协作能力;能主动解决问题;能够承受较强的工作压力。
-
岗位职责: 1.推荐系统方向的系统设计和后端开发实现、推荐策略和算法等。2.ctr server、标签系统、用户画像、内容推荐等相关方向的研发工作。3.海量用户服务架构、大规模数据平台、算法平台等相关开发和建设。 任职资格: 1.重点本科以上学历,计算机/数学相关专业;1年以上推荐相关方向研发经验。2.熟悉java或者c++,java语言优先;熟悉linux开发环境,较好的编程功底。3.对数据敏感,较强的动手实践能力、代码工程经验,逻辑思维强。加分项:1.了解nlp、特征工程、推荐系统、策略优化等。2.有大规模推荐系统架构设计和开发经验,知名互联网工作经历,有带团队经验优先。
-
工作职责 1.负责搜狐新闻特征、用户画像、召回等推荐算法相关工作; 2.负责文本数据分析及语义理解工作; 3.负责自然语言处理基础模型及知识体系建设; 4.负责文本挖掘和建模工作。 任职要求: 1.两年以上自然语言处理相关工作经验,有深度学习自然语言处理应用经验; 2.熟悉Python,熟悉C++、Java等某一种高级语言,常用的数据结构,熟悉TensorFlow或Pytorch; 3.熟悉自然语言处理相关算法,熟悉深度学习相关算法,有文本分类、tag提取、文本生成等某一方面自然语言处理工作经验; 4.优秀的工程能力,有大型项目开发经验者优先; 5.责任心强,有较强的分析和解决问题能力,具备良好的团队合作和沟通能力; 6.有推荐系统、搜索引擎相关工作经验者优先。
-
职位描述: 1. 多模态大模型:探索跨模态的信息对齐方法,研究多模态大模型的预训练、指令微调、RLHF(拒绝学习与强化学习)等技术,评估和提高多模态数据质量,进行数据清洗 2. 内容理解:探索适合微博的实体识别、属性抽取、关系分类等技术,探索图文/视频多模态的内容分类、信息抽取、智能摘要等技术 任职要求: 1. 自然语言处理、计算机视觉、机器学习、数据挖掘、人工智能等相关专业的硕士生/博士生 2. 熟悉BLIP2、LLaVA、MiniGPT、VisualGLM、Qwen-VL等LMM模型结构及训练方法; 3. 熟练掌握tensorflow、pytorch等深度学习框架,扎实的编程基础
-
岗位职责: 1.负责酷我音乐各业务场景推荐策略优化及算法研发; 2.通过理解用户行为,结合数据挖掘技术,快速迭代并优化用户体验,以及各项数据指标; 3.能够有效学习并落地工业界前沿推荐算法,对业务增长起到推动作用。 任职要求: 1.计算机、数学或相关专业本科以上学历,三年以上工作经验; 2.熟悉常用机器学习算法、深度学习算法,并在推荐系统/搜索/广告等有理论基础和实践经验; 3.熟悉TensorFlow、pytorch常见深度学习框架,熟悉Spark,Hive等大数据处理工具; 4.具有良好的工程实现能力,熟练掌握C/C++、Java、Python等至少一种编程语言; 5.有较好的学习能力、沟通能力、团队协作能力,积极主动,愿意接受挑战。
-
岗位职责: 1. 研发人工智能领域的相关算法实现, 可以选择NLP、语音、图像领域其中之一。 2. 结合行内业务需求,设计实现方案,并基于大模型进行场景开发和模型的微调优化。 3. 跟踪和关注大模型推理训练领域的前沿技术和趋势,进行技术调研和应用。 岗位要求 1.计算机、电子通信、数学等相关专业,硕士及以上学历或优秀本科生; 2.具备优秀的编程能力,熟练使用Python/C/C++的其中一种; 3.对机器学习、深度学习等人工智能领域有兴趣,有相关领域课题研究或项目经验者优先;; 4.有期刊论文发表或计算机相关竞赛经验者优先; 5. 出色的问题分析及解决能力,能自我驱动,持续面对挑战,积极主动、踏实勤奋。
-
岗位职责: 1.负责腾讯音乐集团相关产品推荐算法的设计实现与优化; 2.负责完善现有推荐系统的基础算法及并行计算框架; 3.负责音乐平台业务的基于用户/音乐特性的数据挖掘及推荐策略设计实现; 4.负责能够根据业务数据变化不断设计并调整算法策略来提升算法质量,并最终提升用户体验。 岗位要求: 1.硕士及以上学历; 2.计算机,统计,信息,数学等相关专业毕业优先; 3.扎实可靠的编程能力,精通C/C++/GO至少一门编程语言; 4.熟悉业内推荐算法及数据挖掘领域的技术热点和进展,对互联网在线音乐的推荐系统架构设计有深入了解; 5.了解Hadoop/Spark生态相关技术优先; 6.具备规模分布式数据存储与计算开发经验者优先; 7.沟通能力佳,表达能力出众者,音乐爱好者优先。
-
岗位职责 1、基于用户行为建模,优化媒体端广告流量变现效率和用户体验; 2、结合多模态学习(文本、图像、音视频等),优化广告内容推荐和审核机制; 3、参与广告投放相关的核心算法研发,包括 CTR/CVR 预估、RTA、流量预估等优化工作; 岗位要求 1、计算机、数学、统计学相关专业本科及以上学历,互联网 5 年及以上工作经验; 2、逻辑思维和数据分析能力强,善于分析和解决复杂问题; 3、优秀的编码能力,熟练掌握 Java/Python,熟悉 Hive、Spark 等大数据工具; 4、熟悉深度学习框架,具备 TensorFlow/PyTorch 实际项目经验; 5、熟悉广告业务,有 广告系统算法(CTR/CVR 预估、RTA) 经验优先; 加分项: 1、具备多模态广告创意理解经验,如广告素材智能分类、视频广告审核相关经验优先; 2、熟悉端侧推理优化,有 MNN、Paddle Lite、TensorFlow Lite、NCNN 等轻量级深度学习框架经验优先;
-
招聘条件: 1、获得博士学位,且获学位时间一般不超过 3 年; 2、年龄一般在 35 周岁以下,身心健康; 3、具备通信、人工智能、大数据相关专业背景,有志于在该领域开展深入研发; 4、具有良好的团队协作能力和表达能力。 岗位待遇 1、签订劳动合同 ; 2、国家博士后一次性资助; 3、支持博士后在站期间申报国家和省市级博士后人才项目和研究项目; 4、协助申请公租房; 5、优秀者协助申报各类国家、北京市人才计划
-
工作职责 1. 参与实现SAAS产品中AI场景中算法模块的落地与迭代; 2. 参与垂类大模型的研发和训练、优化,包括但不限于Embedding、SFT、RLHF、Pre-trian、Prompt; 3. 参与AI产品的全流程工作,包括但不限于数据、训练、评测、推理部署,保证数据的高质量和有效性; 4、参与设计与实现AI Agent框架,负责Agent在产品上的应用落地。 任职要求 1. 本科及以上学历,计算机、数学、人工智能相关专业; 2. 理解GPT模型架构,对国内外主流大模型以有深入了解,了解Agent与思维链的实现机制,有大模型相关或者NLP研究论文发表者优先; 3. 扎实的编程基础,具备独立的模型设计实现和调优能力,精通Tensorflow、Pytorch等深度学习框架,熟悉Prompt、SFT、RLHF等方法,有大模型微调经验者优先; 4. 有一定的数据处理能力,训练数据的组织以及测试数据集管理有深入理解; 5. 有大模型设计与实现、AI产品应用的实际经验,或者有算法开源项目经验者优先。
-
工作职责 1. 技术应用与优化 具备智能语音客服、智能语音电销、智能语音催收相关的AI技术能力,熟悉电话平台/ASR/TTS/大模型的相关产品和技术 2. 场景优化 将算法和技术能力应用到电话中心的场景优化中,包括但不限于:客服录音的智能切片分析、基于录音内容分析,提供智能话术推荐;客服对话的语义理解与分析。 3. 协作与推动 与产品经理、数据团队和技术团队协作,推动算法方案的落地和产品化;持续跟踪前沿技术,结合业务需求,探索新技术在客服场景中的应用。 4. 需求调研与设计 独立完成AI产品的需求调研、产品设计、架构设计,推动产品落地。 5、 前沿技术探索 深入理解智能技术的运行逻辑,结合客服场景需求,提供算法优化方案,提升技术效果; 持续跟踪前沿技术,结合业务需求,探索新技术在客服场景中的应用。 任职要求 1、本科及以上学历,计算机科学、人工智能、数据科学、数学等相关专业; 2、熟悉ASR、NLP、LLM等AI技术,了解其核心算法原理和应用场景; 3、具备扎实的算法实现能力,能够将算法能力应用到实际场景中; 4、熟悉Python、C++等编程语言,掌握深度学习框架(如TensorFlow、PyTorch等); 5、具备良好的数学基础,熟悉机器学习、深度学习相关算法; 6、对客服场景有理解者优先,有相关经验者加分;具备良好的沟通能力和团队协作能力,能够与跨部门团队高效合作


