• 4k-8k 经验在校/应届 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:我们为抖音电商、直播、教育、健康、内容付费等场景服务,依托字节跳动的科技能力和产品,为用户提供更好的支付、消费金融、保险等金融服务体验。科技创新,普惠大众。 1、参与生成式智能对话场景算法研发,提升产品转化率和用户体验; 2、建设基于RAG框架的智能问答系统,优化文本理解、召回、相关性、问答生成等算法; 3、对长文本/海量文本进行深度分析、抽取事件、情感分析,构建知识图谱; 4、搭建和优化搜索排序、在线生成系统,提供稳定的线上服务。 职位要求: 1、2026届本科及以上学历在读,计算机/数学/统计学/模式识别等相关专业优先; 2、优秀的代码能力,掌握常用编程语言和算法,熟悉PyTorch、TF等框架; 3、有机器学习应用经验,有大模型、RAG、智能对话、搜索等领域有实践经验; 4、熟练掌握机器学习算法原理,能熟练运用机器学习、自然语言处理、匹配技术、运筹优化、强化学习、智能生成等技术解决有挑战性的问题,有业界项目经验或顶会论文发表者优先; 5、对数据敏感度极高,有良好的逻辑思维和定义以及解决问题的能力; 6、责任心强,积极主动,有良好的沟通能力和团队合作能力。
  • 内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 团队介绍:依托抖音集团的科技能力和产品,我们为抖音电商、生活服务、直播等场景提供金融服务,为抖音用户提供更好的支付、消费金融、保险等金融服务。科技创新,普惠大众。 大模型&NLP算法团队,支持财经各业务场景的大模型/NLP算法,负责包括智能客服、智能助理、智能外呼、客户体验体系建设等财经NLP及对话应用场景的建设。通过财经领域知识结合生成式大模型、检索增强生成(RAG)、文本理解等技术。建设财经领域内行业领先的智能对话能力和自然语言理解能力,提升财经用户体验和保险/消金等场景智能售前/售后的转化率和满意度。 课题背景: 尽管现有的预训练语言模型在通用领域的生成任务中表现出色,但由于训练数据专业性不足和训练任务缺乏针对性,其在财经领域的应用仍存在明显短板。这主要体现在难以准确理解财经领域特有的业务知识,以及生成内容无法符合该领域特定的业务规则等方面。例如,在财经对话场景中,模型由于缺乏业务背景知识,可能会误解用户意图,生成违反业务规则或偏离市场实际情况的回答,甚至生成与财经业务不符的内容,从而导致生成结果的可信度不足。因此,如何通过领域自适应学习、领域动态知识注入以及领域可解释性生成等技术,提升模型对财经领域的理解和生成能力,已成为一个亟待解决的关键难题。 课题挑战: 目前的预训练语言模型主要基于通用领域的大规模文本数据进行训练,但在面对垂直领域的挑战时,尤其是依赖精确市场分析和特有业务背景知识的财经领域场景,仍然面临诸多困难。这些模型在理解复杂领域文本、整合专业知识、完成特定任务推理以及生成可靠的领域文本方面,存在明显局限性。 首先,当前的大规模预训练语言模型在财经领域的业务知识理解和整合方面仍存在明显不足。即便是像 GPT-4 等当前最先进的模型,也未能深入学习和掌握财经领域的业务背景、知识体系以及行业规范,导致其在财经对话场景中难以精准把握用户意图,无法准确理解复杂的业务逻辑和上下文关联关系。此外,这些模型缺少领域专家知识的监督机制,生成的文本容易出现业务逻辑错误和事实偏差,甚至违反财经领域特定的业务规则。因此,如何构造针对财经领域的自适应训练任务,增强模型在财经领域的知识理解能力,已成为亟待解决的关键问题。 其次,财经领域高度依赖动态更新的市场信息,而当前的大规模预训练语言模型难以快速适配动态更新的领域知识。由于预训练阶段知识的滞后性,这些模型无法在对话中提供对用户有价值的实时分析与建议。因此,如何改进领域知识注入和动态知识学习的训练方法,提升模型在财经对话场景下快速适应新知识的能力,是大模型快速迁移垂直领域的急迫需求。 最后,现有生成式人工智能在财经对话场景中的透明性和可解释性方面仍显不足,用户难以清晰了解模型生成过程及其依据,导致生成结果特别是在涉及市场预测或投资策略等高风险场景时的可信度受到质疑。因此,如何提升文本生成的透明性和可解释性,提升文本生成可信性,是大模型正式投身生产应用的关键卡点。 职位要求: 1、2026届及之后毕业,博士在读,人工智能、大模型、NLP相关专业优先; 2、优秀的代码能力,掌握常见编程语言和算法,熟悉Pytorch或TF等机器学习编程框架; 3、在大模型、RAG、智能对话或搜索等方向要求有丰富的实践经验,在ACL/EMNLP/SIGIR/WWW等**期刊会议上发表论文者优先; 4、有大模型训练和微调经验的同学优先; 5、出色的问题分析和解决能力,有自主探索解决方案的能力;良好的沟通协作能力,能和团队一起探索新技术,推进技术进步; 6、出色的心理素质与应变能力,面对困难勇于迎接挑战;面对复杂局面沉着、冷静、灵活。
  • 4k-6k 经验在校/应届 / 本科
    移动互联网 / A轮 / 150-500人
    岗位职责: 1.从事NLP在新闻媒体领域的具体业务场景应用、算法研发; 2.从事自然语言理解、自然语言生成、知识图谱的算法设计与系统实现; 3.探索使用业界前沿的方法提升现有NLP技术,包括但不限于:智能纠错、知识图谱、辅助写作、对话机器人等。 岗位要求: 1.扎实的算法基础,熟悉机器学习,深度学习算法相关理论; 2.精通自然语言处理相关领域的知识与技能; 3.具有良好的工程能力,熟练掌握C/C++,Python,Matlab等至少一种语言; 4.Tensorflow/Torch/Mxnet/Keras等至少一种主流深度学习框架; 5.在人机交互、文本生成、知识图谱等领域有实际的开发和从业经验者优先; 6.良好的团队合作意识,对技术饱有热情;
  • 6k-10k 经验在校/应届 / 硕士
    科技金融,消费生活,旅游|出行 / B轮 / 500-2000人
    岗位职责: 1、负责文本/图片/音频 等多模态内容理解(包括不限于分类,embdding), 以及在内容生产和分发上应用 2、负责AIGC图像/文本生成的算法研究,包括但不限于GAN、diffusion models、多模态生成等研发工作,助力AIGC内容生态 岗位要求: 1、数学、计算机、自动化、通讯,电子等计算机相关专业硕士以上 2、具备扎实的编程功底,熟悉Pytorch, tensorflow等主流深度学习框架,熟练使用C++/Python等至少一种编程语言,熟悉Linux开发环境 3、掌握计算机视觉和图像处理基本算法或者NLP基本算法和模型常用深度学习算法,并在如下一个或多个相关方向有深入研究:GAN、扩散模型、图像生成、多模态生成、大规模预训练模型、chatbot等 4、有良好的学习能力和创新思维,能够与团队良好合作和沟通,工作积极主动,自驱力强 5、动手能力和调研复现模型(paper/github) 能力强,有开源模型fine turning的优先 加分项: ⁃ 有多模态内容理解和生成相关经验的优先 ⁃ 有AIGC相关产品落地经验者优先 ⁃ 有在CV/NLP知名会议发表文章的优先 ⁃ 有在CV/NLP相关知名比赛中成绩优秀的优先
  • 3k-5k 经验在校/应届 / 本科
    社交,软件开发 / A轮 / 150-500人
    岗位职责: 1、负责研究chatgpt模型,并在现有数据上,配合标注人员复现小型的chatgpt模型; 2、负责研究对话机器人以及其他文本生成任务,包括:对话生成、共情能力建模、意图识别、文本风格迁移等; 3、针对具体业务场景和产品的工具适配与模型调优,并将成果落地和部署; 4、跟进行业前沿技术发展趋势,测试新的模型,并规划研究路线。 任职要求: 1、**本科及以上学历,研究生优先; 2、有大模型预训练,强化学习,对话生成经验优先; 3、熟悉自然语言处理、机器学习、模式识别等相关技术; 4、熟悉NLP方向的理论及常用工具,有深度学习相关NLP项目经验的优先; 5、了解linux系统环境,掌握Python.Java.C++等至少一门编程语言; 6、工作细致、踏实,具有较强的逻辑分析能力,扎实的算法基础和调优能力; 7、具备良好的沟通能力。
  • 8k-15k 经验在校/应届 / 硕士
    人工智能,其他 / B轮 / 150-500人
    岗位职责: 结合特征工程和深度学习进行基于文本的推荐系统研发; 自然语言模型预训练和微调; 深度学习系统的调试调参和模型架构创新。 任职要求: 1. 丰富的深度学习经验和NLP项目研发经验 2. 对计算机相关基础知识有较好理解,代码基础强,熟练掌握Python 3. 熟悉深度学习框架的使用,包括Tensorflow和Pytorch 4. 对Transformer等最新神经网络架构有深入了解,发表过NLP、深度学习相关论文者优先 5. 对BERT, XLNet等最新预训练框架有深入了解 6. 每周坐班至少3天
  • 8k-15k 经验在校/应届 / 硕士
    人工智能,其他 / B轮 / 150-500人
    岗位职责: 结合特征工程和深度学习进行基于文本的推荐系统研发; 自然语言模型预训练和微调; 深度学习系统的调试调参和模型架构创新。 任职要求: 1. 丰富的深度学习经验和NLP项目研发经验 2. 对计算机相关基础知识有较好理解,代码基础强,熟练掌握Python 3. 熟悉深度学习框架的使用,包括Tensorflow和Pytorch 4. 对Transformer等最新神经网络架构有深入了解,发表过NLP、深度学习相关论文者优先 5. 对BERT, XLNet等最新预训练框架有深入了解 6. 每周坐班至少3天
  • 6k-10k 经验在校/应届 / 硕士
    数据服务|咨询,IT技术服务|咨询,人工智能服务 / 天使轮 / 50-150人
    1、 负责对海量文本数据进行抽取、分析与整合,并从中挖掘出有价值的信息。 2、 负责为一款业界领先的智能SaaS化产品提供包括知识图谱构建、机器推理、文本生成等核心NLP能力。 3、 负责NLP算法模型的调优和持续性能优化。 任职要求: 1、计算机、人工智能、统计、数学等相关专业硕士或博士在读 2、熟练掌握Python/Java/C++中的一种或多种编程语言,熟悉TensorFlow、PyTorch等深度学习框架,具有良好的NLP模型构建能力。 3、了解NLP领域前沿热点与最新技术,对文本生成、文本摘要、情感分析、知识图谱、机器推理中的一个或多个任务具有建模和应用经验。 4、对解决具有挑战性的问题充满激情,具有较强的责任心和主动性,具有良好的沟通协作和抗压能力。 加分项: 1、发表过NLP领域**会议/期刊论文者(如ACL、EMNLP、NAACL等)优先 2、参与过有影响力的AI竞赛并获得靠前名次者优先
  • 5k-6k 经验在校/应届 / 硕士
    电商 / 上市公司 / 2000人以上
    职位描述 1. 利用自然语言处理技术和机器学习算法对文本数据进行挖掘分析; 2. 负责自然语言处理技术在机器翻译、自动批改、自动问答、人机对话、语义理解等方向上的应用研究; 3. 负责自然语言处理相关核心技术研发及前沿算法跟踪,根据产品需求完成技术转化,推动业务发展。 职位要求 1. 正直诚信、有责任感、有激情; 2. 计算机/模式识别/人工智能/数学相关专业,本科以上学历; 3. 实践过自然语言处理任务中的至少一种任务,包括但不限于分词、词性标注、命名实体识别、语言模型、句法分析、数据抓取、文本分类、文本检索、情感分析、自动问答、自动批改、自动摘要、机器翻译等; 4. 具有较强编程能力(熟悉C++/Java),熟练使用至少一种脚本语言(Python/Shell等); 5. 熟悉面向文本的常见机器学习算法(逻辑回归、SVM、决策树、贝叶斯等)的原理与算法,以及CNN、RNN、LSTM、Sequence to sequence、GAN等模型者优先; 6. 熟悉Hadoop、Spark、Nutch框架者优先; 7. 有Tensorflow, Caffe2, Theano等深度学习框架与自然语言处理结合实际项目经验者优先; 8. 良好的英语阅读能力,学习能力强,能独立分析并解决问题
  • 8k-15k 经验在校/应届 / 硕士
    移动互联网 / A轮 / 15-50人
    Expectation: Deeply interested in how NLU works, and applied to real world problems. Qualification: 1. Strong math background (linear algebra, statistics), solid machine learning background. 2. The ability to understand/produce documents in English, including research papers. 3. Proficient in Python. For example, finished reading in fluent python. 4. Familiar with at least one deep learning framework: tf2.0 or pytorch. (tensorflow 2.0 is preferred). 5. Familiar with state of art nlu models like LSTM and BERT, had interest in keeping track of the new development. 6. Understand the importance the engineering nature of ML, and have knowledge in TFX, and underlying infrastructure like kubeflow/airflow, including flink/spark. 7. Understand language other than Chinese and English is a big plus. What we provide: 1. Work with team with ambitious goal: we try to build an accessible chatbot building platform for everyone that marry the sound engineering principle with cut edge NLU research. 2. Work with a learning team: we believe to make an impact, one need to change the status quo. We consistently absorb new ideas in both research and engineering to make things better. 3. The opportunity to join the team after internship.
  • 3k-4k 经验在校/应届 / 硕士
    人工智能 / 不需要融资 / 150-500人
    岗位描述: 1、负责大数据计算平台海量网页的去重、敏感信息过滤、内容提取等业务;数据提取 2、配合算法工程师,搭建模型应用平台; 3、负责NLP前沿问题的研究及落地,结合应用场景,提供技术方案。 任职资格: 1、相关专业硕士在读; 2、精通python及主流机器学习算法; 3、熟练掌握一种深度学习框架(Caffe、Torch、Tensorflow等); 4、良好的英语阅读写作能力,PPT制作能力; 6、在AI相关顶会或顶刊发表过论文者优先。
  • 2k-3k 经验在校/应届 / 本科
    人工智能服务 / 上市公司 / 2000人以上
    工作职责 1、协助团队进行NLP相关方向研发,同时完成不限于项目文档撰写、数据处理、专利材料整理、竞赛调研等工作; 2、与正式员工一同参加论文研讨会。 任职要求 1、具有tensorflow或pytorch框架使用经验; 2、有良好的编程能力,熟悉Python/C++/Java中的至少一种; 3、了解机器学习与深度学习基本理论与算法模型,熟悉NLP经典方法; 4、 加分项:有独立完成阅读理解/实体识别/文本分类/多语言学习/多模态学习等任务的经验;有NLP相关竞赛经验;有NLP领域CCF推荐论文/期刊发表经验。
  • 5k-7k 经验在校/应届 / 本科
    软件服务|咨询 / C轮 / 500-2000人
    岗位职责: 1. 参与自然语言处理(NLP)算法的设计、开发与优化,致力于提升算法性能和应用效果。 2. 负责简历解析和知识图谱系统的构建与研发,通过技术创新提升系统性能和用户满意度。 3. 参与大型语言模型(LLM)相关应用的开发与优化,推动技术在实际场景中的应用和落地。 4. 跟踪NLP领域的最新研究动态,将前沿技术融入项目实践,保持技术领先性。 5. 参与数据预处理、模型训练、评估与优化等全流程工作,确保算法的高效与稳定运行。 职位要求: 1. 拥有本科及以上学历,专业背景为计算机科学、数学或相关领域。 2. 熟练掌握Python编程语言,具备使用PyTorch和Transformers等开源框架的经验。 3. 对Prompt Engineering有深入理解,熟悉大型语言模型(LLM)的应用场景和优化策略。 4. 具有Kaggle奖牌或其他数据科学竞赛的获奖经历者优先考虑,证明其解决实际问题的能力。 5. 在NLP领域的会议或期刊上发表过论文者优先,显示其研究能力和学术贡献。
  • 4k-8k 经验不限 / 硕士
    人工智能服务 / A轮 / 500-2000人
    工作职责: 1.负责Foundation Model的训练、评估和部署; 2.负责Foundation Model项目的数据收集与处理; 3.负责追踪相关领域最新技术动态,探索落地应用等。 任职要求: 1.**硕士在读生及以上,计算机/数学/统计等相关专业; 2.熟练掌握NLP/CV领域常用的算法模型原理和常用工具; 3.熟悉Linux开发环境,熟练掌握Python/C#等一门或多门编程语言; 4.熟悉Pytorch、Tensorflow等深度学习框架; 5.有大型语言模型相关项目经验的优先; 6.热衷于技术钻研,良好的自我学习能力和自驱力,良好的沟通能力和团队协作能力; 7.在NLP或CV等领域顶会(ACL/EMNLP/NAACL/NeurIPS/ICML/AAAI/CVPR等)有发表过论文的优先; 8.实习时间:至少3个月以上,每周至少3天以上 ;实习地点:优先上海、北京、苏州,特殊情况可接受远程。
  • 4k-5k 经验在校/应届 / 本科
    人工智能服务 / B轮 / 150-500人
    岗位职责: - 跟进nlp社区最新技术,并运用在语音/文本机器人场景,包括但是不限于nlu,ner,序列标注,人群标签,情绪识别等; - 负责跟踪国内外最新的ai开源框架(bert,albert,xlnet等),并在实际场景运用和改进; - 负责对话机器人场景下多轮会话,槽位填充,ner,知识图谱等技术的研究和开发; - 负责NLP/NLU技术在人机对话、自动问答以及语义理解等方向上的研究和开发,运用于语音/文本机器人。 岗位要求: - 计算机/数学/统计学/模式识别/人工智能/机器学习等相关专业,本科及以上学历; - 熟悉常见深度学习框架TensorFlow/PyTorch/Caffe一种或多种; - 熟悉Linux 平台,掌握shell/Java/Python 中一种或多种语言编程; - 熟悉相关机器学习/深度学习理论,具有扎实的算法基础和良好的数学基础; - 具有较强的编程实现能力和快速学习能力;具备钻研精神和创造力,能够通过阅读论文学习最新算法和理论; - 熟悉常见的NLP算法模型,包括但不限于Bert、Xlnet、CNN、RNN、DNN、LSTM、Transformer等; - 善于沟通协作,聪明,有责任感,对技术有相关规划和追求。 优先 - 对客服机器人有相关了解和背景的优先; - 在自然语言处理、搜索、机器学习、深度学习、智能问答、对话管理、知识图谱、文本生成、人机对话等领域有实际的开发和从业经验者优先。