-
职位职责: 团队介绍:依托抖音集团的科技能力和产品,我们为抖音电商、生活服务、直播等场景提供金融服务,为抖音用户提供更好的支付、消费金融、保险等金融服务。科技创新,普惠大众。 大模型&NLP算法团队,支持财经各业务场景的大模型/NLP算法,负责包括智能客服、智能助理、智能外呼、客户体验体系建设等财经NLP及对话应用场景的建设。通过财经领域知识结合生成式大模型、检索增强生成(RAG)、文本理解等技术。建设财经领域内行业领先的智能对话能力和自然语言理解能力,提升财经用户体验和保险/消金等场景智能售前/售后的转化率和满意度。 课题背景: 尽管现有的预训练语言模型在通用领域的生成任务中表现出色,但由于训练数据专业性不足和训练任务缺乏针对性,其在财经领域的应用仍存在明显短板。这主要体现在难以准确理解财经领域特有的业务知识,以及生成内容无法符合该领域特定的业务规则等方面。例如,在财经对话场景中,模型由于缺乏业务背景知识,可能会误解用户意图,生成违反业务规则或偏离市场实际情况的回答,甚至生成与财经业务不符的内容,从而导致生成结果的可信度不足。因此,如何通过领域自适应学习、领域动态知识注入以及领域可解释性生成等技术,提升模型对财经领域的理解和生成能力,已成为一个亟待解决的关键难题。 课题挑战: 目前的预训练语言模型主要基于通用领域的大规模文本数据进行训练,但在面对垂直领域的挑战时,尤其是依赖精确市场分析和特有业务背景知识的财经领域场景,仍然面临诸多困难。这些模型在理解复杂领域文本、整合专业知识、完成特定任务推理以及生成可靠的领域文本方面,存在明显局限性。 首先,当前的大规模预训练语言模型在财经领域的业务知识理解和整合方面仍存在明显不足。即便是像 GPT-4 等当前最先进的模型,也未能深入学习和掌握财经领域的业务背景、知识体系以及行业规范,导致其在财经对话场景中难以精准把握用户意图,无法准确理解复杂的业务逻辑和上下文关联关系。此外,这些模型缺少领域专家知识的监督机制,生成的文本容易出现业务逻辑错误和事实偏差,甚至违反财经领域特定的业务规则。因此,如何构造针对财经领域的自适应训练任务,增强模型在财经领域的知识理解能力,已成为亟待解决的关键问题。 其次,财经领域高度依赖动态更新的市场信息,而当前的大规模预训练语言模型难以快速适配动态更新的领域知识。由于预训练阶段知识的滞后性,这些模型无法在对话中提供对用户有价值的实时分析与建议。因此,如何改进领域知识注入和动态知识学习的训练方法,提升模型在财经对话场景下快速适应新知识的能力,是大模型快速迁移垂直领域的急迫需求。 最后,现有生成式人工智能在财经对话场景中的透明性和可解释性方面仍显不足,用户难以清晰了解模型生成过程及其依据,导致生成结果特别是在涉及市场预测或投资策略等高风险场景时的可信度受到质疑。因此,如何提升文本生成的透明性和可解释性,提升文本生成可信性,是大模型正式投身生产应用的关键卡点。 职位要求: 1、2026届及之后毕业,博士在读,人工智能、大模型、NLP相关专业优先; 2、优秀的代码能力,掌握常见编程语言和算法,熟悉Pytorch或TF等机器学习编程框架; 3、在大模型、RAG、智能对话或搜索等方向要求有丰富的实践经验,在ACL/EMNLP/SIGIR/WWW等**期刊会议上发表论文者优先; 4、有大模型训练和微调经验的同学优先; 5、出色的问题分析和解决能力,有自主探索解决方案的能力;良好的沟通协作能力,能和团队一起探索新技术,推进技术进步; 6、出色的心理素质与应变能力,面对困难勇于迎接挑战;面对复杂局面沉着、冷静、灵活。
-
职位职责: ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、负责抖音内容理解、内容安全、内容生态、对话Bot等场景的NLP应用算法落地; 2、NLP相关新技术的跟进和研究,探索大模型等技术的潜在发展方向和应用; 3、结合算法模型的业务流程建设和代码框架研发工作。 职位要求: 1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先; 2、熟悉常用的NLP、机器学习相关技术;对文本分类、实体识别、语言模型、意图识别等常用技术,并有相关实践经验;熟悉大语言模型相关技术,有LLM相关开发和应用落地经验者优先; 3、有较扎实的代码编程能力,熟练掌握C/C++/Python; 4、熟悉PyTorch等开源深度学习框架; 5、有高水平论文者、相关实习经验者优先,包括但不限于ACL、EMNLP、NIPS、AAAI等; 6、每周可实习4天以上,实习时间3个月以上。
-
AI应用初级工程师 岗位职责: 1.参与公司AI Agent/Flow项目的开发与实施,协助完成客户场景的搭建,包括但不限于智能问答、信息抽取、内容审核、自动写作等任务; 2.在高级工程师指导下,完成数据清洗、模型微调、效果评测及基础模块开发; 3.协助优化现有AI流程,提升任务执行的准确性和效率; 4.配合客户现场需求,参与项目交付,出差支持客户部署、调试及培训(出差频率视项目需求); 5.配合团队完成技术文档编写、测试及客户需求对接; 岗位要求: 1.学历专业 : 计算机、软件工程、人工智能等相关专业本科及以上学历; 2.技术能力 : ∙熟悉Python,了解基础数据结构与算法; ∙接触过NLP基础任务(如文本分类、实体识别、文本生成等),有相关课程或项目经验; ∙了解至少一种深度学习框架(PyTorch/TensorFlow); ∙对Agent/Flow架构或大模型应用(如LLaMA/GPT)有基础认知者优先; 3.工具使用 : ∙能使用Git进行协作开发; ∙熟悉Linux基础命令及SQL/NoSQL数据库操作; 4.软性要求 : ∙学习能力强,对AI技术有热情,愿意深入行业场景; ∙良好的沟通能力和团队协作意识,能适应快节奏项目交付。 加分项: ∙有开源项目贡献或Kaggle/天池等竞赛经历; ∙熟悉Prompt Engineering或简单SFT微调经验; ∙能使用n8n/coze/dify 等workflow/Agent 工具完成简单场景和需求; ∙熟练使用 cursor/trae 等编程工具 ; ∙了解ToB项目流程,具备基础需求分析能力。
-
■岗位职责 负责文本分析类相关产品的研发和技术运维; 对各种文本数据进行清洗、挖掘和对比分析; 依据数据特征对文本归类,制定算法优化策略。 ■岗位条件 (1)学历:普通高招大学本科及以上学历。 (2)年龄:原则上本科生不超过28周岁,硕士研究生不超过30岁,博士研究生不超过32岁,特别优秀者可适当放宽。 (3)专业:计算机科学与技术、数学、软件工程、网络工程、信息与计算科学、信息安全、电子与计算机工程、信息与通信工程、网络空间安全、数据科学与大数据技术、人工智能等相关专业。 (4)基础能力: 精通Java或Python编程语言; 掌握常用文本分词算法; 具备一定的海量数据分析处理能力; 对词向量、文本语义分析等自然语言处理有一定程度的了解; 善于对开源代码和开源算法的二次开发使用。 (5)放宽及优先条件: 具有符合本岗位特殊才能的,学历和年龄可适当放宽; 具有互联网政务服务相关工作经验、小程序开发经验者,或具有“大厂”工作经验者,学历和年龄可适当放宽,并优先考虑; 具有算法开发相关经验者优先; 具有计算机高级职称者优先; 其他符合放宽或优先条件的。
-
岗位职责 ● 参与业务相关功能模块开发 ● 参与后台系统架构设计,开发及性能优化,保障服务稳定性 ● 负责微服务模块的拆分,开发与维护,使用Kubernetes/Docker等工具进行服务治理 ● 与前端团队协作完成接口设计实现与联调,优化数据交互逻辑及协议规范 岗位要求 ● 计算机相关专业,本科及以上学历 ● 1-3年WEB后台开发经验,具备分布式系统/微服务架构的实践经验 ● 熟悉计算机网络、操作系统、数据结构与算法等基础知识 ● 熟悉常用设计模式,具备良好的编程习惯和代码规范 ● 精通Golang或Python至少一门语言,熟练使用至少一个相关WEB开发框架 ● 熟练使用MySQL/PostgreSQL/Redis/MongoDB等数据库技术 ● 熟悉Linux开发环境,掌握Git/Docker等开发工具 ● 熟悉基于后台系统的常规运维操作,了解配置管理和自动化部署流程 ● 了解前端主流框架(React/Vue等)和开发流程 加分项: ● 有强烈的求知欲,责任感,独立思考, 独立分析和解决问题的能力 ● 有良好的团队协作意识和沟通能力 ● 重度游戏爱好者,对游戏行业充满热情,有较高的审美水平 ● 具备优秀的问题分析能力和技术攻关精神 ● 有游戏行业背景或相关项目经验者优先 ● 熟悉消息队列(Kafka/RabbitMQ)、RPC框架(gRPC/Thrift) ● 了解云原生技术栈(AWS/Aliyun/K8s服务治理) ● 熟悉分布式事务一致性解决方案 ● 熟悉用户鉴权体系(如JWT/OAuth2)
-
■岗位职责 负责爬虫软件设计开发及系统维护工作; 根据业务需求完成数据采集与爬取、解析处理、入库及备份数据日常工作; 负责信息抽取、数据清洗等研发和优化工作,对数据结果进行解释和汇报,向相关部门提供数据分析技术支持; 负责python相关系统的开发、维护和优化。 ■岗位条件 (1)学历:普通高招大学本科及以上学历。 (2)年龄:原则上本科生不超过28周岁,硕士研究生不超过30岁,博士研究生不超过32岁,特别优秀者可适当放宽。 (3)专业:计算机科学与技术、软件工程、网络工程、信息与计算科学、信息安全、电子与计算机工程、信息与通信工程、网络空间安全、数据科学与大数据技术、人工智能等相关专业。 (4)基础能力: 熟练掌握Python编程语言及其主流框架和第三方库; 熟练使用爬虫相关技术,如scrapy、pyspider、appium、puppeteer等; 掌握Pyhton的Web框架Django、Flask等,并且有使用过其中一个框架开发; 具有扎实的数据结构和算法基础,深入理解面向对象编程思想及常用设计模式; 熟悉缓存、多线程、消息队列等相关技术; 具备较高的编程素养、良好的编码习惯。 (5)放宽及优先条件: 具有符合本岗位特殊才能的,学历和年龄可适当放宽; 具有互联网政务服务相关工作经验,或具有“大厂”工作经验者,学历和年龄可适当放宽,并优先考虑; 具有算法开发相关经验的优先; 具有Js逆向经验、App数据抓取经验者优先; 其他符合放宽或优先条件的。
-
岗位职责: 1.参与公司AI Agent/Flow项目的开发与实施,协助完成客户场景的搭建,包括但不限于智能问答、信息抽取、内容审核、自动写作等任务; 2.在高级工程师指导下,完成数据清洗、模型微调、效果评测及基础模块开发; 3.协助优化现有AI流程,提升任务执行的准确性和效率; 4.配合客户现场需求,参与项目交付,出差支持客户部署、调试及培训(出差频率视项目需求); 5.配合团队完成技术文档编写、测试及客户需求对接; 岗位要求: 1.学历专业 : 计算机、软件工程、人工智能等相关专业本科及以上学历; 2.技术能力 : ∙熟悉Python,了解基础数据结构与算法; ∙接触过NLP基础任务(如文本分类、实体识别、文本生成等),有相关课程或项目经验; ∙了解至少一种深度学习框架(PyTorch/TensorFlow); ∙对Agent/Flow架构或大模型应用(如LLaMA/GPT)有基础认知者优先; 3.工具使用 : ∙能使用Git进行协作开发; ∙熟悉Linux基础命令及SQL/NoSQL数据库操作; 4.软性要求 : ∙学习能力强,对AI技术有热情,愿意深入行业场景; ∙良好的沟通能力和团队协作意识,能适应快节奏项目交付。 加分项: ∙有开源项目贡献或Kaggle/天池等竞赛经历; ∙熟悉Prompt Engineering或简单SFT微调经验; ∙能使用n8n/coze/dify 等workflow/Agent 工具完成简单场景和需求; ∙熟练使用 cursor/trae 等编程工具 ; ∙了解ToB项目流程,具备基础需求分析能力。 附加信息: 工作时间:周末双休 上下班时间:09:00-18:00
-
工作职责 : 1、从事服务后台的架构设计、开发、优化等工作; 2、使用最优秀的架构设计及算法实现,在网络接入、业务运行逻辑、用户数据存储、业务数据分析等方向,为用户提供稳定、安全、高效和可靠的专业后台支撑体系。 任职资格 : 1、计算机或相关专业,本科及以上学历。全面、扎实的软件知识结构,掌握操作系统、软件工程、设计模式、数据结构、数据库系统、网络安全等专业知识; 2、精通JAVA,熟悉MVC/RESTful的架构;熟悉ORACLE/PG及SQL语言、编程,了解非关系型数据的原理和应用,了解springboot等微服务技术框架; 3、了解分布式系统的设计与开发、负载均衡技术,高可用系统等知识; 4、对于IT技术有持续好奇心,拥有良好的学习意愿和能力;有良好的团队合作能力和学习能力; 5、执行与推动力强,思维敏捷,具备系统思维,良好的人际理解能力,沟通协调能力强。
-
(该岗位可远程实习) 1. 协助团队进行自然语言处理(NLP)相关项目,参与文本分析、情感分析、机器翻译、信息抽取等任务; 2. 编写和优化NLP模型,参与文本分类、命名实体识别、情感分析等核心任务; 3. 负责数据预处理、清洗及数据集构建,协助进行模型训练与调优; 4. 参与团队的技术调研,学习并应用最新的NLP技术; 5. 与团队成员紧密合作,共同攻克技术难题,并提出创新解决方案; 6. 支持团队完成其他与NLP相关的任务,帮助推动项目进展; 7. 基于大模型(如ChatGPT、通义千问、deepseek等)开发医疗对话机器人。 岗位要求: 1. 计算机科学、人工智能、数据科学等相关专业的本科以上学位; 2. 具备一定的NLP基础,了解常见的NLP任务(如文本分类、情感分析、命名实体识别等); 3. 熟悉至少一种编程语言(如Python、Java),了解PyTorch/TensorFlow框架,并具备NLP工具和库(如NLTK、SpaCy、Transformers等)的使用经验; 4. 有一定的机器学习或深度学习知识,理解模型训练、调优等基本概念; 5. 对NLP技术有浓厚兴趣,具备持续学习和快速掌握新技能的能力; 6. 自驱力强,能够独立承担任务并解决问题; 7. 创新能力,具有开放的思维方式,能为团队提供新颖的解决方案; 8. 英语能力,能够阅读和理解英文技术文献,参与英文文档编写。 优先考虑: NLP相关的在线课程证书(如Coursera、edX等平台的证书); 人工智能相关认证(如TensorFlow Developer Certificate、AWS AI认证)。 项目经验(如GitHub上有公开的代码或参与过研究项目); 了解深度学习模型(如BERT、GPT等),并能应用于实际问题; 具备医学背景。 为什么加入我们? 作为一家创新型的科技企业,我们能帮助您在职业生涯的起步阶段快速成长: 1. 快速成长机会:在我们的团队中,您能将前沿的NLP技术快速应用于实际项目的研发。您的工作将对项目产生直接影响,而不仅仅是执行琐碎的任务。 2. 自主与灵活性:在我们的团队中,您将拥有更多的自主权。您的想法和创新能直接影响项目的进展和最终成果。这将是一个锻炼思考力、执行力、解决问题能力的好机会。 3. 学习与指导:得到高级医疗专家指导,掌握从算法到临床落地的全链条经验。优秀者可参与学术论文撰写,接触行业优质资源。 4. 创新文化:作为一家年轻的公司,我们倡导创新和创意。在这里,您有机会提出并实现您自己的想法,您将成为技术创新的一部分。 5. 有意义的工作:在我们这里,您的工作不仅仅是写代码,而是参与解决真实的业务问题。与头部三甲医院专家合作,将最新学术成果转化为可落地的NLP产品。工作成果将直接融入医院信息化平台,为数万患者带来价值。 6. 潜在的长期机会:表现优异的实习生有机会转为正式核心员工,并在公司中获得更多的职业发展机会。 我们希望您能提供以下材料: 1. 个人简历(含GPA与排名) 2. 相关的学术成绩单; 3. 在线课程证书或相关学习材料; 4. 参与过的NLP相关项目或研究的简要介绍,以及您在其中的具体贡献; 5. 其他能够展示您能力的材料或链接(如GitHub、论文等)。
-
职位描述: 1.负责内容审核NLP算法(文本分类、舆情分析、语 义理解、命名实体识别、关系抽取、摘要生成等)的研发、 优化和生产部署工作; 2.负责NLP和知识图谱新技术的跟踪、研究和落地。 【任职要求】 1.计算机软件等相关专业本科及以上学历,1~3年相关工作 经验; 2.熟悉NLP领域的理论基础,掌握机器学习相关原理,具有 NLP实战经验,参与过相关项目,有海量数据挖掘、文本分 类与语义分析、知识图谱构建、深度学习研发等经验者优 先; 3.精通Python语言,熟悉常见的开源算法和工具,如 TensorFlow、Pytorch、TextCNN、LSTM、Transformer、 BERT等; 4.具有良好的沟通能力、团队合作精神和较强的学习能力。
-
岗位职责:商品知识库建设 岗位要求 1、熟练使用Python或C++在Linux环境下从事开发工作 2、有NLP/图像检索/推荐系统/深度学习算法实践经历 3、 熟练应用深度学习如RNN/CNN/LSTM以及深度学习架构tensorflow,有过深度学习模型在自然语言处理上的运用经验
-
我们正在寻找一位对抖音、微信视频号平台充满热情,并精通其搜索机制和算法的搜索优化专家。您将负责研究和优化我们平台在抖音和微信视频号上的垂直领域内容的搜索可见性和排名,通过精细化的策略提升内容的自然流量和用户触达效率,最终实现业务增长目标。
-
本职位为秋招岗位,可以签三方协议,可以提供苏州工业园区独立单间宿舍,希望可以提前到岗实习,毕业后双方就岗位、薪资达成一致觉得合适,可以直接留职公司。 任职要求: 1、 硕士学历,计算机、模式识别等相关专业,传统或基于深度学习计算机视觉等研究方向; 2、 较好的编程能力,熟悉Python、C/C++语言,熟悉Linux系统; 3、 熟悉Pytorch/Tensorflow/Keras等常用深度学习框架以及常用库,如PIL、OpenCV、Numpy等; 4、 熟悉RNN、LSTM、Transformer等时序模型及任务,对图像分类、目标检测、实例分割等基本计算机视觉任务有一定的了解; 5、 快速学习新技术能力,能够在较短时间完成论文以及算法的调研工作; 有以下经验者优先: 1、 熟悉LSTM、Transformer等时序模型及任务; 2、 拥有2D/3D人体姿态估计实际工程项目经历; 3、 拥有模型部署相关经验(量化、剪枝、蒸馏); 4、 拥有顶会论文、SCI一区论文(一作)优先;
-
岗位职责: 1.从事NLP在新闻媒体领域的具体业务场景应用、算法研发; 2.从事自然语言理解、自然语言生成、知识图谱的算法设计与系统实现; 3.探索使用业界前沿的方法提升现有NLP技术,包括但不限于:智能纠错、知识图谱、辅助写作、对话机器人等。 岗位要求: 1.扎实的算法基础,熟悉机器学习,深度学习算法相关理论; 2.精通自然语言处理相关领域的知识与技能; 3.具有良好的工程能力,熟练掌握C/C++,Python,Matlab等至少一种语言; 4.Tensorflow/Torch/Mxnet/Keras等至少一种主流深度学习框架; 5.在人机交互、文本生成、知识图谱等领域有实际的开发和从业经验者优先; 6.良好的团队合作意识,对技术饱有热情;
-
岗位职责: 1.设计和实施自然语言处理(NLP)算法,参与数据预处理和模型训练工作; 2.进行数据分析,确保数据质量和有效性,以支持算法的训练和优化; 3.与团队成员合作,确保算法项目的顺利进行和目标实现; 4.撰写相关文档和研究报告,确保项目过程的透明化和知识分享。 任职要求: 1.对NLP算法和数据处理有浓厚兴趣,能够独立进行相关工作; 2.具备良好的分析和问题解决能力,能够高效处理数据和优化算法; 3.具有团队合作精神,能够与团队成员有效沟通; 4.能够适应快节奏的工作环境,对新技术有持续学习的意愿。


