-
工作职责 -百度核心业务-FEED信息流推荐业务的日常项目质量保障 -开发测试工具和自动化测试脚本,提高测试效率和准确性 -进行系统测试和分析,确保软件系统的质量和稳定性 -参与测试需求分析,制定测试计划和测试用例,并组织实施 -跟踪测试结果,及时报告问题,并协调修复 -提供技术支持和培训,帮助团队成员提高测试技能 -探索和落地前沿测试技术 职责要求 -本科及以上学历,计算机相关专业 -熟悉Python、C++等至少一种编程语言 -熟悉C++系统的质效保障体系,并有一定的相关系统的质效保障工作经验 -能够主动挖掘业务痛点问题,并通过技术能力解决 -有良好的沟通和团队写作能力,有较好的用户体验意识 -具备快速学习和自我优化能力,富有创新精神
-
职位职责: 1、研究并开发近似最近邻(ANN)搜索算法,重点关注过滤检索、混合检索或基于磁盘的索引方案; 2、优化现有算法,在可扩展性、延迟、内存占用和过滤支持方面持续提升; 3、与工程团队紧密合作,完成算法原型、性能评估与生产系统集成; 4、参与或撰写学术论文、开源项目或内部技术文档; 5、跟踪向量检索、RAG、LLM系统等前沿研究进展。 职位要求: 1、计算机科学、应用数学、电子工程或相关方向博士学位; 2、在**会议(如SIGMOD、VLDB、SIGIR、NeurIPS、ICML等)有向量检索、索引结构、信息检索或机器学习相关的论文发表记录; 3、深入理解ANN算法、量化技术、图索引与分区索引等核心技术; 4、具备系统级性能分析能力,能够从CPU、内存、存储等多层次对系统进行性能剖析与优化; 5、熟练使用C++或Python,具备索引类算法的实际实现与调试经验。 加分项: 1、有向量数据库或检索系统的实际构建经验; 2、熟悉FAISS、ScaNN、HNSWLib、DiskANN等主流框架; 3、理解分布式系统架构,或具备GPU加速检索的实战经验; 4、有混合检索(稠密+稀疏)、多模态检索或LLM检索相关经验者优先; 5、对将研究成果落地于生产系统充满热情。
-
1、参与图像、视频内容生成、理解、检索,自然语言理解等方向前沿技术研究 2、根据业务场景,给出相关算法层面解决方案并进行研发 3、完成相关模型搭建/调优/训练等相关工作,积极推动所负责能力的性能优化及工程化落地 4、持续关注相关领域最新进展,并进行前沿算法思想的落地验证 岗位要求: 1.计算机、数学等相关专业,硕士及以上学历,1-3年工作经验 2.数学基础扎实,能独立对现有算法进行定制优化提升 3.熟悉一般扩散模型、多模态模型,在图像生成、视频理解、多模态等方向有较为深入的研究,熟悉TensorFlow, Pytorch等框架 4.熟悉C/C++/python等语言,能熟练使用上述语言之一进行项目开发 5.了解数字图像处理一般方法,并有与深度学习相结合的实践经验; 加分项: 1.拥有扩散模型、多模态模型训练、调优经验者优先; 2.有AIGC方向项目商用落地经验者优先; 3.在国际期刊、会议上发表论文者优先
-
职位描述 1. 负责大模型技术在微博搜索场景的应用,提升用户满意度,包括但不局限于基于微博结果的内容生成、内容分析、搜索规划、搜索增强等。 2. 负责基于构建检索增强推理链路、构建知识库、高效的对话系统、以及SFT等优化流程,优化大模型的生成能力; 职位要求 1. 计算机相关专业,本科及以上学历; 2. 良好的沟通与表达能力、思路清晰,较强的动手能力、逻辑分析能力和数据分析能力 3. 2年以上后端系统研发经验或者基础架构开发经验,熟练掌握 C/C++/Python,具备扎实的算法和数据结构功底 4. 参与过高并发分布式在线系统的研发,解决过相关性能问题 5. 熟悉NoSQL 数据库技术、内存数据库技术以及向量数据库(如 redis、memcache、faiss等) 6. 有大模型相关工作经验优先
-
工作职责: 1.负责广告投放引擎全链路的开发与优化,包括但不限于数据分发、检索召回、多级排序(粗排和精排)、竞价策略实施、用户行为数据收集与分析; 2.设计并实现高性能、高并发、低延迟的分布式广告检索引擎架构,确保系统在大规模流量下的稳定性和高可用性; 3.深度参与广告引擎的架构设计与优化,针对推荐场景及其他业务需求定制高效索引结构和匹配算法; 4.针对广告投放中的复杂问题提供解决方案,攻克技术难关,并实现自动化异常诊断工具以提高效率; 5.保持对行业前沿技术的关注,调研新技术并在团队内部推动落地应用,持续提升广告引擎的技术竞争力。 任职资格: 1.*****本科及以上学历,计算机相关专业,5年以上相关工作经验,专注于互联网广告投放引擎或搜索引擎后台服务的研发工作,具备实际项目中进行系统架构设计和优化的经验; 2.拥有扎实的计算机科学基础,精通C++编程语言,具备丰富的Linux/Unix平台开发经验,熟悉多线程、多进程、内存管理及网络通信编程技术; 3.精通MySQL、Redis等数据库原理与应用场景,能够熟练使用Linux操作系统,并掌握至少一种脚本语言; 4.具备优秀的逻辑分析能力,能有效抽象和拆分复杂的业务逻辑,解决具有挑战性的技术问题; 5.对广告投放体系中的索引结构、匹配算法、调度策略等方面有深入理解和实践经验,能够针对业务需求快速给出高质量的技术方案。
-
职位职责: 1、参与字节跳动旗下番茄小说、红果短剧业务数值策略研发,运用深度神经网络、多模态、大语言模型等技术来支撑业务的发展; 2、负责探索业界前沿技术,针对业务领域的复杂问题,提出相应解决方案并落地; 3、负责开发相关算法应用,包括但不限于信息提取、内容检索、生成等。 职位要求: 1、本科及以上学历,计算机相关专业,2年以上搜索、广告、推荐、CV、NLP/LLM算法应用经验优先; 2、具有较强的前沿技术探索兴趣和学习能力,熟悉PyTorch、TensorFlow等主流深度学习算法框架; 3、具有良好的产品认知和意识,有大语言模型产品、多模态产品开发经验优先; 4、有良好的逻辑分析能力,能够对业务逻辑进行合理的抽象和拆分,能够拆解不确定问题并进行沟通、协作和落地。
-
工作内容 1、负责业界领先的智能客服混元大模型的开发任务,包括模型SFT、多模态识别、检索召回Emb、上下文工程以及prompt工程等,通过结合客服数据提升智能对答的解决率。 2、研究各类大模型能力,结合对答数据,挖掘badcase;结合平台能力,辅助运营提升对答的解决能力和体验;同时结合DPO/PPO等强化模式降低模型幻答风险。 3、探索业界大模型,提炼共性SOP能力,搭建agent智能体,快速覆盖更多的业务场景;针对疑难问题,提供优化思路。 4、针对对答类场景,动态的评测效果,包含ABtest等,可评估的对答体系。 任职要求: 1、熟悉linux、unix常用命令,精通go、python等编程语言; 2、熟悉NLG领域SFT、RAG、DPO、RLHF等技术,并从事Emb召回、上下文工程、prompt工程等的工作; 3、熟悉mysql、redis的常用存储使用;熟悉docker、k8s等服务搭建和部署; 4、有良好的文献检索和阅读能力,学习能力强、积极进取、诚实正直; 加分项 1. 在数学建模、编程竞赛或相关领域有获奖经历 2. 有大模型相关项目经验,包括评测、优化、训练
-
岗位描述: 1、负责混元智能客服对答系统大模型服务落地建设和升级改造。 2、负责原有智能客服系统更新、接口迭代以及相关服务的维护和管理。 3、负责智能客服RAG检索服务以及NLP模型日常训练、更新迭代。 岗位要求: 1、熟悉linux、unix常用命令,精通go、python等编程语言; 2、熟悉mysql、redis的常用存储使用; 3、熟悉docker、k8s等服务搭建和部署; 4、积极进取、诚实正直;
-
岗位要求: 1. 法律相关专业硕士学历,英语能作为工作语言,通过中国法律职业资格考试; 2. 3年以上律所或企业法律工作经验,熟悉法律评审和诉讼相关工作流程; 3. 工作认真细致,规则意识和责任心强; 4. 团队合作性强,沟通影响力强,有系统性思维能力。 岗位职责: 1. 负责政策、流程、指引等法务管理框架的优化和解读,制作各类法律模板、工具、指引等,确保业务领域的法务业务规范有序运作,助力业务发展; 2. 负责法律文件的起草/评审/谈判、法律咨询等工作,帮助业务成功; 3. 负责法律环境和法律资源建设,深入理解业务战略和业务模式,构建风险预防体系,洞察并预判法律风险,提供法律解决方案,管理业务法律风险; 4. 负责纠纷案件的实施,包括证据梳理、法律检索、法律调研、法律分析、证据获取、案件处理等工作; 5. 负责构建业务领域法务专业能力,贴近业务,设计并实施面向业务场景化的法律综合解决方案,实现服务与管控的平衡,为业务保驾护航; 6. 以端到端的意识,有效处置和应对法律事件,通过案例回溯、案例宣传等手段促进管理改进,提升员工和各级管理者的法律意识。
-
职位描述 1、高德地图POI的策略产品,通过大模型挖掘、检索、生成方式,还原真实世界,为POI数据的覆盖、准确负责; 2、通过竞品、案例、数据分析等手段,持续跟踪量化收益;同时敏锐洞察、决策业务方向,持续扩大对竞品的领先地位; 3、负责业务和能力目标的设定,产品规划与落地,与工程、算法等团队高效协同,推动目标达成。 职位要求 1、**本科及以上学历,3年以上策略产品经验(搜索、推荐、数据挖掘、路线导航等); 2、具备强烈的结果导向意识,根据市场、竞品、业务情况,完成目标制定与拆解和实现; 3、良好的逻辑分析、数据驱动和业务抽象能力,善于从数据中进行业务解读和问题发现,熟悉模型算法迭代过程(有大模型经验更佳)。
-
工作职责: 1.负责智能风控模型研发: a).基于海量业务数据,应用机器学习/深度学习技术(如XGBoost、Transformer、GNN等),设计高精度风控模型,覆盖欺 诈检测、异常行为识别等场景; b).结合专家经验与数据挖掘,提炼强判别性特征,推动模型在实时对抗场景中的高效落地; 2.负责多模态风险识别引擎开发: a).融合文本、语音、图像等多模态数据,构建端到端风险判定模型(如CV目标检测、ASR语音分析、NLP语义理解); b).探索图神经网络技术在复杂关系网络(如黑产团伙挖掘)中的深度应用,提升风控系统鲁棒性; 3.负责算法效果优化与技术创新: a).主导NLP/CV领域的前沿算法(如大模型Prompt工程、RAG增强检索)在风控场景的适配与效果提升; b).持续迭代模型架构,优化推理效率与资源消耗,应对亿级数据实时处理需求。 任职资格: 1.*****硕士及以上学历,计算机/数学/AI相关专业,2年以上算法研发经验,博士学历或具有安全领域经验者优先; 2.精通Python/C++,具备高性能代码开发与调优能力; 3.深入掌握机器学习基础理论(LR/SVM/GBDT等),熟悉深度学习模型(CNN/RNN/GNN)实现原理与优化策略; 4.具备以下至少一项实战经验:NLP-文本分类/实体识别/语义匹配、CV-图像识别/多模态融合、图计算-社区发现/链路预测; 5.熟练运用Hadoop/Spark/Flink处理大规模数据,具备特征工程与分布式训练经验。 加分项: 1.主导过亿级数据量的风控系统建设,具备高并发场景优化经验; 2.发表过AI/安全相关顶会论文(KDD/CVPR/ACL等)或曾获得算法类竞赛奖项; 3.熟悉联邦学习/隐私计算等安全计算技术。
-
岗位职责 作为大数据研发工程师,你将深度参与搜推业务链路的实时与离线数据处理体系建设,核心工作包括但不限于: •基于Flink/Spark 构建用户行为数据的实时(或近实时)采集、清洗、聚合与特征计算链路,实现用户兴趣标签、行为序列、实时偏好等画像特征的更新与存储; •设计高并发、低延迟的实时数据管道,对接搜索/推荐业务的实时请求,支撑个性化排序、精准召回等策略的实时反馈优化; •通过Redis/Elasticsearch/OpenSearch实现画像特征的实时存储与高效检索,保障下游业务(如前端展示、策略调用)的低延迟访问。 •负责离线数据仓库的开发与维护(使用Spark/MaxCompute),完成海量用户行为数据的ETL、数仓分层建模与指标计算; •基于阿里云Lindorm/MaxCompute/DataWorks等工具,优化数据存储成本与计算效率(如冷热数据分层、任务调度调优),支撑业务方的高效取数与分析需求; •针对搜推业务中的复杂场景(如跨域数据关联、实时+离线特征一致性、大规模稀疏特征处理),设计可扩展的技术方案并推动落地; 任职要求 •**本科及以上学历,计算机相关专业,大数据开发相关经验; •熟练掌握并使用(Flink,Spark Spark SQL/DataFrame、DataWorks调度等),有海量数据(TB级以上)的ETL与数仓开发经验; •熟悉消息队列(Kafka必备)、搜索引擎(Elasticsearch/OpenSearch加分)、缓存(Redis等)及云原生大数据组件(阿里云Lindorm/MaxCompute/DataWorks优先)的原理与应用; •具备扎实的编码能力(Java/SQL至少一种),熟悉Linux环境与常用脚本工具,有分布式系统调优经验(如JVM调优、任务并行度优化等)。 •具有良好的沟通能力和组织协调能 加分项: •有实时画像/风控平台建设经验,熟悉用户行为特征工程、规则引擎或模型推理链路集成; •理解搜索/推荐业务逻辑,了解排序策略、召回链路与数据特征的关联性; •对数据敏感,具备较强的业务抽象能力与问题排查能力(如通过日志/指标定位数据延迟、丢失或不一致问题)。
-
团队背景 隶属于6767搜推工程策略组6767,是公司搜索与推荐业务的核心技术支撑团队。团队技术氛围开放,鼓励创新实践,团队成员具备丰富的分布式系统与海量数据处理经验。 岗位职责 作为大数据研发工程师,你将深度参与搜推业务链路的实时与离线数据处理体系建设,核心工作包括但不限于: 61基于Flink/Spark 构建用户行为数据的实时(或近实时)采集、清洗、聚合与特征计算链路,实现用户兴趣标签、行为序列、实时偏好等画像特征的更新与存储; 61设计高并发、低延迟的实时数据管道,对接搜索/推荐业务的实时请求,支撑个性化排序、精准召回等策略的实时反馈优化; 61通过Redis/Elasticsearch/OpenSearch实现画像特征的实时存储与高效检索,保障下游业务(如前端展示、策略调用)的低延迟访问。 61负责离线数据仓库的开发与维护(使用Spark/MaxCompute),完成海量用户行为数据的ETL、数仓分层建模与指标计算; 61基于阿里云Lindorm/MaxCompute/DataWorks等工具,优化数据存储成本与计算效率(如冷热数据分层、任务调度调优),支撑业务方的高效取数与分析需求; 61针对搜推业务中的复杂场景(如跨域数据关联、实时+离线特征一致性、大规模稀疏特征处理),设计可扩展的技术方案并推动落地; 任职要求 61**本科及以上学历,计算机相关专业,大数据开发相关经验; 616767熟练掌握并使用6767(Flink,Spark Spark SQL/DataFrame、DataWorks调度等),有海量数据(TB级以上)的ETL与数仓开发经验; 61熟悉消息队列(Kafka必备)、搜索引擎(Elasticsearch/OpenSearch加分)、缓存(Redis等)及云原生大数据组件(阿里云Lindorm/MaxCompute/DataWorks优先)的原理与应用; 61具备扎实的编码能力(Java/SQL至少一种),熟悉Linux环境与常用脚本工具,有分布式系统调优经验(如JVM调优、任务并行度优化等)。 61具有良好的沟通能力和组织协调能 6767加分项:6767 61有实时画像/风控平台建设经验,熟悉用户行为特征工程、规则引擎或模型推理链路集成; 61理解搜索/推荐业务逻辑,了解排序策略、召回链路与数据特征的关联性; 61对数据敏感,具备较强的业务抽象能力与问题排查能力(如通过日志/指标定位数据延迟、丢失或不一致问题)。
-
岗位职责: 1、大模型环境维护:负责大模型推理环境的安装、维护与管理,确保其稳定运行,满足业务应用需求。 2、前端开发:熟练运用 Vue 和 React 框架,结合 HTML、CSS 和 JavaScript,构建大模型应用的前端交互界面,确保界面响应迅速、操作便捷。 3、后端开发:使用 Python、Java等语言结合相关框架,搭建与大模型对接的后端服务接口。深入了解基础网络知识,保障数据传输的稳定性与安全性。熟悉向量数据库、图数据库的原理与应用,能运用其进行数据存储与检索。掌握 RAG(检索增强生成)、Agent 技术等 AI 能力,有效处理业务逻辑与数据流转,保障系统高并发处理能力。 4、AI 产品研发:主导AI产品从概念设计到上线的全流程,结合市场需求与技术趋势,提出创新性的产品功能和特性。从0到1构建大模型应用,并在工程框架、算法优化、性能优化、交互改进等环节对团队起到支撑性作用。 5、AI 项目交付:负责 AI 项目的整体交付工作,制定项目计划,明确项目关键节点和里程碑。协调各方资源,确保项目按时、高质量完成。在项目交付过程中,与客户保持密切沟通,及时了解客户需求和反馈,提供有效的技术支持和解决方案。 6、团队协作:与团队成员紧密协作,共同推进大模型项目进展,及时沟通解决工作中出现的各类问题。 岗位要求: 1、本科及以上学历,计算机科学、人工智能等相关专业优先; 2、熟悉 Python/JAVA 编程语言,具备一定的编程基础和代码理解能力; 3、了解常见的数据处理方法和工具,对数据整理、清理有一定的认知; 4、了解AI常见开发框架如RAG、Langchain原理,熟悉向量数据库特征、大模型的能力特征; 5、具备良好的学习能力和问题解决能力,能够快速掌握新的技术和工具;有责任心,工作认真细致,能够承担一定的工作压力; 6、具备良好的团队合作精神和沟通能力,能够积极融入团队,共同完成项目任务。
-
职责: 1.负责推荐系统架构设计,进行技术可行性调研,实现在线引擎服务,优化在线性能,保证平台安全、稳定、快速运行; 2.深度参与信息流推荐业务,满足业务对于核心引擎或者基础平台的功能需求; 3.参与推荐引擎、模型预测、向量检索、调度系统等基础系统、平台的设计、研发及调优工作; 4.从业务中了解需求并抽象和设计新的平台,或者优化已有系统,以提升效率并降低成本。 要求: 1.基础功底扎实,熟练掌握C++,了解Python语言,熟悉linux 开发环境及内核,熟悉Perf、Vtune、valgrind等辅助工具; 2.参与过大规模系统的设计及研发工作,能承担一线的架构设计或研发工作; 3.有丰富的搜索或推荐引擎研发经验,对搜索、推荐、KV、模型预测等任一引擎或调度系统有实际开发经验; 4.熟悉开源系统,了解leveldb、Redis、Lucene、mesos,K8s,Docker,TensorFlow等任一系统者优先; 5.对信息流推荐业务有较大兴趣,愿意在该领域长期发展。


