【资深爬虫数据挖掘工程师】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

数据挖掘专家
[上海·张江] 1天前发布

20k-40k·15薪经验3-5年 / 本科

信也科技

金融 / 上市公司 / 2000人以上

岗位职责： 1、负责挖掘与分析各类业务数据建立用户画像，并通过算法模型提升风控和反欺诈能力，以数据动风险决策，并提升决策效率； 2、挖掘业务需求，基于对机器学习的理解，定义不同场景下的数据解决方案，并选择有效的算法解决可能遇到的数据、场景相关问题，提升模型的性能和稳定性； 3、配合开发人员和大数据工程师完成模型的上线运行，并进行模型的监控、维护和调整； 4、跟踪模型或方案产生的业务影响，与各业务部门紧密合作，推动数据化决策。任职资格： 1、**本科及以上学历，统计学、数学、经济学、金融等相关专业，并在数据挖掘相关工作上有1-3年工作经验，金融信贷行业的工作经验更佳。 2、扎实的机器学习和数据挖掘理论和技术基础； 3、有一定的PYTHON 和 SQL使用能力，熟悉常用数据统计、分析和建模方法； 4、较好的团队合作精神和沟通能力； 5、优秀的分析问题和解决问题的能力，对解决具有挑战性的问题充满激情； 6、有一定英文沟通能力。
数据工程师（数据挖掘方向）(J13180)
[杭州·和睦] 1天前发布

20k-40k·14薪经验3-5年 / 本科

中华财险创新研发中心

金融软件开发 / 不需要融资 / 2000人以上

工作职责: 1、充分理解业务需求及痛点，利用数据挖掘、数据分析、机器学习等技术挖掘业务价值，解决业务需求； 2、负责风控、定价等板块具体的数据挖掘项目，包括但不限于数据加工、数据分析、特征工程、构建模型等工作，并就对应项目阶段性成果进行汇报与分享，为业务发展提供支持； 3、参与构建用户全生命周期营销管理，构建以用户运营为核心的高质量的标签体系； 4、与业务团队构建良好的合作关系，积极沟通交流，推动合作项目成功。任职资格: 1、3年以上数据分析/数据挖掘/机器学习等相关领域经验；**本科或以上学历；熟悉保险业务优先考虑； 2、熟练使用Python/Scala/Java中一门或多门语言；熟悉Spark/Hadoop/Hive等大数据处理技术，有阿里大数据生态Maxcompute、Dataworks、PAI项目经验的优先考虑；熟练使用Sql进行数据处理； 3、熟悉机器学习基本理论、数据分析常用方法论等相关理论知识，了解概率论与统计学基础； 4、有多类数据挖掘项目的实施落地经验，全链路打通并工程化部署，且能不断优化，进而产生业务效果； 5、自我驱动，能主动深入了解业务，适应业务变化；有良好的个人表达和组织沟通能力，推进项目开展。
02821P-数据挖掘工程师
[深圳·福田区] 1天前发布

10k-20k 经验1-3年 / 本科

平安人寿

金融业 / 上市公司 / 2000人以上

工作职责 1、针对个险业务（如增员、代理人培训、销售转化等）构建数据模型，挖掘潜在业务规律，完成业务场景落地； 2、使用数据挖掘、机器学习、大模型等技术，设计线上线下实验方案，开发部署整个系统，持续迭代业务效果。任职要求 1、本科及以上学历，计算机或统计学、数学、机器学习相关专业优先，硕士优先； 2、1-3年数据挖掘、机器学习领域经验； 3、精通数理统计，掌握常用机器学习方法，例如：逻辑回归，GBDT、Xgboost、lightGBM等模型和实践技能； 4、了解大模型的基本原理及应用，具备大模型应用经验和模型服务化经验优先； 5、扎实的编码能力，熟练掌握Python和Hive，熟悉数据结构与机器学习模型；掌握C++者优先； 6、有较强的人际沟通、协调能力，具备与业务人员沟通数据需求的能力，有良好的团队合作精神； 7、有在机器学习、数据挖掘等领域顶会期刊的论文发表、参加业界数据挖掘比赛获奖者优先。
0281RC-数据挖掘工程师
[深圳·福田区] 1天前发布

10k-20k 经验1-3年 / 硕士

平安人寿

金融业 / 上市公司 / 2000人以上

工作职责 1、参与公司核心业务风险管控，如合规、两核、产品等方向算法设计与开发、部署、优化和落地，提升风险管控准确率及效率； 2、针对具体业务应用场景，提出合适的算法解决方案，并推动该方案在业务领域的实现； 3、使用数据挖掘、机器学习、大模型等技术，设计线上线下实验方案，与团队成员协作，开发部署整个系统，并完成实验、收集数据、效果追踪、迭代优化机器学习系统效果； 4、不断优化、提升已有算法和前沿新技术预研与落地应用。任职要求 1、本科及以上学历，计算机或统计学、数学、机器学习相关专业优先，硕士优先； 2、1-3年数据挖掘、机器学习领域经验; 3、精通数理统计，掌握常用机器学习方法，例如：逻辑回归，聚类、关联分析、GBDT、Xgboost、lightGBM等算法和实践技能；了解大模型的基本原理及应用，具备大模型部署经验和模型服务化经验优先； 4、扎实的编码能力，熟练掌握Python和Hive，熟悉数据结构与机器学习算法；如掌握C++者优先； 5、有较强的人际沟通、协调能力，具备与技术人员沟通数据需求的能力； 6、对数据敏感，工作细致负责，具备良好的问题分析与解决能力，有良好的团队合作精神; 7、有在机器学习、数据挖掘等领域顶会期刊的论文发表、参加业界数据挖掘比赛获奖者优先。
反爬虫风控策略专家-抖音电商
[北京·海淀区] 1天前发布

30k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责保护公司电商平台的数据安全，防范和打击爬虫及其他恶意行为，研究和掌握最新的反爬虫技术，制定和实施有效的反爬虫策略； 2、深入了解上下游业务形态，可独立发起治理专项，快速定位问题并形成落地策略及效果评估闭环； 3、分析和调查电商平台上的异常流量和可疑活动，从海量设备、行为数据中发掘有价值的信息； 4、可协助进行建模工作，如特征分析、数据可视化呈现等，为团队决策提供数据支持； 5、与产品研发团队高效合作，优化技术架构和端上安全能力，建立端管云三位一体的反爬体系，量化防控效果，驱动反爬能力的不断提高。职位要求： 1、计算机、信息安全、统计、数学等相关专业； 2、反爬相关经验，具备网络安全、数据保护和风险管理方面的专业知识，有电商经验者优先； 3、熟练掌握SQL、Python等编程语言，具有扎实的数据分析能力及学习能力； 4、深入了解常见的爬虫技术和工具，具有丰富的反爬虫经验，熟悉Web安全、网络协议、漏洞扫描等相关技术； 5、具有较强的问题解决能力，能够快速分析和处理安全事件，具备良好的团队合作精神和沟通能力。
数据挖掘/nlp /llm算法工程师
[上海·徐汇区] 1天前发布

30k-45k 经验5-10年 / 本科

51JOB

工具类产品 / 上市公司 / 2000人以上

职位描述：我们正在寻找一位经验丰富、具有创造力的NLP/数据挖掘方向的算法工程师，加入我们的团队，负责构建和优化公司的标签挖掘、知识图谱、构建垂域的大模型，打造业界领先的AI&NLP算法团队主要职责： 1、主导、参与、设计和构建标签体系、知识图谱的结构和关系，以支持智能推荐、问答、自然语言处理等应用。利用图谱算法和机器学习技术，从海量数据中提取和抽取出知识，填充知识图谱。 2、大规模预训练LLM，构建人才招聘领域的垂域场景下的语言大模型，基于底层基座，进行retraining or fine-tune。推动公司互动对话以及相关AI产品的落地 3、数据挖掘方向，关键词提取，支持搜索意图理解、suggest等产品的优化改进，提升用户体验 4、与其他工程师和团队合作，将知识图谱应用于产品中，实现智能化和自动化的功能。任职要求： 1、研究生以上学历，211、985毕业优先 2、年龄在35以下，并且有互联网相关2年以上的算法工作经验 3、深入理解和掌握NLP、深度学习、LLM、数据挖掘领域的知识和技能。 4、熟练掌握Python、Spark等大数据和图谱工具，能够进行大规模数据处理和分析。 5、对算法和数据有强烈的兴趣和热情，能够在复杂的场景中进行高效的算法设计和优化。 6、具备良好的团队合作和沟通能力，能够与产品、设计和其他工程师紧密合作，完成高质量的产品。 7、热爱学习，对人工智能、NLP、数据挖掘、LLM、知识图谱充满热情，能够自我驱动并独立解决问题。
数据挖掘工程师
[深圳·大冲] 1天前发布

15k-25k 经验3-5年 / 本科

腾讯云智服

软件服务｜咨询 / 不需要融资 / 2000人以上

岗位描述： 1、应用前沿和经典算法，在部门业务数据上挖掘数据价值，提升人工效能，包括但不限于（LLM、NLP、图像识别等各方面） 2、分析各项影响业务提能增效的因素、各项业务细节，结合业务方向，给出可落地的整体的开发优化方案； 3、与产品/运营等配合，推进优化方案落地执行，带来业务的实际效率提升；岗位要求：岗位要求： 1、本科及以上学历，理工科专业背景者优先考虑，2年以上数据分析相关工作经验； 2、较强的逻辑思维能力、数据敏感度，擅长利用数据发现问题及解决问题； 3、熟练掌握基本的机器学习挖掘模型，对数据挖掘的理解不仅限于模型的应用，能把各类算法融合应用，并有相应的项目落地经验； 4、熟悉深度学习模型框架优先，限于tensorflow/pytorch/keras之一，掌握基本的nlp、cv算法应用能力，如文本分类，聚类，图像分类等。 5、扎实的工程能力，熟悉SQL，ES等主流数仓工具的使用，善于应用python等技术进行数据清洗，掌握模型开发、量化、部署能力； 6、较好的主动性和分享精神，良好的沟通和协作能力。
反爬虫风控策略专家-抖音电商
[上海·杨浦区] 1天前发布

30k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责保护公司电商平台的数据安全，防范和打击爬虫及其他恶意行为，研究和掌握最新的反爬虫技术，制定和实施有效的反爬虫策略； 2、深入了解上下游业务形态，可独立发起治理专项，快速定位问题并形成落地策略及效果评估闭环； 3、分析和调查电商平台上的异常流量和可疑活动，从海量设备、行为数据中发掘有价值的信息； 4、可协助进行建模工作，如特征分析、数据可视化呈现等，为团队决策提供数据支持； 5、与产品研发团队高效合作，优化技术架构和端上安全能力，建立端管云三位一体的反爬体系，量化防控效果，驱动反爬能力的不断提高。职位要求： 1、计算机、信息安全、统计、数学等相关专业； 2、反爬相关经验，具备网络安全、数据保护和风险管理方面的专业知识，有电商经验者优先； 3、熟练掌握SQL、Python等编程语言，具有扎实的数据分析能力及学习能力； 4、深入了解常见的爬虫技术和工具，具有丰富的反爬虫经验，熟悉Web安全、网络协议、漏洞扫描等相关技术； 5、具有较强的问题解决能力，能够快速分析和处理安全事件，具备良好的团队合作精神和沟通能力。
爬虫开发工程师
[成都·高新区] 3天前发布

12k-16k 经验3-5年 / 本科

大地量子

数据服务｜咨询 / A轮 / 50-150人

工作职责：负责设计、开发和维护高效、稳定的数据爬虫系统；根据业务需求，制定数据抓取策略，处理反爬机制、验证码识别、IP代理等问题；建立数据清洗、结构化处理及存储流程，保证数据质量；持续优化爬虫性能，提升抓取速度与稳定性；与数据分析、产品等团队紧密协作，理解数据需求，快速响应数据抓取任务；关注行业动态，研究新的爬取技术和反爬手段，持续提升系统能力。任职要求：熟练掌握至少一种编程语言（Python优先，如：Scrapy、Selenium、Playwright、Requests 等常用库）；熟悉常见网站结构、前端技术（HTML、CSS、JavaScript），能够快速分析网页数据；熟悉常用的反爬技术及应对手段（如IP代理池、UA池、验证码识别、动态渲染处理等）；熟悉异步爬虫、分布式爬虫开发，有 Scrapy-Redis / Playwright + 分布式实践经验者优先；熟悉常用数据库（如MySQL、MongoDB）及缓存系统（如Redis）；有大型数据采集、数据清洗、数据处理项目经验优先；具备良好的编码习惯和文档意识，责任心强，乐于学习新技术。加分项：有 GraphQL 接口抓取、WebSocket 抓取、APP 抓包分析经验；有云原生（如 Kubernetes、Docker）、大数据（如Spark、Kafka）相关技术栈经验；有参与过爬虫平台化、数据中台建设项目经验；有算法基础，了解简单的图像识别（如验证码OCR识别）优先。
爬虫工程师
[烟台·芝罘区] 2025-06-19

5k-10k 经验不限 / 本科

丛云大数据

企业服务 / 未融资 / 少于15人

岗位职责： 1. 负责公司数据采集系统的设计与开发，实现高效、稳定的数据爬取； 2. 根据业务需求，制定数据抓取策略，优化爬虫算法，提高数据抓取速度和准确性； 3. 负责数据清洗、去重、存储等后端处理工作，确保数据质量； 4. 跟踪分析爬虫技术的发展趋势，对现有系统进行优化升级； 5. 与其他团队密切配合，完成数据挖掘、分析等相关工作； 6. 遵守相关法律法规，确保数据采集的合规性。岗位要求： 1. 计算机相关专业本科及以上学历，2年以上爬虫相关工作经验； 2. 熟练掌握Python、Java、C++等至少一种编程语言，具备良好的编程基础； 3. 熟悉主流的爬虫框架，如Scrapy、requests等； 4. 熟悉Web前端技术，如HTML、CSS、JavaScript等； 5. 熟悉数据库技术，如MySQL、MongoDB等； 6. 熟悉Linux操作系统，能熟练使用shell脚本； 7. 具备良好的数据结构和算法基础，能独立解决复杂问题； 8. 具备良好的沟通能力和团队协作精神，能承受工作压力； 9. 有以下经验者优先： - 有大规模分布式爬虫开发经验； - 熟悉反爬虫技术，能应对网站反爬措施； - 熟悉大数据处理技术，如Hadoop、Spark等。薪资待遇： 1. 薪资范围：面议，根据个人能力及经验水平； 2. 享有五险一金、年终奖、项目奖金等； 3. 提供完善的职业发展路径和晋升机会； 4. 提供良好的工作环境和发展空间。联系方式：有意者请将个人简历发送至：[邮箱地址]，邮件主题请注明“爬虫工程师+姓名”。我们会尽快回复您的邮件，谢谢！
python爬虫工程师
[杭州·西湖] 2025-05-24

7k-13k 经验1-3年 / 本科

杭州朗视

数据服务,企业服务 / 未融资 / 15-50人

1、精通python语言，精通scrapy爬虫框架； 2、精通web抓取原理及技术，从结构化和非机构化数据中获取信息； 3. 精通Html、JavaScript、XML等知识，熟悉前端异步请求方式； 4、精通自动化测试工具； 5、熟悉一种或多种开源技术； 6、具备一定的数据挖掘能力；任职要求： 1、负责为各个业务线提供垂直，精准的数据采集，抽取，存储服务 2、设计爬虫策略和防屏蔽规则，提升网页抓取的效率和质量 3、解决网页抓取，信息抽取等问题，构建高可用性，高扩展性网络信息采集平台 4、能独立解决实际开发过程碰到的各类问题
高级爬虫工程师
[厦门·思明区] 2025-02-27

25k-40k 经验5-10年 / 本科

四沃投资

金融 / 未融资 / 15-50人

岗位职责： 1、负责爬虫系统架构和业务开发; 2、建立完整的数据采集、解析、入库和监控流程，并不断优化迭代完善; 3、解决常见的反爬虫问题，并建立相关的系统化策略; 4、深入理解系统数据处理流程以及业务功能需求; 5、保证数据的完整性和准确性; 6、对高难度的技术问题的探索和解决有着极强的自我驱动力。任职要求: 1、熟悉区块链数据挖掘，掌握Frida、Xposed、APKTOOI、JADX、IDA等常用逆向工具; 2、熟悉常见的Web和APP反爬手段和策略; 3、熟练掌握Python、Javascript或Go网络编程; 4、熟悉至少一种关系型数据库(如mysql等) 5、计算机基础扎实，对数据结构、操作系统计算机网络等技术技术有一定程度的掌握; 6、五年以上的爬虫开发经验，有丰富的Web及APP逆向工程经验。
python爬虫工程师
[上海·洋泾] 2024-07-12

10k-15k 经验3-5年 / 本科

AceBridge

移动互联网,消费生活 / A轮 / 15-50人

岗位职责： 1、负责PDF/Word/Excel等格式图文识别、分类、入库； 2、负责内外部网页内容抓取、去除干扰数据、标准化入库； 3、负责图片中文字内容识别、排版、纠错、标准化入库； 4、编写公共接口，为公司其他项目提供 PDF解析、网页解析、图文解析等接口服务； 5、跟进OCR、爬虫、NLP前沿技术，将其工程化应用到公司产品中； 6、支持公司相关产品的研发工作。任职要求： 1、**本科及以上学历；计算机、数学、信息技术、自然语言处理、数据挖掘相关专业；3年以上工作经验； 2、熟练使用 Python，熟悉相关环境部署，熟悉Linux常用命令； 3、熟悉 PyPDF2、PyMuPDF、Borb 等开源库，在项目中有实际使用经验； 4、熟悉 PaddleOCR、EasyOCR、Chineseocr、Tesseract、OpenCV 等开源库，有实际使用经验； 5、熟悉 Scrapy、Pyppeteer、Selenium，有实际使用经验； 6、熟练使用SQL，熟悉MySQL等关系型数据库； 7、有Django、Docker经验者优先； 8、工作积极主动，富有学习精神，愿意挑战高难度任务，编码规范。
python爬虫工程师
[重庆·大竹林] 2024-06-17

9k-15k 经验3-5年 / 大专

坚持一下科技

软件服务｜咨询,IT技术服务｜咨询,人工智能服务 / 天使轮 / 15-50人

岗位职责： 1.负责维护现有数据源爬虫系统； 2.配合业务，负责设计和开发分布式网络爬虫系统，进行多平台信息的抓取和分析工作； 3.负责管理并持续优化数据结果，协助数据处理，配合完善基础数据库建设； 4.负责协助相关业务开发落地；任职要求： 1.大专及以上学历，计算机软件相关专业，或数学相关专业，3年及以上Python相关岗位工作经验； 2.熟悉Linux系统，熟悉Python语言，熟悉常用爬虫框架，如Scrapy等，并有实际项目经验； 3.熟悉JavaScript/xpath/Ajax等web知识, 熟悉WebDriver，phantomjs等工具； 4.掌握网页抓取原理及技术，了解基于Cookie的登录原理，熟悉基于正则表达式、XPath、CSS等网页信息抽取技术； 5.熟悉mysql，redis，mongodb，ES等数据库，以及对应数据的抽取入库等；； 6.有解决封账号、封IP、网页抓取、信息抽取等问题的经验，可构建完善的网络信息收集平台； 7.熟悉整个爬虫的设计及实现流程，有从事网络爬虫、网页信息抽取开发经验，熟悉反爬虫技术，有分布式爬虫架构经验； 8.有数据分析、数据挖掘相关经验者优先，有良好的沟通能力和责任感，能够承担工作压力，独立分析和解决问题者优先； 9.有数据分析产品全生命周期经验的优先；
python爬虫工程师
[北京·朝阳区] 2023-11-22

25k-35k 经验5-10年 / 本科

高维互娱

新媒体 / 不需要融资 / 150-500人

负责为海外音乐项目搜索采集数据，为团队的海外运营提供决策支持（自有项目，非乙方）。岗位职责∣Responsibilities: 1、熟练掌握Python，熟悉Linux开发环境； 2、负责设计和开发爬虫，精通海外网页（Youtube、Spotify、Google...）抓取原理及技术，从各种web页面、APP中获取目标信息； 3、负责爬虫团队的日常工作安排及管理。 4、解决技术疑难问题，包括各种反爬、压力控制等，提升网页抓取的效率和质量。有能力解决封账号、封IP、验证码识别、图像识别等问题，有能力解决复杂的反爬限制； 5、大规模爬虫系统的设计、数据REST API的设计、开发、维护、调优，第三方数据源的对接、预处理、入库； 6、分析结构化和非结构化数据，并对数据抓取、信息提取、去重、清洗；不限于使用代码规则类进行数据清理； 7、开发代码的维护更新，Linux服务器的维护，文档维护； 8、支持部门数据需求，包括但不限于搜索数据来源、数据清洗、数据挖掘、为团队提供决策支持；履职要求∣Requirements: 1、大学本科及以上学历，计算机相关专业； 2、耐心、细心，有较强的逻辑思考能力，和良好的工作习惯。 3、有5-10年的爬虫、数据处理、数据分析经验; 有团队管理经验；有音乐行业经验优先； 4、掌握HTML，JS，及熟悉JS反扒破解；熟悉常见的反爬虫技术如文本混淆反爬虫、验证码等； 5、熟练掌握Python数据结构与常用算法；熟悉scrapy等爬虫框架，有scrapy-redis分布式爬虫经验;熟悉正则、xpath等提取方法； 6、了解pandas、numpy掌握网络爬虫开发原理，熟悉互联网各种类型数据交互模式； 7、熟悉MySQL部署、开发与维护； 8、熟悉Linux环境，使用脚本开发维护Linux服务器； 9、具有良好的表达能力，团队合作能力;具有很强的责任心，乐于挑战，有较强的深入学习理解业务的意愿。