【java爬虫】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

反爬虫风控策略专家-抖音电商
[北京·海淀区] 1天前发布

30k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责保护公司电商平台的数据安全，防范和打击爬虫及其他恶意行为，研究和掌握最新的反爬虫技术，制定和实施有效的反爬虫策略； 2、深入了解上下游业务形态，可独立发起治理专项，快速定位问题并形成落地策略及效果评估闭环； 3、分析和调查电商平台上的异常流量和可疑活动，从海量设备、行为数据中发掘有价值的信息； 4、可协助进行建模工作，如特征分析、数据可视化呈现等，为团队决策提供数据支持； 5、与产品研发团队高效合作，优化技术架构和端上安全能力，建立端管云三位一体的反爬体系，量化防控效果，驱动反爬能力的不断提高。职位要求： 1、计算机、信息安全、统计、数学等相关专业； 2、反爬相关经验，具备网络安全、数据保护和风险管理方面的专业知识，有电商经验者优先； 3、熟练掌握SQL、Python等编程语言，具有扎实的数据分析能力及学习能力； 4、深入了解常见的爬虫技术和工具，具有丰富的反爬虫经验，熟悉Web安全、网络协议、漏洞扫描等相关技术； 5、具有较强的问题解决能力，能够快速分析和处理安全事件，具备良好的团队合作精神和沟通能力。
反爬虫风控策略专家-抖音电商
[上海·杨浦区] 1天前发布

30k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责保护公司电商平台的数据安全，防范和打击爬虫及其他恶意行为，研究和掌握最新的反爬虫技术，制定和实施有效的反爬虫策略； 2、深入了解上下游业务形态，可独立发起治理专项，快速定位问题并形成落地策略及效果评估闭环； 3、分析和调查电商平台上的异常流量和可疑活动，从海量设备、行为数据中发掘有价值的信息； 4、可协助进行建模工作，如特征分析、数据可视化呈现等，为团队决策提供数据支持； 5、与产品研发团队高效合作，优化技术架构和端上安全能力，建立端管云三位一体的反爬体系，量化防控效果，驱动反爬能力的不断提高。职位要求： 1、计算机、信息安全、统计、数学等相关专业； 2、反爬相关经验，具备网络安全、数据保护和风险管理方面的专业知识，有电商经验者优先； 3、熟练掌握SQL、Python等编程语言，具有扎实的数据分析能力及学习能力； 4、深入了解常见的爬虫技术和工具，具有丰富的反爬虫经验，熟悉Web安全、网络协议、漏洞扫描等相关技术； 5、具有较强的问题解决能力，能够快速分析和处理安全事件，具备良好的团队合作精神和沟通能力。
爬虫
[北京·中关村] 2025-07-21

15k-25k 经验1-3年 / 本科

智慧星光

数据服务 / 不需要融资 / 500-2000人

工作职责: 1.负责较为复杂的app的逆向采集工作，持续跟踪分析爬虫系统的技术缺陷，对策略架构做出合理地调整和改进，提升公司相关产品与服务的竞争力2.完成公开数据的采集和分析。对指定网站的信息采集配置及维护工作；3、各种爬虫技术的研发、网页信息抽取等研发和优化工作。任职资格: 1. 本科及以上学历，较为优秀者可放宽学历要求； 2. 2年以上爬虫经验及app逆向经验; 3. 对于常见APP的反爬技术等有分析应用； 4. 能完成Android APP的抓取, Hook, Java层逆向（3-5个app以上），有So层逆向经验优先; 5. 熟练掌握软件逆向静态分析、动态调试、代码跟踪等；熟悉常见的加密、解密算法，对于风控策略有一定的应对经验； 6. 熟悉Linux平台开发，并且熟悉多线程模型编程、网络编程，熟悉HTTP、TCP/UDP协议； 7.有一定的群控开发经验优先
爬虫开发工程师
[成都·高新区] 3天前发布

12k-16k 经验3-5年 / 本科

大地量子

数据服务｜咨询 / A轮 / 50-150人

工作职责：负责设计、开发和维护高效、稳定的数据爬虫系统；根据业务需求，制定数据抓取策略，处理反爬机制、验证码识别、IP代理等问题；建立数据清洗、结构化处理及存储流程，保证数据质量；持续优化爬虫性能，提升抓取速度与稳定性；与数据分析、产品等团队紧密协作，理解数据需求，快速响应数据抓取任务；关注行业动态，研究新的爬取技术和反爬手段，持续提升系统能力。任职要求：熟练掌握至少一种编程语言（Python优先，如：Scrapy、Selenium、Playwright、Requests 等常用库）；熟悉常见网站结构、前端技术（HTML、CSS、JavaScript），能够快速分析网页数据；熟悉常用的反爬技术及应对手段（如IP代理池、UA池、验证码识别、动态渲染处理等）；熟悉异步爬虫、分布式爬虫开发，有 Scrapy-Redis / Playwright + 分布式实践经验者优先；熟悉常用数据库（如MySQL、MongoDB）及缓存系统（如Redis）；有大型数据采集、数据清洗、数据处理项目经验优先；具备良好的编码习惯和文档意识，责任心强，乐于学习新技术。加分项：有 GraphQL 接口抓取、WebSocket 抓取、APP 抓包分析经验；有云原生（如 Kubernetes、Docker）、大数据（如Spark、Kafka）相关技术栈经验；有参与过爬虫平台化、数据中台建设项目经验；有算法基础，了解简单的图像识别（如验证码OCR识别）优先。
爬虫
[上海·静安区] 2023-07-13

60k-90k 经验5-10年 / 本科

普舫企业管理咨询

企业服务 / 不需要融资 / 150-500人

职位描述: • 负责分布式网络爬虫系统平台的架构设计与开发（如抓取调度，多样化抓取，页面解析和结构化抽取，海量数据存储和读取等）、技术选型 • 研究爬虫策略和防屏蔽规则，解决封账号、封IP、验证码、页面跳转等难点攻克，提升网页抓取的效率和质量 • 把握网络爬虫核心技术研究方向，研究优化策略，提升爬虫系统的稳定性、可扩展性 • 管理并带领爬虫团队完成社交媒体数据（文本、视频、音频和图像）开发工作职位要求: • 深度参与过至少一个分布式网络爬虫系统的架构设计； • 良好的代码能力，扎实的数据结构和算法功底，有快速迭代、逐步优化的工程项目经验 • 精通爬虫和反爬技术，精通底层协议；精通深度抓取、动态网页技术抓取、浏览器模拟抓取、APP抓取等技术 • 熟悉分布式系统、多线程，精通scrapy框架以及原理，有开发爬虫框架经验 • 对主流爬虫架构有深入研究，具有成熟爬虫工具的设计及运维经验 • 有很强的学习能力和技术钻研能力，积极主动，思维灵活开放，有良好的沟通能力，善于跨团队合作 • 良好的逻辑能力，善于把复杂问题梳理清晰，责任安排到人，完成情况监督到位
爬虫工程师（自研项目）
[合肥·蜀山区] 2025-11-11

11k-14k 经验5-10年 / 本科

亿企查

数据服务｜咨询 / 未融资 / 150-500人

岗位职责： 1.负责企业信息爬取和页面内容的提取分析，负责各类反爬机制； 2.研究爬虫策略和防频率规则； 3.负责协助项目经理进行技术评测，bug处理，代码开发； 4.负责网站数据库、栏目、程序模块的设计与开发； 5.负责根据公司要求进行crm系统迭代开发； 6.熟悉工商信息网、企查查、爱企查其中之一平台的API接口开发与维护；任职资格： 1、本科及以上学历，有5年以上python爬虫工作经验 2、良好的代码习惯，结构清晰、命名规范、逻辑性强、代码冗余率低； 3、熟悉Mysql，有较为熟练地掌握mysql语言及编写存储过程、触发器等数据库开发的能力；福利待遇：带薪年假每年调薪五险一金福利体检节日福利年终绩效团建旅游文体协会季度之星内推奖励园区食堂周年礼品学历补贴：在职研补贴5万学费工作时间:8:30-18:00，午休12:00-14:00
爬虫开发工程师
[深圳·大冲] 2025-11-10

12k-16k 经验1-3年 / 本科

井田云

移动互联网,电商 / 不需要融资 / 15-50人

岗位职责 ● 根据业务需求开发网页爬虫 ● 对爬取的数据进行标注与清洗 ● 负责爬虫项目的部署与运维任职要求 1. 技术能力 ● 熟练掌握 Python/PHP，具备扎实的编程基础与数据结构知识 ● 熟悉 HTTP/HTTPS 协议、TCP/IP 网络模型，能使用抓包工具（如 Charles、Fiddler）分析请求 ● 熟悉 PostgreSQL/Mysql 数据库开发，掌握 SQL 优化与索引设计 ● 熟悉 Scrapy、Selenium、Playwright 等框架，了解分布式爬虫框架（如 Scrapy-Redis） 2. 经验要求 ● 1 年以上爬虫开发经验，有海外社媒类数据抓取项目经验者优先 3. 其他要求 ● ***本科及以上学历 ● 通过 CET-4 或以上英语等级认证加分项 ● 了解前端技术（HTML/CSS/JavaScript），能逆向分析动态渲染页面 ● 熟悉常见反爬措施（如 JS 混淆、验证码识别、IP 限频），具备实战对抗经验
网站爬虫工程师
[深圳·大冲] 2025-11-10

12k-16k 经验1-3年 / 本科

井田云

移动互联网,电商 / 不需要融资 / 15-50人

岗位职责 ● 根据业务需求开发网页爬虫 ● 对爬取的数据进行标注与清洗 ● 负责爬虫项目的部署与运维任职要求 1. 技术能力 ● 熟练掌握 Python/PHP，具备扎实的编程基础与数据结构知识 ● 熟悉 HTTP/HTTPS 协议、TCP/IP 网络模型，能使用抓包工具（如 Charles、Fiddler）分析请求 ● 熟悉 PostgreSQL/Mysql 数据库开发，掌握 SQL 优化与索引设计 ● 熟悉 Scrapy、Selenium、Playwright 等框架，了解分布式爬虫框架（如 Scrapy-Redis） 2. 经验要求 ● 1 年以上爬虫开发经验，有海外社媒类数据抓取项目经验者优先 3. 其他要求 ● ***本科及以上学历 ● 通过 CET-4 或以上英语等级认证加分项 ● 了解前端技术（HTML/CSS/JavaScript），能逆向分析动态渲染页面 ● 熟悉常见反爬措施（如 JS 混淆、验证码识别、IP 限频），具备实战对抗经验
平台爬虫配置（数据源方向）
[杭州·下沙] 2025-10-27

8k-12k 经验1-3年 / 本科

恒生聚源

金融,数据服务 / A轮 / 500-2000人

工作职责： 1、数据源管理：负责公司数据源的发现、评估、接入、分类和维护工作，建立数据源档案。进行市场数据源的调研、收集和测试，拓展获取渠道。 2、爬虫开发配置：在采集系统中使用Groovy等脚本语言编写网络爬虫脚本，实现数据源采集。 3、任务运维：负责爬虫任务的日常监控、维护和故障排查，确保数据采集的及时性和准确性。 4、文档编写：撰写数据采集流程、配置模板文档和运维手册。任职要求： 1、熟悉网页前端技术（HTML/CSS/JavaScript），能使用开发者工具进行元素定位和数据提取。 2、具备Groovy等脚本语言的编写能力，熟悉WebMagic爬虫框架，能够进行任务配置和自动化。 3、了解HTTP/HTTPS协议的基本原理。 4、积极好学，有自驱力，对数据和技术有好奇心，主动学习并解决问题。 5、责任心强，对源数据质量和任务稳定性负责。 6、具备良好的沟通能力，能与其他团队有效协作。加分项： 1、有数据中心、大数据或数据中台相关业务经验，理解数据采集在业务中的价值。 2、接触过常用的数据采集平台或调度系统，有实际的网络爬虫项目经验。 3、熟练掌握正则表达式、XPath、JSON等数据解析方法。
高级爬虫工程师/爬虫主管
[广州·新塘] 2025-10-23

18k-30k 经验3-5年 / 大专

汇睿

/ 不需要融资 / 150-500人

【职位描述】 1. 负责设计开发针对主流海外电商平台的大规模数据采集系统，支持商品信息、价格监控、竞品分析等业务需求。 2. 构建和维护分布式浏览器集群，实现千级并发的稳定数据抓取，处理复杂的SPA应用和动态内容渲染。 3. 研究海外电商平台的反爬机制（如Cloudflare、PerimeterX、DataDome），制定针对性的反反爬策略，包括设备指纹伪造、TLS指纹处理、行为模拟等。 4. 确保数据采集符合GDPR、CCPA等国际数据保**规，处理多语言、多货币、多时区的复杂数据场景。 5. 优化浏览器资源使用，实现成本可控的大规模部署，包括资源池管理、任务调度优化、异常恢复机制等。【任职要求】 1. 3年以上海外电商爬虫经验，具备至少5个主流海外电商平台的数据采集项目经验，深度了解各平台的技术架构和反爬策略。 2. 大规模浏览器自动化经验：有管理500+浏览器实例的实战经验，熟练掌握Playwright、Puppeteer、Selenium Grid等工具的集群化部署。 3. 精通现代反爬对抗技术：浏览器指纹伪造（Canvas、WebGL、Audio等）、TLS/JA3指纹处理和规避、验证码自动化处理（reCAPTCHA、hCaptcha、Funcaptcha）、WAF绕过策略（Cloudflare 5s盾、BotFight Mode）。 4. 编程语言：精通Python，熟悉JavaScript/TypeScript（用于浏览器脚本开发）。 5. 框架和工具：熟练使用浏览器自动化框架（Playwright、Puppeteer、Selenium 4.0+）、代理管理（住宅代理、数据中心代理轮换策略）、容器化部署（Docker、Kubernetes环境下的浏览器集群管理）。 6. 分布式系统经验：熟悉Redis、RabbitMQ、Kafka等中间件，有构建分布式任务调度系统经验。 7. 独立完成过至少3个海外电商大型项目，单项目日均数据量100万+条，涉及多平台、多地区的复杂数据采集需求。 8. 成本控制能力：有控制单条数据采集成本的实战经验，熟悉云服务器成本优化策略。【加分项】 1. 移动端数据采集：Android/iOS App数据采集经验，熟悉Frida、Xposed等Hook技术。 2. 协议层面突破：GraphQL API逆向分析、gRPC/protobuf协议解析、WebSocket实时数据采集。 3. AI辅助技术：机器学习模型应用于验证码识别、异常检测和自动化问题诊断、智能化反爬策略调整。 4. 海外电商业务理解：熟悉跨境电商运营模式、了解各平台的商业规则和数据价值点。
爬虫工程师
[重庆·渝中区] 2025-10-21

5k-9k 经验1-3年 / 大专

重庆云上航空票务股份有限公司

电商,旅游 / 未融资 / 150-500人

1.负责垂直领域的定向爬虫引擎开发优化工作 2.负责HTTP、AJAX等各类网络请求分析 3.通过爬虫定向抓取数据和解析、抽取、去重、清洗和存储 4.根据应用场景封装服务接口给内部团队调用 5.负责反封禁的研究提升爬虫抓取效率和质量任职要求 1、深入理解网络数据抓取的工作原理与工作流程； 2、熟悉HTML、DOM、XPATH，熟练使用正则表达式； 3、擅长分析HTTP协议，能够解析、模拟HTTP传输的报文 4、掌握HTTP相关调试、分析工具，能够对网页、APP数据抓包（有手机APP脱壳、反编译能力优先考虑） 5、精通Python/C#/Java等编程； 6、一年以上大规模网页爬虫开发经验，熟练使用关系数据库(如MySQL, MSSQLsql)或NoSql数据库(如Mongodb及Redis)； 7、具备独立的破解各类网站封禁及各类验证码的能力，有多线程、分布式、网络数据抓取及处理经验优先； 8、熟练使用开源技术以及框架（Nutch、Scrapy、Heritrix等）者优先； 9、熟悉Unix/Linux操作系统者优先； 10、有良好逻辑思维能力、沟通能力、团队合作精神、学习能力，抗压能力，目标执行力，对挑战性问题充满激情。
爬虫工程师
[上海·静安区] 2025-10-15

35k-70k·15薪经验3-5年 / 本科

华尔街见闻

金融,移动互联网 / B轮 / 150-500人

工作职责负责 X / Twitter等平台相关数据的采集与处理，包括用户数据、推文、互动数据等；搭建高效、稳定的爬虫系统，解决登录、接口调用、反爬机制等难点；优化数据采集流程，保障采集结果的完整性与实时性；对采集数据进行清洗、存储和结构化处理，建立高可用数据接口；与数据分析、产品团队合作，提供高质量的海外社交数据支持。任职要求本科及以上学历，计算机相关专业优先（qs前200的本科毕业）； 3 年以上 Web 爬虫 / 数据采集相关经验；精通 Python，熟悉 Scrapy / Requests / Selenium / Playwright 等爬虫框架；熟悉代理池、分布式爬虫、反爬机制应对；熟悉 MySQL / Redis / Kafka / Elasticsearch 等常见数据库与中间件；有海外社交平台（X / Twitter、Reddit、Telegram 等）爬虫经验者优先；注重代码规范，能独立解决复杂采集与反爬问题。工作地：上海/香港（可沟通）
爬虫工程师
[深圳·龙华区] 2025-09-25

12k-15k 经验1-3年 / 本科

大方无隅

工具 / 未融资 / 15-50人

岗位职责： 1、需求分析与方案设计：与业务团队紧密合作，理解数据采集的具体需求，包括数据类型、采集频率、目标平台等，并设计合理的手机群控数据采集方案，包括设备配置、脚本编写、任务调度等。 2、脚本开发与配置群控系统：使用Python、Java等编程语言编写数据采集脚本，实现自动化操作，搭建配置并维护手机群控系统，确保设备稳定运行，网络连接畅通。 3、数据监控与异常处理：实时监控数据采集过程，及时发现并处理异常情况，如设备故障、网络中断等，对采集到的数据进行初步清洗与校验，确保数据质量。 4、合规和隐私保护：严格遵守相关法律法规，确保数据采集活动的合法性与合规性。任职要求： 1、熟练掌握Python、Java等至少一种编程语言。 2、熟悉Android或iOS操作系统，了解移动应用开发基础。 3、有JD、TB、PDD、MT等主流电商平台采集经验。 4、了解数据库基础，能够使用SQL进行数据查询与处理。 5、具备良好的逻辑思维与问题解决能力，能够迅速定位并解决技术难题。
高级爬虫工程师
[杭州·余杭区] 2025-09-15

18k-25k 经验3-5年 / 本科

飞通技术

企业服务 / 不需要融资 / 15-50人

1.负责公司旗下大数据平台数据采集，入库 2.攻破各种反爬策略，快速解决各类技术疑难问题，建设反爬对抗组件库 3.实时监控爬虫的进度和警报反馈
爬虫工程师
[深圳·西丽] 2025-08-08

11k-18k 经验不限 / 大专

威胁猎人

信息安全 / A轮 / 50-150人

岗位职责： 1、负责数据的采集与爬取、解析处理、入库等数据日常工作； 2、参与爬虫系统的数据抓取架构设计与开发 3、设计爬取、调度和抽取算法，优化系统岗位要求: 1、熟练掌握python语言，有使用python写过爬虫经验者更佳； 2、了解scrapy或其他爬虫框架，熟悉网页抓取原理； 3、熟悉正则表达式、xpath（或Beautiful Soup4），能够从结构化和非结构化的数据中获取信息； 4、熟悉Linux，熟悉至少一种主流数据库，如Mysql、MongoDB、redis等； 5、良好的沟通和团队合作能力，主动的学习意愿和良好的学习习惯，认真负责的工作态度； 6、有强大的抗压能力及独立快速解决问题的能力。