-
职位职责: 1、负责保护公司电商平台的数据安全,防范和打击爬虫及其他恶意行为,研究和掌握最新的反爬虫技术,制定和实施有效的反爬虫策略; 2、深入了解上下游业务形态,可独立发起治理专项,快速定位问题并形成落地策略及效果评估闭环; 3、分析和调查电商平台上的异常流量和可疑活动,从海量设备、行为数据中发掘有价值的信息; 4、可协助进行建模工作,如特征分析、数据可视化呈现等,为团队决策提供数据支持; 5、与产品研发团队高效合作,优化技术架构和端上安全能力,建立端管云三位一体的反爬体系,量化防控效果,驱动反爬能力的不断提高。 职位要求: 1、计算机、信息安全、统计、数学等相关专业; 2、反爬相关经验,具备网络安全、数据保护和风险管理方面的专业知识,有电商经验者优先; 3、熟练掌握SQL、Python等编程语言,具有扎实的数据分析能力及学习能力; 4、深入了解常见的爬虫技术和工具,具有丰富的反爬虫经验,熟悉Web安全、网络协议、漏洞扫描等相关技术; 5、具有较强的问题解决能力,能够快速分析和处理安全事件,具备良好的团队合作精神和沟通能力。
-
职位职责: 1、负责保护公司电商平台的数据安全,防范和打击爬虫及其他恶意行为,研究和掌握最新的反爬虫技术,制定和实施有效的反爬虫策略; 2、深入了解上下游业务形态,可独立发起治理专项,快速定位问题并形成落地策略及效果评估闭环; 3、分析和调查电商平台上的异常流量和可疑活动,从海量设备、行为数据中发掘有价值的信息; 4、可协助进行建模工作,如特征分析、数据可视化呈现等,为团队决策提供数据支持; 5、与产品研发团队高效合作,优化技术架构和端上安全能力,建立端管云三位一体的反爬体系,量化防控效果,驱动反爬能力的不断提高。 职位要求: 1、计算机、信息安全、统计、数学等相关专业; 2、反爬相关经验,具备网络安全、数据保护和风险管理方面的专业知识,有电商经验者优先; 3、熟练掌握SQL、Python等编程语言,具有扎实的数据分析能力及学习能力; 4、深入了解常见的爬虫技术和工具,具有丰富的反爬虫经验,熟悉Web安全、网络协议、漏洞扫描等相关技术; 5、具有较强的问题解决能力,能够快速分析和处理安全事件,具备良好的团队合作精神和沟通能力。
-
工作职责: 负责设计、开发和维护高效、稳定的数据爬虫系统; 根据业务需求,制定数据抓取策略,处理反爬机制、验证码识别、IP代理等问题; 建立数据清洗、结构化处理及存储流程,保证数据质量; 持续优化爬虫性能,提升抓取速度与稳定性; 与数据分析、产品等团队紧密协作,理解数据需求,快速响应数据抓取任务; 关注行业动态,研究新的爬取技术和反爬手段,持续提升系统能力。 任职要求: 熟练掌握至少一种编程语言(Python优先,如:Scrapy、Selenium、Playwright、Requests 等常用库); 熟悉常见网站结构、前端技术(HTML、CSS、JavaScript),能够快速分析网页数据; 熟悉常用的反爬技术及应对手段(如IP代理池、UA池、验证码识别、动态渲染处理等); 熟悉异步爬虫、分布式爬虫开发,有 Scrapy-Redis / Playwright + 分布式实践经验者优先; 熟悉常用数据库(如MySQL、MongoDB)及缓存系统(如Redis); 有大型数据采集、数据清洗、数据处理项目经验优先; 具备良好的编码习惯和文档意识,责任心强,乐于学习新技术。 加分项: 有 GraphQL 接口抓取、WebSocket 抓取、APP 抓包分析经验; 有云原生(如 Kubernetes、Docker)、大数据(如Spark、Kafka)相关技术栈经验; 有参与过爬虫平台化、数据中台建设项目经验; 有算法基础,了解简单的图像识别(如验证码OCR识别)优先。
-
岗位职责 ● 根据业务需求开发网页爬虫 ● 对爬取的数据进行标注与清洗 ● 负责爬虫项目的部署与运维 任职要求 1. 技术能力 ● 熟练掌握 Python/PHP,具备扎实的编程基础与数据结构知识 ● 熟悉 HTTP/HTTPS 协议、TCP/IP 网络模型,能使用抓包工具(如 Charles、Fiddler)分析请求 ● 熟悉 PostgreSQL/Mysql 数据库开发,掌握 SQL 优化与索引设计 ● 熟悉 Scrapy、Selenium、Playwright 等框架,了解分布式爬虫框架(如 Scrapy-Redis) 2. 经验要求 ● 1 年以上爬虫开发经验,有海外社媒类数据抓取项目经验者优先 3. 其他要求 ● ***本科及以上学历 ● 通过 CET-4 或以上英语等级认证 加分项 ● 了解前端技术(HTML/CSS/JavaScript),能逆向分析动态渲染页面 ● 熟悉常见反爬措施(如 JS 混淆、验证码识别、IP 限频),具备实战对抗经验
-
岗位职责: 1.设计和实现复杂的Python应用程序及服务,确保其在Win&Linux上具有高效性和稳定性。 2.熟悉docker,接触过WSL2,可以编排负责内容的CI/CD流程。 3.熟悉爬虫/网络嗅探/抓包。 4.有过图像处理/音视频流媒体项目经验,熟悉opencv&fimpeg。 5.跟踪和研究Python相关技术的最新发展,以提高开发效率和产品质量。 任职要求: 1.具备优秀的团队合作能力和沟通技巧。 2.有过开源项目经历优先,有深度学习项目参与经验优先。 3.能够独立处理和解决技术问题。 4.对Python编程语言有深入的理解和实践经验。 5.有良好的文档撰写能力,能够清晰记录开发过程中的关键点。 6.有大型项目架构设计经验。
-
岗位描述 1.构建并优化大规模分布式数据采集系统,协助建设统一的数据采集、处理、查询、治理平台。 2.负责多渠道、多平台的各类数据源抓取,持续提升数据质量,包括数据时效性和完整性。 3.研究并分析目标站点/平台的反爬机制,设计策略规避限制;制定反爬策略,包括IP池、账号池、验证码识别等,并持续优化策略。 4.建立爬虫数据质量监控和应急响应机制,发现并解决数据采集中的异常情况(如数据缺失、重复、错误),确保采集的数据符合业务需求和质量标准,确保业务连续性。 岗位要求 1.3年及以上爬虫开发经验,本科及以上学历。 2.熟练使用Python,具备良好的编码和调试能力,具备扎实的计算机网络基础知识,了解HTTP协议和相关技术。 3.熟悉常见的爬虫框架,如Scrapy、feapder等;熟悉常用的消息组件和数据存储工具,如RabbitMQ、Kafka、MySQL、Redis、MongoDB等。 4.熟悉APP逆向,熟练使用抓包、反编译、Hook工具等,具备APP端数据抓取经验。 5.熟悉JS逆向,熟悉WEB常用反爬技术,具备通用网站数据爬取及解析经验。 6.具备良好的团队沟通能力、较强的问题解决能力和学习能力,能够独立思考和解决技术难题。 加分项 1.了解并使用过AI相关技术,有大模型采集框架使用经验的优先。 2.有通用、高效、稳定的分布式采集系统设计和开发经验的优先。
-
岗位职责: 1、负责公司产品线的技术栈的选型和完善, 负责关键技术架构和核心模块的开发实现; 2、 参与公司项目的架构设计、研发、编程工作; 3、 设计公司业务执行策略和防屏蔽规则,提升数据抓取执行的效率和质量, 并对策略持续优化; 4、负责架构设计相关的技术攻关。 任职要求: 1、熟悉Python和常用的开源库,熟练使用Django/Flask等至少一种主流的web开发框架; 2、熟悉Mysql,mongoDB, Redis,Es,队列等数据库的使用和优化; 3、对进程、线程、协程、异步、非阻塞有一定了解和使用 4、对linux系统基础知识及原理了解较深入的。 5、熟悉爬虫主流框架Scrapy、requests、Selenium、gocolly,webmagic等框架(深入了解其中一种)。 6、对相关算法有一定了解。 7、熟悉应用IP代理池、Headers认证和Cookie等; 8、有分布式爬虫、反爬机制经验者优先 9、熟悉js逆向,js破解优先考虑 10、有参与实时监控爬虫的进度和警报反馈系统的优先考虑。 11、有参与过相关资讯/新闻与大型分布式爬虫项目的优先考虑
-
职位名称:爬虫工程师 职位描述:正职岗位,需要已经毕业滴 工作安排:大小周 薪资结构:无责底薪*14薪 (无月绩效奖金考核,纯无责化) 工作职责: 1.对部门项目所需的网络数据源进行运用爬虫技术数据抓取: 2.针对互联网上收集的信息进行采集处理,负责信息提取、处理、优化、过滤、审核等工作; 了.按要求做数据抓取前的配置等准备工作:检查网站抓取后是否有遗漏等工作;确保所负责的站点按周期采集及时、全面; 4.完成团队安排的其他工作。 岗位要求: 1.本科及以上学历,计算机/软件工程/数学/通讯/信息工程等相关专业: 2.熟练掌握Python基础知识,熟悉scrapy爬虫框架,有年Pvthon项目或爬电经验者: 3.有一定JS,CSS基础,熟悉XML,HTML语言和 JavaScript等; 4.一定的SQL基础,熟悉主流Mysql,SQL Server等数据库。
-
非杭州伙伴可以线上办公!!! 岗位职责: 1、负责设计、开发、维护爬虫系统; 2、参与多平台信息的抓取和分析; 3、建立完整的数据获取、解析、入库和监控流程,并不断优化迭代完善; 4、设计爬虫反屏蔽规则,提升网页抓取的效率和质量; 5、利用主流的大数据相关技术,对抓取后的网页数据进行清洗、存储等;并持续优化平台,以便满足各种爬取业务需求。 任职资格: 1、熟悉GO或者RUST语言,熟练掌握js反混淆,有实操经验优先; 2、实操过akamai,datadom,cloudflare等国外cdn供应商防护优先; 3、熟悉linux开发环境,熟练掌握java或python编程语言,熟悉js语言; 4、熟悉 web/app 常见的反爬机制,精通各种反爬破解,包括但不限于:Js防护、混淆、逆向分析、App防破解、防逆向、加固技术等技能; 5、有电商类网站爬虫经验优先,有高频爬虫工作经验者优先。
-
非杭州伙伴可以线上办公!!! 岗位职责: 1、负责设计、开发、维护爬虫系统; 2、参与多平台信息的抓取和分析; 3、建立完整的数据获取、解析、入库和监控流程,并不断优化迭代完善; 4、设计爬虫反屏蔽规则,提升网页抓取的效率和质量; 5、利用主流的大数据相关技术,对抓取后的网页数据进行清洗、存储等;并持续优化平台,以便满足各种爬取业务需求。 任职资格: 1、熟悉GO或者RUST语言,熟练掌握js反混淆,有实操经验优先; 2、实操过akamai,datadom,cloudflare等国外cdn供应商防护优先; 3、熟悉linux开发环境,熟练掌握java或python编程语言,熟悉js语言; 4、熟悉 web/app 常见的反爬机制,精通各种反爬破解,包括但不限于:Js防护、混淆、逆向分析、App防破解、防逆向、加固技术等技能; 5、有电商类网站爬虫经验优先,有高频爬虫工作经验者优先。
-
1、负责多平台信息爬取和页面内容的提取分析,负责破解各类反爬机制; 2、负责网页的数据抓取和爬取链路优化(包括逆向分析、脱壳、加密参数破解、抓取攻防等),提升抓取能力; 3、研究爬虫策略和防屏蔽规则,解决封账号、封IP、验证码、页面跳转等难点,提升网页抓取的效率和质量; 岗位要求: 1.3年以上python爬虫经验,专科及以上学历,计算机相关专业,有企业数据经验优先; 2.熟悉掌握至少一种开源爬虫框架(scrapy、appium、selenium等); 3.精通动态网页抓取、浏览器模拟抓取、APP抓取等技术,熟悉使用fiddler或其他抓包工具。; 4.具有js逆向,app逆向相关经验。熟悉js hook原理,熟悉各种反爬风控常见手段; 5.具有团队合作精神,有责任感,对工作认真负责,有较强的协调和沟通能力;
-
岗位职责: 有爬虫相关的背景,熟悉python,web开发,熟悉SQL,有相关的后台开发能力 了解基本的数据处理流程,数据交付流程(BI报表分析) 要求有大数据开发经验的优先,懂得分布式;
-
工作职责: 1、主导和参与爬虫系统的架构设计、开发与优化 2、根据业务诉求,攻克APP、Web、H5等应用并采集相关数据 3、实时监控爬虫任务的执行状况,及时处理爬虫异常,保障采集数据稳定性 任职要求: 1、2年以上爬虫开发经验; 2、熟练掌握python相关的爬虫库和爬虫框架,对redis,rabbimq,kafka等中间件有应用能力 3、熟悉掌握Mysql,Hive开发,具有数仓思维且有一定的开发经验,有丰富的sql的应用能力,必备项; 4、精通JS防护、混淆、逆向分析等技能,熟悉各种浏览器检测/反检测手段,具有丰富的相关能力; 5、近期具有电商平台抓取经验、在App逆向方面有深入研究者优先
-
岗位职责: 1. 负责设计和实施复杂的分布式网络数据采集系统,包括财经及其他相关信息的深度抓取、分析和处理; 2. 研发先进的爬虫策略和防反爬策略,持续优化数据抓取效率和准确性,抵御各类屏蔽和反爬措施; 3. 领导爬虫项目的开发工作,制定和评审技术文档,确保代码质量和系统稳定性; 4. 督导和指导团队成员针对复杂场景进行问题分析和解决,快速定位并修复爬虫系统中的技术难题; 5. 与团队协作,参与新技术调研和前瞻性技术方案的设计,提供技术咨询和支持。 岗位要求: 1. 具备5年以上的爬虫开发经验,深入了解Python和至少一个主流的爬虫框架,如Scrapy、BeautifulSoup等; 2. 精通网络协议,有丰富的模拟请求、浏览器模拟、人机交互对抗、移动App逆向分析、JavaScript/AST解混淆等经验; 3. 有处理大规模数据采集和处理经验的候选人优先考虑; 4. 精通数据结构和算法设计,有解决高并发、数据一致性等复杂技术问题的实战经验; 5. 具有优秀的分析问题和解决问题的能力,能独立作业并具备良好的指导与团队协作精神; 6. 对爬虫技术发展保持持续关注,能快速学习并应用新技术解决实际问题; 7. 具备node.js开发经验以及参与过开源爬虫项目的候选人优先考虑; 8. 强烈的责任心以及扎实的编码规范意识,能够承担项目的核心开发和技术攻关工作。 公司福利: 1、周末双休,国家法定节假日休假,员工带薪年假; 2、试用期开始购买五险一金; 3、公司提供午餐补贴; 4、茶水间饮料零食;节日福利,生日福利; 5、个人评优奖; 6、公司年会活动,抽奖礼物等。
-
任职条件: 1、两年以上相关工作经验,熟悉Python语言,掌握常用的爬虫框架(如Scrapy、Beautiful Soup等)。 2、具备较强的网络编程基础,熟悉HTTP/HTTPS协议及其请求响应流程。 3、了解常见的反爬虫技术及应对方法。 4、具备良好的数据结构和算法知识,能够解决爬取过程中的各种数据处理问题。 5、善于学习、喜欢钻研软件方面的技术,具有较强的抗压能力。 6、学习能力强,能够快速掌握新技术和新工具 7、解决常见的反爬虫问题 工作内容 1、根据需求和设计文档编写爬虫程序,并实现数据爬取、解析、清洗等功能。 2、负责爬虫程序的调试、优化和维护工作,确保数据准确性和稳定性。 3、针对反爬虫机制进行研究和应对,确保爬虫程序的可用性。 4、整合多个数据源并进行数据融合,输出高质量的数据产品。 5、与其他团队(如数据分析、产品、运营等)协作,满足业务需求。 优先项 1,拥有Scrapy爬虫调度、编排经验优先


