-
公司位于佛山乐从新城世纪莲地铁广佛线,交通便利。请确定考虑到佛山发展再聊,谢谢! 兼职也可以 1爬虫框架与工具 熟练掌握 Scrapy、Pyspider 等主流框架,能够搭建分布式爬虫系统 熟悉 Selenium、PhantomJS 等自动化工具,应对动态渲染页面和反爬机制 2反爬对抗与逆向技术 具备验证码破解、JS逆向、APP逆向(如 Frida、Xposed)APP脱壳等实战经验 熟悉抓包工具(Charles、Fiddler)和协议分析(HTTP/HTTPS、WebSocket) 3数据处理与存储 精通数据清洗、结构化提取技术(如 XPath、BeautifulSoup),熟练使用 Pandas、NumPy 处理海量数据 掌握 MySQL、MongoDB、Redis 等数据库,具备调优及高并发存储经验 4系统架构与性能优化 熟悉分布式架构(如 Kubernetes、Docker Swarm),能够设计高可用、高性能的爬虫系统 具备实时监控、预警处理及日志分析能力,保障爬虫稳定性 通用技术要求 1编程基础 扎实的 Python 开发能力,熟悉多线程、异步编程及设计模式 了解其他语言(如 Java、JavaScript)及前端框架(Vue、React)为加分项 2运维与工程化 熟练使用 Linux 环境,掌握 Docker、Kubernetes 容器化技术 熟悉云服务(AWS、阿里云)及 DevOps 工具链(CI/CD) 交通便利,公司楼下就是地铁广佛线世纪莲地铁站
-
1、精通python语言,精通scrapy爬虫框架; 2、 精通web抓取原理及技术,从结构化和非机构化数据中获取信息; 3. 精通Html、JavaScript、XML等知识,熟悉前端异步请求方式; 4、精通自动化测试工具; 5、 熟悉一种或多种开源技术; 6、 具备一定的数据挖掘能力; 任职要求: 1、 负责为各个业务线提供垂直,精准的数据采集,抽取,存储服务 2、 设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量 3、 解决网页抓取,信息抽取等问题,构建高可用性,高扩展性网络信息采集平台 4、 能独立解决实际开发过程碰到的各类问题
-
岗位职责: 1.负责网络爬虫系统平台的架构设计与开发(如抓取调度,多样化抓取,页面解析和结构化抽取),技术选型; 2.研究爬虫策略和防屏蔽规则,解决封账号,封IP,验证码,混淆加密,页面跳转等难点攻克,提升网页抓取效率和质量。 任职要求: 1.熟练掌握Python语言,有良好的编码习惯。 2.熟悉HTML,JavaScript,xpath,css selector,熟悉HTTP协议;熟悉WebDriver,phantomjs等工具; 3.掌握网页抓取原理及技术,了解基于Cookie的登录原理,熟悉基于正则表达式、XPath、CSS等网页信息抽取技术;有解决封账号、封IP、网页抓取、信息抽取等问题的经验 4.熟悉mysql,redis,mongodb,ES等数据库,以及对应数据的抽取入库等; 5.熟悉正则表达式、Xpath等数据提取技术。 6.了解常见的爬虫对抗技巧 7.了解抓包工具、如Fiddler、Charles、Mitmproxy 8.熟悉python web后端框架Django、flask、fastapi其中的一种优先 9.熟悉Linux常用命令、docker容器技术和git技术者优先; 有API对接经验优先 10.能对目前主流网站、APP数据进行抓取,有外贸跨境商城,抖音,小红书爬虫经验者优先。 11.有RPA、手机端自动化、浏览器自动化、PC自动化开发经验的优先 薪资待遇: 8K-13K;****。 上班时间: 上午 : 9:30-12:00;下午 13:30-19:00;
-
岗位职责: 1、维护优化爬虫系统 2、满足公司数据的爬取需求; 3、参与爬虫项目的架构设计、研发、编程工作,改进和提升爬虫效率 岗位要求: 1、2年以上工作经验; 2、深入理解python的常用的爬虫框架; 3、熟悉正则表达式、xpath、css、html等网页相关基础知识,具有一定的web逆向能力; 4、熟悉MySQL、Redis数据库; 5、熟悉Flask接口编写 6、有参与研发爬虫中台经验优先。
-
【工作职责】 1.根据公司项目要求完成模块详细设计和编码实现; 2.保证项目系统的高性能和高可用以及代码质量和维护性; 3.落实承接项目相关技术文档的整理和维护。 【任职要求】 1.2年以上网络相关开发工作经验; 2.了解大语言模型的网络架构,熟悉glm、百川等开源性项目; 3.较强的编码能力,熟悉Python 开发语言、Linux 操作系统和 Docker 工具链; 4.具备较强独立分析、解决问题的能力,能够承受较大的工作压力,学习沟通能力强,具有团队合作精神和创新意识,乐于接受技术革新,保持技术更迭; 5.具备良好的客户服务意识及团队协作精神。
-
【工作职责】 1.根据公司项目要求完成模块详细设计和编码实现; 2.保证项目系统的高性能和高可用以及代码质量和维护性; 3.落实承接项目相关技术文档的整理和维护。 【任职要求】 1.2年以上网络相关开发工作经验; 2.了解大语言模型的网络架构,熟悉glm、百川等开源性项目; 3.较强的编码能力,熟悉Python 开发语言、Linux 操作系统和 Docker 工具链; 4.具备较强独立分析、解决问题的能力,能够承受较大的工作压力,学习沟通能力强,具有团队合作精神和创新意识,乐于接受技术革新,保持技术更迭; 5.具备良好的客户服务意识及团队协作精神。
-
网络信息安全,爬虫,攻防,全栈技术工程师
-
任职要求: 1. 本科及以上学历 2. 有Python爬虫相关经验,有web端JS逆向经验,熟练使用Scrapy框架 3. 熟悉HTML、XPath、正则表达式、AJAX、HTTP协议等 4. 熟悉MySQL、NoSQL等,了解Git版本管理工具 5. 熟悉分布式爬虫以及各种抓包工具 6. 熟悉消息队列,如rabbitmq,kafka等 加分项: 1. 有GUI工具pyqt开发经验 2. 有app逆向开发经验,熟悉ast,frida,objection,能够独立逆向小程序,app等 3. 有爬虫平台相关开发经验,如xxljob等
-
app逆向,网站爬虫,app爬虫。看个人工作经验。
-
特别提醒:人不在深圳的不要随便投递简历。谢谢。 1、负责业务端数据稳定抓取、存储; 2、沟通产品需求,建立机器学习模型并不断优化 3、能够独立完成系统模块开发; 4 年及以上实际开发经验,精通python语言开发,同时掌握其他语言优先; 5、精通爬虫和反爬技术,精通http底层协议,linux基本命令;精通深度抓取、动态网页技术抓取、浏览器模拟抓取、APP抓取等技术; 6、熟练使用mysql数据库、ES集群、redis、js逆向、正则提取; 7、熟悉机器学习,了解深度学习框架,有实际开发者优先; 8、有开发爬虫框架经验优先,熟悉反爬虫、验证码识别技术者优先; 9、逻辑清晰,专注技术有追求有热情,良好的团队合作精神及学习能力;
-
工作职责: 1、独立负责网络爬虫系统的设计与开发; 2、负责和业务沟通抓取需求,满足业务的发展需要; 3、负责大数据产品所需网站的信息抓取、解析、清洗等研发与优化工作; 任职要求: 1. 计算机或相关专业,本科及以上学历; 2. 熟悉软件工程,熟悉常用数据结构和算法; 3. 熟悉Python语言 、掌握爬虫框架scrapy , 熟悉分布式爬虫管理框架Gerapy, 爬虫管理scrapyd ,分布式爬虫scrapy-redis 4. 熟悉Linux操作系统以及shell脚本; 5. 熟悉HTML,JavaScript,xpath,css selector,熟悉HTTP协议; 6. 英语水平达到CET6或以上; 7. 工作细心,认真负责,具备较强的学习能力; 8.了解Git版本管理工具。
-
岗位职责: 1、与业务团队沟通,明确爬虫项目的目标和需求,确定要抓取的数据范围、格式和用途,为产品业务提供数据支持。 2、编写高效、稳定的 Python 爬虫代码,挖掘并整合外部第三方数据,并对抓取到的数据进行的清洗和整理,增强数据分析的广度与深度; 3、优化爬虫程序的性能,提高抓取速度和效率; 4、建立和完善公司内部的知识图谱体系,提高数据的可访问性和价值。 任职资格: 1、**本科及以上,数学、统计学、计算机科学等相关专业优先,拥有5年以上金融或科技行业的相关工作经验。 2、精通python语言,具备扎实的编程功底,具有良好的程序设计能力; 3、精通爬虫原理,精通Scrapy、pyspider等主流爬虫框架框架;具有RPA项目经验; 4、精通常用的反扒技术,对互联网各种类型数据交互模式熟悉,知道如何处理需登录网站、动态网页等各种情况下的数据采集方法。 5、熟悉常见ip限制、滑块、UA限制、验证码反爬、登录限制、headers认证和cookie限制等反爬套路及破解方法,且有实际经验; 6、熟练使用MySQL、MongoDB,熟悉Hadoop、ElasticSearch等技术; 7、熟练使用Pandas, NumPy等进行数据清洗、处理,提供数据服务以及数据管理; 8、能独立完成爬虫系统的搭建和运维。
-
职位描述 1、负责攻克高难度的反爬,诸如人机识别、JS逆向、Android逆向等 2、负责开发及维护超大规模站点,深入挖掘站点有价值的数据 3、参与爬虫通用组件、工具、系统的设计开发 职位要求 1、3年以上爬虫工作经验 2、具备丰富的Python爬虫经验,熟悉JS逆向、Android逆向,有攻克高难度站点经验 3、具备扎实的技术基础,如常见的网络协议、Linux操作系统、常用数据库等,可以独立分析解决新出现的技术问题 4、缜密的逻辑思维能力,热爱技术,喜欢钻研,注重代码质量 5、对前后端开发熟悉加分
-
【我们需要您】 We Need U 1、负责广告产品后台服务的设计、开发、优化等研发工作,保证产品的质量和开发进度; 2、负责其他相关技术的设计与实现。 3、研究新兴技术,对产品进行持续优化。 【我们希望您】We Want U 1.三年及以上后端/算法工程/系统工程相关开发经验; 2. 开发语⾔以Python为主,熟练掌握至少其中一门语言(Python/Golang/C/C++); 3.有大型网站数据爬取经验优先,熟悉K8s/Docker技术优先; 4.熟悉Pytorch深度学习框架优先; 5.有大规模分布式服务器架构经验优先。 6.有跨境电商ERP平台广告经验。 7. 分析总结采集到的数据,对数据进行有效分类、汇总和提炼,制定相关数据分析报告; 【我们提供给您】We Offer U 薪资待遇:提供市场具有竞争力的薪资待遇 薪资结构:基本工资+绩效奖金+提成 基础保障: 1、工作时间:大小周 上午9:30-12:00 下午13:30-18:30(小周推迟及提前半小时上下班),法定节假日正常休息; 2、全勤奖,入职即享受买五险一金; 3、除法定节假日之外,还有福利假、年假、带薪病假等。 升级福利: 1、各类传统节日有精美礼品福利; 2、定期举办员工生日party/下午茶活动; 3、超19:30下班享生活补贴; 4、不定期团建活动、下午茶,劳逸结合; 5、年度调薪。
-
公司简介: 《消费者报道》杂志社创建于1998年,是中国内地率先采用商品和服务对比测评、研究商品评价体系的专业机构,多年来专注并坚持在市场消费现象、行业服务及消费维权方面进行深入的研究、分析和应用,持续向公众传播科学消费与责任消费的理念,目前已形成全媒体、研究中心、数据中心三位一体的调研架构,为政府部门、社会组织、企业和消费者提供全面、科学、权威的调研和资讯服务。这里很纯粹,就是做事的地方——我们热衷于解决问题。 正选数据中心是消费者报道旗下独立事业部。2018年起,团队吸收了来自广东省重点电子政务项目“粤省事”、“营商环境”的技术骨干,专注于研发面向各行业垂直领域的大数据、算法、应用软件产品,先后研发上线了产品质量监测与分析系统、企业信用风险模型管理系统、企业生产销售产品库等,在各领域已逐步实现常态化、主题化、智能化的数据应用场景。本次python爬虫工程师岗位为正选数据中心招聘岗位。 正选数据官网:https://www.ccrdata.cn/ 岗位职责: 1、负责分布式网络数据采集系统及数据库的设计与开发; 2、设计数据采集策略和防屏蔽规则,解决封账号、封IP、验证码等技术问题; 3、维护和优化已有数据采集服务; 4、负责数据采集服务核心算法的策略优化研究,充分利用资源,提升网页抓取的效率和质量。 6、与团队其他人员高效沟通合作完成团队目标; 7、完成上级交办的其他工作任务。 任职要求: 1、大专及以上学历,2年及以上工作经验,计算机软件相关专业,具有扎实的操作系统、网络、数据库相关基础知识; 2、熟练掌握python多进程、多线程、协程、网络编程; 3、熟悉Linux操作系统,熟练使用常用命令;熟练掌握MySQL、MongDB、Redis开发经验者优先; 4、精通网页抓取原理及技术、深度抓取、动态网页技术抓取、浏览器模拟抓取技术,从结构化的和非结构化的数据中获取信息;熟悉Scrapy、Pyppeteer、Selenium、playwright等爬虫框架/工具中的一种或多种; 5、了解常用验证码识别技术,熟悉行为验证码识别、模拟登陆,熟悉各种反爬机制和解决措施; 6、对经手的工作理解深入,有团队观念,具备独立解决问题的能力,善于学习提升。
热门职位


