首页
职位
公司
校园招聘
课程
new
APP
登录
|
注册
进入企业版
爬虫工程师
30k-50k·14薪
深圳
经验3-5年
本科及以上
后端工程师
岗位所属职位类型
全职
Golang
软件服务|咨询
爬虫经验
Python
博瑞捷
举报职位
分享到微信
微信扫一扫,用小程序打开分享
收藏
立即沟通
完善在线简历
上传附件简历
职位诱惑:
餐补、交通补、定期体检
职位描述:
岗位职责
1.负责设计、开发和维护内容平台所需的分布式爬虫系统,支持从新闻、论坛、社交媒体等多渠道抓取海量数据并进行清洗、结构化和入库。
2.构建完整的数据采集与处理流程,包括网页解析、数据清洗、去重和入库等环节,确保采集数据的质量、准确性与一致性。
3.研究并应对各类反爬虫机制(如IP封禁、验证码、动态加载等),设计并实施反屏蔽策略,保证爬虫系统在复杂环境下稳定、高效运行。
4.搭建爬虫任务的监控与调度系统,实时跟踪抓取进度及性能指标,及时定位并修复抓取失败、异常或性能瓶颈等问题,持续优化爬虫效率和容错能力。
5.根据业务需求完成技术方案和系统设计,并撰写维护爬虫系统的技术文档,以支持内容分析和业务决策。
任职要求
1.精通 Golang 和 Python 编程语言,熟悉主流爬虫开发框架(如 Colly、Scrapy 等),具备较强的爬虫系统开发和维护能力。
2.具有分布式爬虫架构的设计与部署经验,能够搭建和运维分布式爬虫集群以应对海量抓取任务。
3.熟悉常见的数据处理流程,包括数据清洗、结构化及入库等,能够保证抓取数据的准确性和一致性。
4.熟练使用 Linux 操作系统及常用命令,了解自动化部署和运维流程(如 Docker、Shell 脚本等),具备独立调试和排错能力。
5.熟悉爬虫监控和任务调度工具,具备性能优化及容错设计能力,能够保证爬虫任务的高效稳定执行。
6.熟练掌握 MySQL 等关系型数据库,以及 MongoDB、Redis、Elasticsearch 等至少一种 NoSQL 存储技术。
7.熟悉代理池管理及 IP 轮换策略,能够有效应对 IP 封禁、请求限频等常见反爬虫问题。
8.具备一定的逆向工程能力,了解常见 JavaScript 混淆、接口加密方案和验证码破解技术,能够通过逆向分析提升爬取成功率。
9.理解常见的爬虫数据提取算法和反反爬策略,具备一定的算法能力,以优化数据抓取和解析效率
加分项
1.参与过海外社交项目优先
2.有过大型项目架构的优先
3.有相关开源项目的优先考虑
工作地址
深圳
-
南山区
-
大冲
- 讯美科技广场
查看地图
职位发布者:
郭平
对我发布的职位感兴趣?用拉勾APP扫码,直接和我聊聊吧!
人事HR
今日活跃
拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
该职位尚未收到面试评价
,看看该公司
其他职位的面试评价
展开
推荐公司:
昌鼎运通
顺丰驿站
世华
富盛
量方测绘
京驰国通
瀛运
龙泰信
融创毅达
黄江茂兴
印岚广告
东方蓝天
鸿诣电子
星际通联
法泉信息
绿芝麻
维刚创新
艾佳蒂
轸怡智能
众联恒业
汇泽时代
亮则石油
职场百科:
法学专业可以从事哪些职业
八种情况表明你该辞职了
试用期离职时候大忌
hrd是什么岗位
mcn机构是什么意思
领导暗示你走人的表现
个人离职申请 简短
面试后怎么问面试结果
企业面试自我介绍怎么说
董秘工作职责有哪些
热门职位:
游戏文案招聘
U3D招聘
游戏动作招聘
品牌策划招聘
电话销售招聘
游戏主播招聘
游戏动画招聘
售后客服招聘
风控招聘
BI工程师招聘
EAI 招聘
秀品科技 招聘
安恒 交割管理主管
企划 课程顾问到手6K以上不加班
专利代理 手游数值策划
好时 数据质量管理岗
厦门智联招聘北京
蔚来招聘北京
直聘网 北京
中国云签 北京
南昌招聘网
六盘水招聘
中国招聘网站
电气自动化招聘
店内销售
前台设计工程师
家装行业企划主管
内容编辑运营专员
云计算Java
19号公路俱乐部
博瑞捷
软件服务|咨询
领域
未融资
发展阶段
15-50人
规模
https://www.lagou.com/gon...
公司主页
相似职位