首页
职位
公司
校园招聘
课程
new
APP
登录
|
注册
进入企业版
爬虫工程师
30k-50k·14薪
深圳
经验3-5年
本科及以上
后端工程师
岗位所属职位类型
全职
Golang
软件服务|咨询
爬虫经验
Python
博瑞捷
举报职位
分享到微信
微信扫一扫,用小程序打开分享
收藏
立即沟通
完善在线简历
上传附件简历
职位诱惑:
餐补、交通补、定期体检
职位描述:
岗位职责
1.负责设计、开发和维护内容平台所需的分布式爬虫系统,支持从新闻、论坛、社交媒体等多渠道抓取海量数据并进行清洗、结构化和入库。
2.构建完整的数据采集与处理流程,包括网页解析、数据清洗、去重和入库等环节,确保采集数据的质量、准确性与一致性。
3.研究并应对各类反爬虫机制(如IP封禁、验证码、动态加载等),设计并实施反屏蔽策略,保证爬虫系统在复杂环境下稳定、高效运行。
4.搭建爬虫任务的监控与调度系统,实时跟踪抓取进度及性能指标,及时定位并修复抓取失败、异常或性能瓶颈等问题,持续优化爬虫效率和容错能力。
5.根据业务需求完成技术方案和系统设计,并撰写维护爬虫系统的技术文档,以支持内容分析和业务决策。
任职要求
1.精通 Golang 和 Python 编程语言,熟悉主流爬虫开发框架(如 Colly、Scrapy 等),具备较强的爬虫系统开发和维护能力。
2.具有分布式爬虫架构的设计与部署经验,能够搭建和运维分布式爬虫集群以应对海量抓取任务。
3.熟悉常见的数据处理流程,包括数据清洗、结构化及入库等,能够保证抓取数据的准确性和一致性。
4.熟练使用 Linux 操作系统及常用命令,了解自动化部署和运维流程(如 Docker、Shell 脚本等),具备独立调试和排错能力。
5.熟悉爬虫监控和任务调度工具,具备性能优化及容错设计能力,能够保证爬虫任务的高效稳定执行。
6.熟练掌握 MySQL 等关系型数据库,以及 MongoDB、Redis、Elasticsearch 等至少一种 NoSQL 存储技术。
7.熟悉代理池管理及 IP 轮换策略,能够有效应对 IP 封禁、请求限频等常见反爬虫问题。
8.具备一定的逆向工程能力,了解常见 JavaScript 混淆、接口加密方案和验证码破解技术,能够通过逆向分析提升爬取成功率。
9.理解常见的爬虫数据提取算法和反反爬策略,具备一定的算法能力,以优化数据抓取和解析效率
加分项
1.参与过海外社交项目优先
2.有过大型项目架构的优先
3.有相关开源项目的优先考虑
工作地址
深圳
-
南山区
-
大冲
- 讯美科技广场
查看地图
职位发布者:
郭平
对我发布的职位感兴趣?用拉勾APP扫码,直接和我聊聊吧!
人事HR
今日活跃
拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
该职位尚未收到面试评价
,看看该公司
其他职位的面试评价
展开
推荐公司:
量方测绘
中高通
正新鸡排
瀛运
富地捷
京闽隆
融创毅达
黄江茂兴
苏宁易达
鸿诣电子
星际通联
苏宁易购
法泉信息
追视
艾乐宁
天润华
众联恒业
汇泽时代
亮则石油
艺禄清韵
职场百科:
法学专业可以从事哪些职业
八种情况表明你该辞职了
试用期离职时候大忌
hrd是什么岗位
mcn机构是什么意思
领导暗示你走人的表现
个人离职申请 简短
面试后怎么问面试结果
企业面试自我介绍怎么说
董秘工作职责有哪些
热门职位:
交互设计总监招聘
产品运营招聘
美术设计师(2D/3D)招聘
前台招聘
单片机招聘
Delphi招聘
数据产品经理招聘
JavaScript招聘
其他销售招聘
公关总监招聘
武汉猎头公司 招聘
宏房网 招聘
在家求职 招聘
厦门国际货柜码头 招聘
杨蓓 招聘
中博生物 招聘
集成电路版图设计 招聘
显卡是干嘛的 招聘
重庆数据 招聘
课长 招聘
苏州保利大剧院 招聘
新欧洲 招聘
益阳万达广场 招聘
什么是中国舞 招聘
珠海方正 招聘
方正证券招聘 招聘
浙江中力机械有限公司 招聘
镇江万科 招聘
绵阳人才网 招聘
a网招聘
博瑞捷
软件服务|咨询
领域
未融资
发展阶段
15-50人
规模
https://www.lagou.com/gon...
公司主页
相似职位