python爬虫工程师10k-18k

广州经验1-3年本科及以上爬虫工程师
岗位所属职位类型
全职

  • 软件服务|咨询
  • MySQL
  • Spring
  • 数据服务|咨询
  • Python
  • SQL
博士科技研究院创新数字化平台中心-大数据部
分享到微信
微信扫一扫,用小程序打开分享
职位诱惑:

大数据团队庞大、技术发展前景好

职位描述:

【岗位职责】
1.制定爬虫数据采集规划,包括需求分析、系统设计、应对网站反爬;
2.搭建爬虫系统,选择框架,编写模块,实现自动化数据采集;
3.优化数据解析流程,提高解析质量,设计失败重试机制;
4.优化数据存储和流管道,实现分布式爬虫,提高流量效率;
5.进行数据监控和质量分析,处理爬虫故障,持续优化和迭代爬虫系统;
6.完成上级主管交代的其他工作内容;
【岗位要求】
1.***本科以上学历,且具备3年以上爬虫工作经验;
2.编程语言与爬虫框架及要求:熟练使用Pvthon.Java等语言了解Scrapy、Selenium、BeatifulSoup等爬虫框架的使用;
3.网络协议与爬虫模块:了解HTTP、HTTPS等网络协议,能编写爬虫调度和分发模块;
4.数据解析与提取技术:掌握正则表达式、XPath、JSON、HTML解析等技术;
5.数据库技术:熟悉关系型和非关系型数据库的使用;
6.分布式与流量控制优化:了解消息队列、缓存、分布式等优化数据流技术;
7.Linux与Shell编程:具备Linux操作系统和Shell编程能力;
8.熟悉反爬技术:了解代理、VPN等对反爬技术相关的技术;
9.计算机基础知识:掌握数据结构、算法等计算机基础知知识
10.代码质量与系统优化-具有良好的代码质量和系统优化技能;
11.数据分析与监控:具备基本的数据分析和监控能力。

附加信息:

  • 候选人加分项:自动化爬取经验、站点设置爬取
  • 工作时间:周末双休
  • 上下班时间:09:00-17:30

面试信息:

  • 面试方式到场面试 | 视频面试
  • 补充标签可周末面试 | 可下班后面试 | 包含笔试

工作地址

广州 - 黄埔区- 中国广州人力资源服务产业园14F查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
该职位尚未收到面试评价
广州博士信息技术研究院有限公司

博士科技研究院

  • IT技术服务|咨询,专业服务|咨询,科技金融

    领域
  • 不需要融资

    发展阶段
  • 500-2000人

    规模
  • https://www.lagou.com/gon...

    公司主页

相似职位