python爬虫开发工程师16k-18k

杭州经验3-5年本科及以上后端工程师
岗位所属职位类型
全职

  • APP
  • 爬虫经验
  • IT技术服务|咨询
  • 数据服务|咨询
  • Python
恒生聚源
分享到微信
微信扫一扫,用小程序打开分享
职位诱惑:

TOB金融行业领头公司

职位描述:

岗位描述
1.构建并优化大规模分布式数据采集系统,协助建设统一的数据采集、处理、查询、治理平台。
2.负责多渠道、多平台的各类数据源抓取,持续提升数据质量,包括数据时效性和完整性。
3.研究并分析目标站点/平台的反爬机制,设计策略规避限制;制定反爬策略,包括IP池、账号池、验证码识别等,并持续优化策略。
4.建立爬虫数据质量监控和应急响应机制,发现并解决数据采集中的异常情况(如数据缺失、重复、错误),确保采集的数据符合业务需求和质量标准,确保业务连续性。

岗位要求
1.3年及以上爬虫开发经验,本科及以上学历。
2.熟练使用Python,具备良好的编码和调试能力,具备扎实的计算机网络基础知识,了解HTTP协议和相关技术。
3.熟悉常见的爬虫框架,如Scrapy、feapder等;熟悉常用的消息组件和数据存储工具,如RabbitMQ、Kafka、MySQL、Redis、MongoDB等。
4.熟悉APP逆向,熟练使用抓包、反编译、Hook工具等,具备APP端数据抓取经验。
5.熟悉JS逆向,熟悉WEB常用反爬技术,具备通用网站数据爬取及解析经验。
6.具备良好的团队沟通能力、较强的问题解决能力和学习能力,能够独立思考和解决技术难题。

加分项
1.了解并使用过AI相关技术,有大模型采集框架使用经验的优先。
2.有通用、高效、稳定的分布式采集系统设计和开发经验的优先。

附加信息:

  • 工作时间:周末双休

面试信息:

  • 面试方式到场面试

工作地址

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    专业性很强。
    (0)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    先是笔试,在一面,在二面,然后就是offer。笔试的题目考的范围很宽,有算法,有逻辑,有数据结构,也有数据库。难度适中。初面是群面,首先是自我介绍,然后就是几个简单的问题,抢答。然后就是回去等通知。复试时单面,二对一。也是自我介绍,然后就是项目中的相关问题。目前还在等待过程中。
    (0)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    一轮笔试,两轮面试,终面技术总监。笔试,面试难度都不大,保持自信即可。会问一些在学校做过的项目,掌握的技术。一轮面试时群面,分别自我介绍并会问一些在校项目。终面见技术总监,技术总监人非常优雅绅士,不会问特别难的,但是会考察你的学习能力和态度。最后和hr面谈。
    (0)
上海恒生聚源数据服务有限公司

恒生聚源

  • 数据服务|咨询

    领域
  • A轮

    发展阶段
  • 第一财经,蚂蚁金服,云汉投资(A轮)

    投资机构
  • 500-2000人

    规模
  • http://www.gildata.com

    公司主页

相似职位