python爬虫工程师25k-50k

广州经验5-10年大专及以上爬虫工程师
岗位所属职位类型
全职

  • 工具类产品
  • 电商平台
  • Python
唯品会
分享到微信
微信扫一扫,用小程序打开分享
职位诱惑:

技术氛围浓厚,爬取数据量大

职位描述:

岗位职责:

1、负责各类主流电商平台、短视频平台的数据抓取和平台搭建;

2、负责反爬虫策略研究,代理IP、验证码识别等采集支撑服务建设;

3、负责大规模文本、图像数据的抓取、抽取,去重、分类,垃圾过滤,质量识别等工作;

4、负责公司爬虫的技术调研以及策略优化;


任职要求:


1、熟悉app端数据抓取(有逆向、脱壳等经验),掌握Apktool、dex2jar、JD-GUI、frida、ida等工具,能独立完成主流电商平台和主流app软件大量级的数据抓取;

2、三年以上大规模爬虫/反爬经验,熟悉HTTP协议/浏览器原理/前端JS/APP抓取,有大数据量、大并发项目经验者优先,有电商网站和移动端数据爬取技术经验者优先;

3、熟悉至少Python、Java、JavaScript中的一种语言;精通一种开源爬虫框架,如scrapy、webmagic、nutch、heritrix等等,有开发爬虫框架经验优先;

4、有解决复杂的反爬限制实践经验, 能解决如图片验证码/滑块/账号限制/ip限制等问题,熟悉反爬虫、签名破解、验证码识别技术者优先;

5、具有数据挖掘、自然语言处理、信息检索、机器学习背景者优先

附加信息:

  • 候选人加分项:非自动化爬虫,逆向抓取

工作地址

广州 - 海珠区- 鼎新路128号唯品会总部大厦查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    聊得挺愉快,环境挺好,几轮面试官挺好
    [其他评价]
    环境挺好,几轮面试官挺好
    (25)
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    环境高大上
    [面试过程]
    工作看缘分~我也无法预计我会见到谁~遇到谁~又会和哪些小伙伴共事~泰然处之吧~一面大概一小时后就让回去等消息了~我还没来得及问以后工作地点是否会搬到琶洲呢~还有加班幅度大不大呢~
    (49)
  • 评价人头像匿名
    半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试效率高
    环境高大上
    面试官是大牛
    [面试过程]
    突然发现面试也能对自己的技能做出提升,面试官非常棒,虽然没能通过,不过收获很多,非常感谢
    (69)
唯品会(中国)有限公司

唯品会

  • 电商平台

    领域
  • 上市公司

    发展阶段
  • 2000人以上

    规模
  • http://www.vip.com

    公司主页

相似职位