Python及数据平台开发工程师8k-13k

武汉经验3-5年本科及以上算法工程师
岗位所属职位类型
全职

  • 人工智能服务
  • Hadoop
  • 数据挖掘
理工数字研发中心
分享到微信
微信扫一扫,用小程序打开分享
职位诱惑:

五险一金,带薪年假,节日福利

职位描述:

一、职位描述
1、对指定的多个网站进行网页抓取、数据提取;负责网络数据抓取规划、清洗以及汇总的开发工作;
2、负责特殊网页采集任务的分析及采集方案设计;
3、参与爬虫架构设计和研发,满足产品中数据抓取的要求;
4、参与爬虫核心算法和策略优化研究;
5、抓取调度和策略优化,实时监控爬虫的进度和警报反馈;
6、爬虫核心系统, 数据平台的研发维护。


二、职位要求
1、 本科及以上学历,计算机相关专业;3年以上开发经验,2年以上Hadoop相关工作经验;
2、具有数据挖掘、信息检索、机器学习开发经验;
3、精通HTML语言,熟悉JS,Ajax,熟悉Lucene、Nutch、Heritrix、larbin、HtmlParse、Scrapy、Crawler4j、WebMagic、WebCollector等开源工具;
4、精通网页抓取原理及技术,从结构化的和非结构化的数据中获取信息;
5、熟练使用一门以上脚本语言(PHP/PYTHON/JAVA/Node.js/SQL/R语言 等);
6、熟练Hadoop大数据平台的核心框架 (HDFS, Pig, Hive, Sqoop, oozie, Zookeeper, Spark, Storm, Kafka 等);
7、精通网络编程,熟悉HTTP传输协议,能模拟浏览器操作爬虫;
8、有丰富Java /Python开发经验者优先;熟悉MySQL、Oracle及有集群数据库开发经验者优先。
9、具备web挖掘等搜索引擎相关知识,有从事网络爬虫、网页去重、网页信息抽取的经验。以解决技术难题为乐,对程序完美有偏执追求;具有团队精神,有想法,敢于挑战自我。 

工作地址

武汉 - 洪山区- 洪山区街道口群光百脑汇20层查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官很nice
    [面试过程]
    面试官挺好的,公司环境还可以
    (0)
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官是大牛
    面试官很nice
    环境一般般
    [面试过程]
    笔试加面试,面试面了2轮技术,过程很轻松,引导式的。感觉是个能学习的平台,技术团队很强大,竞争也激烈。HR不在_(:з」∠)_还是挺期待的。面试官真的不错!!!办公环境一般般,可能更偏向技术方向吧_(:з」∠)_ps:2个半点面试时长完全没感觉!面试过程真的挺和谐。
    (21)
  • 半年前
    • 描述相符
    • 面试官
    • 公司环境
    面试官是大牛
    面试官很nice
    面试效率高
    [面试过程]
    面试官很厉害,很佩服,我会向他看齐。
    (0)
武汉理工数字传播工程有限公司

理工数字

  • 数据服务|咨询,工具类产品

    领域
  • D轮及以上

    发展阶段
  • 150-500人

    规模
  • http://www.dcrays.cn/

    公司主页

相似职位