数据工程师20k-30k

北京经验3-5年本科及以上大数据开发工程师
岗位所属职位类型
全职

  • 人工智能服务
  • Python
北京智源人工智能研究院认知模型与数据研究
分享到微信
微信扫一扫,用小程序打开分享
职位诱惑:

七险一金 带薪年假 免费午餐 大咖带队

职位描述:

岗位职责:
1. 负责研究院数据采集工作,包括文本、图片、视频等多种类型数据,持续更新和扩大数据集规模;
2. 根据项目需求,快速进行数据抓取代码和清洗代码开发;
3. 协助研究团队对数据进行清洗、过滤、存储等处理工作;
4. 对数据平台存储的海量数据进行管理和维护。


任职要求:
1. 计算机相关专业,熟悉计算机基础知识,具有3年及以上爬虫与反爬工作经验;
2. 熟悉linux平台开发,精通Python,熟悉各种爬虫框架和工具;
3. 掌握验证码识别技术、js逆向等常用反爬技能;
4. 熟悉Socket网络编程,多线程/进程/异步code的开发,掌握TCP/IP,UDP及常见变种网络通信协议,熟练使用工具对网络协议进行报文分析和调试;
5. 熟练使用正则表达式,xpath等匹配方法,能够快速从原始数据中提取有用信息;
6. 熟练使用并可以大规模优化和集群化部署PhantomJS,webdriver,Selenium,Appium等自动化测试工具进行web/app的抓取;
7. 熟练掌握MySQL,MariaDB,Postgre等关系型DB,同时对Redis,MongoDB,ElasticSearch等非关系DB有深入的理解和工程使用;
8. 良好的沟通能力,抗压能力强,能独立解决开发过程遇到的各类问题;
9. 有大规模项目爬取工作经验优先。

工作地址

北京 - 海淀区 - 五道口- 成府路150号智源大厦查看地图

职位发布者:

拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
该职位尚未收到面试评价
北京智源人工智能研究院

北京智源人工智能研究院

相似职位