首页
职位
公司
校园招聘
课程
new
APP
登录
|
注册
进入企业版
python爬虫开发工程师
16k-18k
杭州
经验3-5年
本科及以上
后端工程师
岗位所属职位类型
全职
APP
爬虫经验
IT技术服务|咨询
数据服务|咨询
Python
恒生聚源
举报职位
分享到微信
微信扫一扫,用小程序打开分享
收藏
立即沟通
完善在线简历
上传附件简历
职位诱惑:
TOB金融行业领头公司
职位描述:
岗位描述
1.构建并优化大规模分布式数据采集系统,协助建设统一的数据采集、处理、查询、治理平台。
2.负责多渠道、多平台的各类数据源抓取,持续提升数据质量,包括数据时效性和完整性。
3.研究并分析目标站点/平台的反爬机制,设计策略规避限制;制定反爬策略,包括IP池、账号池、验证码识别等,并持续优化策略。
4.建立爬虫数据质量监控和应急响应机制,发现并解决数据采集中的异常情况(如数据缺失、重复、错误),确保采集的数据符合业务需求和质量标准,确保业务连续性。
岗位要求
1.3年及以上爬虫开发经验,本科及以上学历。
2.熟练使用Python,具备良好的编码和调试能力,具备扎实的计算机网络基础知识,了解HTTP协议和相关技术。
3.熟悉常见的爬虫框架,如Scrapy、feapder等;熟悉常用的消息组件和数据存储工具,如RabbitMQ、Kafka、MySQL、Redis、MongoDB等。
4.熟悉APP逆向,熟练使用抓包、反编译、Hook工具等,具备APP端数据抓取经验。
5.熟悉JS逆向,熟悉WEB常用反爬技术,具备通用网站数据爬取及解析经验。
6.具备良好的团队沟通能力、较强的问题解决能力和学习能力,能够独立思考和解决技术难题。
加分项
1.了解并使用过AI相关技术,有大模型采集框架使用经验的优先。
2.有通用、高效、稳定的分布式采集系统设计和开发经验的优先。
附加信息:
工作时间:周末双休
面试信息:
面试方式:到场面试
工作地址
杭州
-
钱塘区
- 恒生聚源
查看地图
职位发布者:
周佳辰
对我发布的职位感兴趣?用拉勾APP扫码,直接和我聊聊吧!
HR
今日活跃
拉勾安全提示
· 求职中如遇招聘方扣押证件、要求提供担保或收取财物、强迫入股或集资、收取不正当利益或其他违法情形,请立即举报
· 如遇岗位要求海外工作,请提高警惕,谨防诈骗
面试评价
【查看更多评价】
匿名
半年前
描述相符
面试官
公司环境
面试官很nice
[面试过程]
专业性很强。
(0)
匿名
半年前
描述相符
面试官
公司环境
面试官很nice
[面试过程]
先是笔试,在一面,在二面,然后就是offer。笔试的题目考的范围很宽,有算法,有逻辑,有数据结构,也有数据库。难度适中。初面是群面,首先是自我介绍,然后就是几个简单的问题,抢答。然后就是回去等通知。复试时单面,二对一。也是自我介绍,然后就是项目中的相关问题。目前还在等待过程中。
(0)
匿名
半年前
描述相符
面试官
公司环境
面试官很nice
[面试过程]
一轮笔试,两轮面试,终面技术总监。笔试,面试难度都不大,保持自信即可。会问一些在学校做过的项目,掌握的技术。一轮面试时群面,分别自我介绍并会问一些在校项目。终面见技术总监,技术总监人非常优雅绅士,不会问特别难的,但是会考察你的学习能力和态度。最后和hr面谈。
(0)
展开
推荐公司:
吱呀互娱
量方测绘
瀛运
富地捷
黄江茂兴
电蛮
德亿投资
苏宁易购
魏淑贞
萃乐
品尚福瑞
百姓部落
要我科技
汇中通产
默安科技
机电设备
佳兆业
财智美文
盛辉
恒祥典当
闽地建筑
职场百科:
法学专业可以从事哪些职业
八种情况表明你该辞职了
试用期离职时候大忌
hrd是什么岗位
mcn机构是什么意思
领导暗示你走人的表现
个人离职申请 简短
面试后怎么问面试结果
企业面试自我介绍怎么说
董秘工作职责有哪些
热门职位:
搜索算法招聘
深度学习招聘
数据产品经理招聘
驱动开发招聘
CTO招聘
游戏项目经理招聘
Shell招聘
行政总监/经理招聘
视觉设计经理/主管招聘
市场营销招聘
海龟英语
桃本桃
五翼文化
东华大学招聘
中国平安保险公司 高级运营专员
笑看风云 高级产品经理
网红网 北京
高薪无责底薪聘电话销售
佑谥科技
教育学硕士 招聘
斐招聘
计调仓储文员
中山招聘网
惠普打印机官网 高级ASIC设计与验证工程师
航天 高级前端工程师
中高级大数据分析
上海电气集团是国企吗
上海一美集团 招聘
其他采购/贸易类职位招聘
AE动效师
恒生聚源
数据服务|咨询
领域
A轮
发展阶段
第一财经,蚂蚁金服,云汉投资(A轮)
投资机构
500-2000人
规模
http://www.gildata.com
公司主页
相似职位