• 7k-12k 经验不限 / 本科
    物联网 / 未融资 / 15-50人
    1、负责爬取HTML页面所需数据,并对数据进行清洗、解析、归档、输出等; 2、负责设计和开发分布式的网络爬虫,数据的采集与爬取、调度、监控、自动化运行等; 3、负责实时监控爬虫的进度和警报反馈,提升爬虫系统稳定性、可扩展性。  4、负责js渲染抓取,反爬虫策略研究,验证码识别等采集支撑服务建设;  5、参与公司业务平台的数据的挖掘和分析,协助进行产品改进。 任职资格 1. 本科以上,计算机或相关专业毕业,扎实的Python基础,熟悉多线程编程环境,熟悉常见开源框架; 2、熟悉基于正则表达式、XPath、CssSelector、beautifulsoup等网页信息解析技术; 3、熟悉Scrapy、feapder等主流爬虫框架框架,能够解决封账号、封IP、验证码、网页限制爬取等问题,且有实际经验; 4、熟悉常见的反爬机制,并对反爬具有一定的应对措施策略且有一定研究,如协议破解、模拟点击等;  5、熟悉代理IP池、Headers认证和Cookie等;
  • 10k-15k 经验不限 / 本科
    物联网 / 未融资 / 15-50人
    1、扎实的编程技术功底,具备严谨的逻辑思维; 2、熟悉C#编程语言以及WinForm开发; 3、熟悉Web后台开发技术; 4、有网络爬虫开发经验者优先; 5、了解JS/VUE前端开发技术;
  • 12k-15k 经验不限 / 不限
    电商平台 / A轮 / 500-2000人
    工作职责: 1.负责爬虫服务架构设计、研发、爬虫效率的优化,完成数据采集、解析处理、入库及备份等数据日常工作; 2.负责爬虫核心技术研究、开发工作,对反爬虫屏蔽具有相应的应对策略; 任职资格: 1. 本科及以上学历,有2年及以上Python爬虫开发相关经验,理工科优先; 2. 有电商/供应链相关工作经验优先; 3. 熟练掌握python,熟悉mongoDB、redis等数据库,熟练使用linux操作系统; 4. 熟悉正则表达式、xpath等解析工具,了解前端html,css,js等相关知识。 5. 具备一定的js逆向基础。掌握常用爬虫框架(如 requests, scrapy等),有处理反爬的经验; 6. 具有良好的团队协作精神,思维活跃、逻辑严谨。
  • 10k-20k 经验不限 / 大专
    软件开发,其他 / 不需要融资 / 15-50人
    岗位职责: 1、负责公司社交工具、内容爬虫的开发与维护; 2、使用Go语言实现公司的相关产品; 3、通过单元测试、自动化以及代码审查等提升优化代码质量; 4、负责代码的重构和升级,保证代码的长期稳定性。 任职要求: 1、大专及以上学历,计算机相关专业; 2、熟悉不同的GOLANG组件或框架; 3、熟练掌握MySQL、mongodb、Redis,熟悉Linux者优先; 4、具备多线程理论知识,有多线程程序设计经验优先; 5、有良好的算法基础和清晰的编程思路,具备良好的团队合作精神; 6、有大型互联网后端服务器系统设计开发经验者优先; 7、有社交工具、内容爬虫相关经验者优先。
  • 2k-3k 经验在校/应届 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 1、了解机器人流程自动化或爬虫抓取采集相关工作经验; 2、了解主流机器人流程自动化及爬取技术及爬虫框架工具,如Selenium/Puppeteer/Scrapy/PhantomJS等; 3、熟悉Python语言,具备算法和数据结构能力; 4、熟练使用办公软件,精通Excel常用函数,具备基础数据分析处理能力; 5、优秀的分析、沟通、思考能力,良好的团队合作能力。 职位要求: 1、2025届及以后毕业,本科及以上学历在读,财务管理或计算机相关专业计算机相关专业优先; 2、学习能力强,工作积极主动,有责任心。
  • 12k-20k·13薪 经验不限 / 本科
    企业服务,数据服务 / 不需要融资 / 500-2000人
    岗位职责: 1. 根据研发任务诉求,完成数据的采集、清洗、整合、分析等工作; 2. 协助组织和调配相关数据,支持训练任务,并参与持续调优迭代; 任职要求: 1、统计/计算机/数学等相关专业,有一定的数理统计基础 2、熟悉爬虫和反爬相关技术,有数据采集、加工、分析、处理相关工作经验者优先 3、精通python,熟悉文本处理及统计分析相关技术。 4、良好的逻辑思维能力、较强的数据分析和问题解决能力。 5、工作认真细致、积极主动,有良好的执行力和高度的责任心 6、具备良好的学习能力,优秀的沟通协调能力及团队合作精神。
  • 3k-5k 经验在校/应届 / 本科
    电商,企业服务 / 不需要融资 / 150-500人
    岗位描述: 1、理解业务场景,深入挖掘和分析海量数据,得出重要的业务结论; 2、合理地将分析、模型结果展示输出,包括不仅限于分析报告、可视化工具等 ; 3、提供封装成脚本或服务的算法模型,与其他业务模块对接集成。 岗位要求: 1.***本科及以上学历,计算机、数学、统计学等相关专业,有数理统计理论基础; 2. 熟练掌握Python开发语言,熟练掌握数据库及sql,熟悉Numpy,Pandas,Matplotlib,Pytorch,Tensorflow等框架者优先; 3. 熟练掌握机器学习相关模型算法(决策树,多元回归,聚类等); 4 具备一定的开发能力,熟悉shell命令/爬虫/docker/git等工具者优先; 5. 具备较强的逻辑分析能力及良好的团队合作能力。
  • 2k-3k 经验在校/应届 / 大专
    文化传媒 / 不需要融资 / 50-150人
    公司简介: 《消费者报道》杂志社创建于1998年,是中国内地率先采用商品和服务对比测评、研究商品评价体系的专业机构,多年来专注并坚持在市场消费现象、行业服务及消费维权方面进行深入的研究、分析和应用,持续向公众传播科学消费与责任消费的理念,目前已形成全媒体、研究中心、数据中心三位一体的调研架构,为政府部门、社会组织、企业和消费者提供全面、科学、权威的调研和资讯服务。这里很纯粹,就是做事的地方——我们热衷于解决问题。 正选数据中心是消费者报道旗下独立事业部。2018年起,团队吸收了来自广东省重点电子政务项目“粤省事”、“营商环境”的技术骨干,专注于研发面向各行业垂直领域的大数据、算法、应用软件产品,先后研发上线了产品质量监测与分析系统、企业信用风险模型管理系统、企业生产销售产品库等,在各领域已逐步实现常态化、主题化、智能化的数据应用场景。本次爬虫实习生岗位为正选数据中心招聘岗位。 正选数据官网:https://www.ccrdata.cn/ 岗位职责: 1、协助实现分布式网络数据采集系统的设计与开发; 2、协助实现数据采集策略和防屏蔽规则; 3、协助维护和优化已有数据采集服务; 4、协助实现数据采集服务核心算法的策略优化研究,充分利用资源,提升网页抓取的效率和质量。 5、完成上级交办的其他工作任务(简单数据采集任务、数据统计需求)。 任职要求: 1、大专以上学历,计算机软件相关专业,具有扎实的操作系统、网络、数据库相关基础知识; 2、了解python多进程、多线程、协程、网络编程,具有有实际应用经验; 3、熟悉Linux操作系统,熟练使用常用命令,掌握MySQL、MongDB、Redis常用操作; 4、了解网页抓取原理及技术、深度抓取、动态网页技术抓取、浏览器模拟抓取技术,从结构化的和非结构化的数据中获取信息; 5、熟悉Scrapy、Selenium等爬虫框架/工具中的一种或多种; 6、了解常用验证码识别技术,熟悉行为验证码识别、模拟登陆,熟悉各种反爬机制和解决措施; 7、有团队观念,善于学习提升。
  • 4k-5k 经验在校/应届 / 本科
    专业服务|咨询 / C轮 / 150-500人
    1、负责数据采集,数据清洗等工作 2、负责公司通用爬虫管理系统中网站配置,系统维护升级等工作 任职要求: 1、24届毕业生,本科及以上学历,计算机、数学等相关专业; 2、熟悉Python编程,熟练掌握requests,scrapy等数据采集相关技术; 3、工作踏实上进,有良好的团队合作意识,沟通协助能力良好; 4、985/211优先考虑,一周出勤至少4天。
  • 4k-6k 经验在校/应届 / 本科
    企业服务 / A轮 / 15-50人
    职位描述 1、参与爬虫项目的架构设计、研发工作,改进和提升爬虫效率,对反反爬虫技术难点攻坚; 2、设计爬虫策略及系统监控,提升抓取效率和稳定性,参与分布式爬虫和数据采集系统的架构设计和开发 3、解决各类技术疑难问题,以及日常维护工作 4、分析结构化和非结构化数据,并对数据抓取、信息提取、去重、清洗 岗位要求: 1、***本科及以上学历、计算机相关专业在校生; 2、熟悉Python-Scrapy、Selenium; 3、要有反爬经验,有滑块验证码经验者优先考虑; 4、对数据采集,浏览器原理等有经验者(尤其是对postgre sql或mysql有经验者 )优先考虑; 5、具备很强的责任心和使命感,深信以数据来分析和优化业务、提供决策支持具有重要价值; 6、对数据敏感,工作细致,能在大量数据中发现规律和异常。
  • 11k-22k 经验在校/应届 / 硕士
    人工智能 / 不需要融资 / 50-150人
    互联网人工智能公司诚招长期发展的管理培训生。 有几个不同的工作内容方向, 初期培养时期同时接触 未来择一到几个方面 1,项目执行管理 2,市场营销策划 3,新媒体运营,短视频运营 4,影视行业合作,主持拍摄综艺节目录制 5,投资融资项目对接。 6,人工智能视觉研发主管 工作要求和情况 1,研究生以上学历,海归优先 2,有资源和作出贡献的员工有股份 3,工作年限不限,应届毕业生,未毕业一样欢迎。 4,公司做人工智能,你感兴趣就好,不要求你懂技术 PS:符合北京市政策情况下解决北京户口 欢迎几类人才加入 1,海内外名校毕业, 2,研发方向,懂技术或者算法,python,tensorflow,cnn,GAN,对抗网络,人脸识别,cv,深度学习,机器学习,爬虫, 3,新媒体运营,短视频运营方向,脑洞大,文案策划,热点事件快速反应,ps,pr,ae,摄影,摄像,剪辑,懂心理学优先 4,影视方向,颜值高,有才艺,善于沟通应变 5,其他方向不限定专业
  • 3k-5k 经验在校/应届 / 本科
    移动互联网,消费生活 / A轮 / 150-500人
    岗位职责: 1. 进行多平台(主要是视频类)信息的抓取和分析工作,实时监控爬虫的进度和警报反馈 2. 网页信息和APP数据抽取、清洗、消重等工作 任职资格: 1. 本科学历,计算机相关专业,2024年或者2025年毕业,可以实习半年以上; 2. 熟悉Python,有扎实的算法和数据结构能力 3. 熟悉爬虫原理,熟悉常见的反爬虫技术,熟悉常用开源爬虫框架(如 scrapy / pyspider等) 4. 掌握http协议,熟悉html、dom、xpath等常见的数据抽取技术 5. 有数据处理、数据挖掘、信息提取等经验者优先 6. 沟通能力好,认真好学,有责任心
  • 4k-6k 经验在校/应届 / 不限
    医疗丨健康,企业服务 / D轮及以上 / 500-2000人
    职位描述: 1、参与大型采集系统的架构设计和优化开发(爬虫方向) 2、解决大批量网站的通用性规则提取以及疑难站点的规则抽取问题 3、参与独立爬虫开发和后续数据处理 职位要求: 1、在校大学生,可以全职实习的优先 2、熟练使用 Python, scrapy, xpath,有pandas,numpy等数据处理经验的优先 3、有参与大型爬虫系统设计经验的优先
  • 5k-6k 经验在校/应届 / 本科
    移动互联网,企业服务 / 未融资 / 150-500人
    【岗位职责】 1、负责设计和开发网络爬虫应用,包括调度、抓取、入库等内容; 2、对抓取数据进行去重、分类、垃圾过滤、质量分析; 3、网络爬虫架构设计、功能开发及优化; 【任职要求】 1、计算机或相关专业本科以上学历; 2、熟悉搜索引擎和网络爬虫相关技术,能独立实施完成网络爬虫应用; 3、有丰富的应对反爬虫的经验,例如合理使用IP 池、验证码识别技术等; 4、优秀的执行力,面对挑战,能快速决策分析,调动资源集中突破; 5、善于总结,积极主动学习新技术,热爱爬虫工作,直面困难敢于承担责任,有较强的沟通的能力和理解能力,有较强的抗压能力。
  • 4k-6k 经验在校/应届 / 本科
    数据服务,移动互联网 / 天使轮 / 15-50人
    ---岗位职责--- 1.编写抓取互联网内容的爬虫; 2.研究各种网页、app接口,探寻特点和规律; ---任职要求--- 1.本科及以上计算机相关专业在校生,毕业前可实习6个月以上; 2.熟悉Python,掌握爬虫技术,熟悉scrapy框架、pyspider框架等,有爬虫系统开发实习经验者优先;