• 20k-40k·15薪 经验3-5年 / 本科
    金融 / 上市公司 / 2000人以上
    岗位职责: 1、负责挖掘与分析各类业务数据建立用户画像,并通过算法模型提升风控和反欺诈能力,以数据动风险决策,并提升决策效率; 2、挖掘业务需求,基于对机器学习的理解,定义不同场景下的数据解决方案,并选择有效的算法解决可能遇到的数据、场景相关问题,提升模型的性能和稳定性; 3、配合开发人员和大数据工程师完成模型的上线运行,并进行模型的监控、维护和调整; 4、跟踪模型或方案产生的业务影响,与各业务部门紧密合作,推动数据化决策。 任职资格: 1、**本科及以上学历,统计学、数学、经济学、金融等相关专业,并在数据挖掘相关工作上有1-3年工作经验,金融信贷行业的工作经验更佳。 2、扎实的机器学习和数据挖掘理论和技术基础; 3、有一定的PYTHON 和 SQL使用能力,熟悉常用数据统计、分析和建模方法; 4、较好的团队合作精神和沟通能力; 5、优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情; 6、有一定英文沟通能力。
  • 20k-40k·14薪 经验3-5年 / 本科
    金融 软件开发 / 不需要融资 / 2000人以上
    工作职责: 1、充分理解业务需求及痛点,利用数据挖掘、数据分析、机器学习等技术挖掘业务价值,解决业务需求; 2、负责风控、定价等板块具体的数据挖掘项目,包括但不限于数据加工、数据分析、特征工程、构建模型等工作,并就对应项目阶段性成果进行汇报与分享,为业务发展提供支持; 3、参与构建用户全生命周期营销管理,构建以用户运营为核心的高质量的标签体系; 4、与业务团队构建良好的合作关系,积极沟通交流,推动合作项目成功。 任职资格: 1、3年以上数据分析/数据挖掘/机器学习等相关领域经验;**本科或以上学历;熟悉保险业务优先考虑; 2、熟练使用Python/Scala/Java中一门或多门语言;熟悉Spark/Hadoop/Hive等大数据处理技术,有阿里大数据生态Maxcompute、Dataworks、PAI项目经验的优先考虑;熟练使用Sql进行数据处理; 3、熟悉机器学习基本理论、数据分析常用方法论等相关理论知识,了解概率论与统计学基础; 4、有多类数据挖掘项目的实施落地经验,全链路打通并工程化部署,且能不断优化,进而产生业务效果; 5、自我驱动,能主动深入了解业务,适应业务变化;有良好的个人表达和组织沟通能力,推进项目开展。
  • 10k-20k 经验1-3年 / 本科
    金融业 / 上市公司 / 2000人以上
    工作职责 1、针对个险业务(如增员、代理人培训、销售转化等)构建数据模型,挖掘潜在业务规律,完成业务场景落地; 2、使用数据挖掘、机器学习、大模型等技术,设计线上线下实验方案,开发部署整个系统,持续迭代业务效果。 任职要求 1、本科及以上学历,计算机或统计学、数学、机器学习相关专业优先,硕士优先; 2、1-3年数据挖掘、机器学习领域经验; 3、精通数理统计,掌握常用机器学习方法,例如:逻辑回归,GBDT、Xgboost、lightGBM等模型和实践技能; 4、了解大模型的基本原理及应用,具备大模型应用经验和模型服务化经验优先; 5、扎实的编码能力,熟练掌握Python和Hive,熟悉数据结构与机器学习模型;掌握C++者优先; 6、有较强的人际沟通、协调能力,具备与业务人员沟通数据需求的能力,有良好的团队合作精神; 7、有在机器学习、数据挖掘等领域顶会期刊的论文发表、参加业界数据挖掘比赛获奖者优先。
  • 10k-20k 经验1-3年 / 硕士
    金融业 / 上市公司 / 2000人以上
    工作职责 1、参与公司核心业务风险管控,如合规、两核、产品等方向算法设计与开发、部署、优化和落地,提升风险管控准确率及效率; 2、针对具体业务应用场景,提出合适的算法解决方案,并推动该方案在业务领域的实现; 3、使用数据挖掘、机器学习、大模型等技术,设计线上线下实验方案,与团队成员协作,开发部署整个系统,并完成实验、收集数据、效果追踪、迭代优化机器学习系统效果; 4、不断优化、提升已有算法和前沿新技术预研与落地应用。 任职要求 1、本科及以上学历,计算机或统计学、数学、机器学习相关专业优先,硕士优先; 2、1-3年数据挖掘、机器学习领域经验; 3、精通数理统计,掌握常用机器学习方法,例如:逻辑回归,聚类、关联分析、GBDT、Xgboost、lightGBM等算法和实践技能;了解大模型的基本原理及应用,具备大模型部署经验和模型服务化经验优先; 4、扎实的编码能力,熟练掌握Python和Hive,熟悉数据结构与机器学习算法;如掌握C++者优先; 5、有较强的人际沟通、协调能力,具备与技术人员沟通数据需求的能力; 6、对数据敏感,工作细致负责,具备良好的问题分析与解决能力,有良好的团队合作精神; 7、有在机器学习、数据挖掘等领域顶会期刊的论文发表、参加业界数据挖掘比赛获奖者优先。
  • 30k-50k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责保护公司电商平台的数据安全,防范和打击爬虫及其他恶意行为,研究和掌握最新的反爬虫技术,制定和实施有效的反爬虫策略; 2、深入了解上下游业务形态,可独立发起治理专项,快速定位问题并形成落地策略及效果评估闭环; 3、分析和调查电商平台上的异常流量和可疑活动,从海量设备、行为数据中发掘有价值的信息; 4、可协助进行建模工作,如特征分析、数据可视化呈现等,为团队决策提供数据支持; 5、与产品研发团队高效合作,优化技术架构和端上安全能力,建立端管云三位一体的反爬体系,量化防控效果,驱动反爬能力的不断提高。 职位要求: 1、计算机、信息安全、统计、数学等相关专业; 2、反爬相关经验,具备网络安全、数据保护和风险管理方面的专业知识,有电商经验者优先; 3、熟练掌握SQL、Python等编程语言,具有扎实的数据分析能力及学习能力; 4、深入了解常见的爬虫技术和工具,具有丰富的反爬虫经验,熟悉Web安全、网络协议、漏洞扫描等相关技术; 5、具有较强的问题解决能力,能够快速分析和处理安全事件,具备良好的团队合作精神和沟通能力。
  • 30k-45k 经验5-10年 / 本科
    工具类产品 / 上市公司 / 2000人以上
    职位描述: 我们正在寻找一位经验丰富、具有创造力的NLP/数据挖掘方向的算法工程师,加入我们的团队,负责构建和优化公司的标签挖掘、知识图谱、构建垂域的大模型,打造业界领先的AI&NLP算法团队 主要职责: 1、主导、参与、设计和构建标签体系、知识图谱的结构和关系,以支持智能推荐、问答、自然语言处理等应用。利用图谱算法和机器学习技术,从海量数据中提取和抽取出知识,填充知识图谱。 2、大规模预训练LLM,构建人才招聘领域的垂域场景下的语言大模型,基于底层基座,进行retraining or fine-tune。推动公司互动对话以及相关AI产品的落地 3、数据挖掘方向,关键词提取,支持搜索意图理解、suggest等产品的优化改进,提升用户体验 4、与其他工程师和团队合作,将知识图谱应用于产品中,实现智能化和自动化的功能。 任职要求: 1、研究生以上学历,211、985毕业优先 2、年龄在35以下,并且有互联网相关2年以上的算法工作经验 3、深入理解和掌握NLP、深度学习、LLM、数据挖掘领域的知识和技能。 4、熟练掌握Python、Spark等大数据和图谱工具,能够进行大规模数据处理和分析。 5、对算法和数据有强烈的兴趣和热情,能够在复杂的场景中进行高效的算法设计和优化。 6、具备良好的团队合作和沟通能力,能够与产品、设计和其他工程师紧密合作,完成高质量的产品。 7、热爱学习,对人工智能、NLP、数据挖掘、LLM、知识图谱充满热情,能够自我驱动并独立解决问题。
  • 15k-25k 经验3-5年 / 本科
    软件服务|咨询 / 不需要融资 / 2000人以上
    岗位描述: 1、应用前沿和经典算法,在部门业务数据上挖掘数据价值,提升人工效能,包括但不限于(LLM、NLP、图像识别等各方面) 2、分析各项影响业务提能增效的因素、各项业务细节,结合业务方向,给出可落地的整体的开发优化方案; 3、与产品/运营等配合,推进优化方案落地执行,带来业务的实际效率提升;岗位要求: 岗位要求: 1、本科及以上学历,理工科专业背景者优先考虑,2年以上数据分析相关工作经验; 2、较强的逻辑思维能力、数据敏感度,擅长利用数据发现问题及解决问题; 3、熟练掌握基本的机器学习挖掘模型,对数据挖掘的理解不仅限于模型的应用,能把各类算法融合应用,并有相应的项目落地经验; 4、熟悉深度学习模型框架优先,限于tensorflow/pytorch/keras之一,掌握基本的nlp、cv算法应用能力,如文本分类,聚类,图像分类等。 5、扎实的工程能力,熟悉SQL,ES等主流数仓工具的使用,善于应用python等技术进行数据清洗,掌握模型开发、量化、部署能力; 6、较好的主动性和分享精神,良好的沟通和协作能力。
  • 30k-50k 经验不限 / 本科
    内容资讯,短视频 / D轮及以上 / 2000人以上
    职位职责: 1、负责保护公司电商平台的数据安全,防范和打击爬虫及其他恶意行为,研究和掌握最新的反爬虫技术,制定和实施有效的反爬虫策略; 2、深入了解上下游业务形态,可独立发起治理专项,快速定位问题并形成落地策略及效果评估闭环; 3、分析和调查电商平台上的异常流量和可疑活动,从海量设备、行为数据中发掘有价值的信息; 4、可协助进行建模工作,如特征分析、数据可视化呈现等,为团队决策提供数据支持; 5、与产品研发团队高效合作,优化技术架构和端上安全能力,建立端管云三位一体的反爬体系,量化防控效果,驱动反爬能力的不断提高。 职位要求: 1、计算机、信息安全、统计、数学等相关专业; 2、反爬相关经验,具备网络安全、数据保护和风险管理方面的专业知识,有电商经验者优先; 3、熟练掌握SQL、Python等编程语言,具有扎实的数据分析能力及学习能力; 4、深入了解常见的爬虫技术和工具,具有丰富的反爬虫经验,熟悉Web安全、网络协议、漏洞扫描等相关技术; 5、具有较强的问题解决能力,能够快速分析和处理安全事件,具备良好的团队合作精神和沟通能力。
  • 12k-16k 经验3-5年 / 本科
    数据服务|咨询 / A轮 / 50-150人
    工作职责:  负责设计、开发和维护高效、稳定的数据爬虫系统;  根据业务需求,制定数据抓取策略,处理反爬机制、验证码识别、IP代理等问题;  建立数据清洗、结构化处理及存储流程,保证数据质量;  持续优化爬虫性能,提升抓取速度与稳定性;  与数据分析、产品等团队紧密协作,理解数据需求,快速响应数据抓取任务;  关注行业动态,研究新的爬取技术和反爬手段,持续提升系统能力。 任职要求:  熟练掌握至少一种编程语言(Python优先,如:Scrapy、Selenium、Playwright、Requests 等常用库);  熟悉常见网站结构、前端技术(HTML、CSS、JavaScript),能够快速分析网页数据;  熟悉常用的反爬技术及应对手段(如IP代理池、UA池、验证码识别、动态渲染处理等);  熟悉异步爬虫、分布式爬虫开发,有 Scrapy-Redis / Playwright + 分布式实践经验者优先;  熟悉常用数据库(如MySQL、MongoDB)及缓存系统(如Redis);  有大型数据采集、数据清洗、数据处理项目经验优先;  具备良好的编码习惯和文档意识,责任心强,乐于学习新技术。 加分项:  有 GraphQL 接口抓取、WebSocket 抓取、APP 抓包分析经验;  有云原生(如 Kubernetes、Docker)、大数据(如Spark、Kafka)相关技术栈经验;  有参与过爬虫平台化、数据中台建设项目经验;  有算法基础,了解简单的图像识别(如验证码OCR识别)优先。
  • 5k-10k 经验不限 / 本科
    企业服务 / 未融资 / 少于15人
    岗位职责: 1. 负责公司数据采集系统的设计与开发,实现高效、稳定的数据爬取; 2. 根据业务需求,制定数据抓取策略,优化爬虫算法,提高数据抓取速度和准确性; 3. 负责数据清洗、去重、存储等后端处理工作,确保数据质量; 4. 跟踪分析爬虫技术的发展趋势,对现有系统进行优化升级; 5. 与其他团队密切配合,完成数据挖掘、分析等相关工作; 6. 遵守相关法律法规,确保数据采集的合规性。 岗位要求: 1. 计算机相关专业本科及以上学历,2年以上爬虫相关工作经验; 2. 熟练掌握Python、Java、C++等至少一种编程语言,具备良好的编程基础; 3. 熟悉主流的爬虫框架,如Scrapy、requests等; 4. 熟悉Web前端技术,如HTML、CSS、JavaScript等; 5. 熟悉数据库技术,如MySQL、MongoDB等; 6. 熟悉Linux操作系统,能熟练使用shell脚本; 7. 具备良好的数据结构和算法基础,能独立解决复杂问题; 8. 具备良好的沟通能力和团队协作精神,能承受工作压力; 9. 有以下经验者优先: - 有大规模分布式爬虫开发经验; - 熟悉反爬虫技术,能应对网站反爬措施; - 熟悉大数据处理技术,如Hadoop、Spark等。 薪资待遇: 1. 薪资范围:面议,根据个人能力及经验水平; 2. 享有五险一金、年终奖、项目奖金等; 3. 提供完善的职业发展路径和晋升机会; 4. 提供良好的工作环境和发展空间。 联系方式: 有意者请将个人简历发送至:[邮箱地址],邮件主题请注明“爬虫工程师+姓名”。我们会尽快回复您的邮件,谢谢!
  • 7k-13k 经验1-3年 / 本科
    数据服务,企业服务 / 未融资 / 15-50人
    1、精通python语言,精通scrapy爬虫框架; 2、 精通web抓取原理及技术,从结构化和非机构化数据中获取信息; 3. 精通Html、JavaScript、XML等知识,熟悉前端异步请求方式; 4、精通自动化测试工具; 5、 熟悉一种或多种开源技术; 6、 具备一定的数据挖掘能力; 任职要求: 1、 负责为各个业务线提供垂直,精准的数据采集,抽取,存储服务 2、 设计爬虫策略和防屏蔽规则,提升网页抓取的效率和质量 3、 解决网页抓取,信息抽取等问题,构建高可用性,高扩展性网络信息采集平台 4、 能独立解决实际开发过程碰到的各类问题
  • 25k-40k 经验5-10年 / 本科
    金融 / 未融资 / 15-50人
    岗位职责: 1、负责爬虫系统架构和业务开发; 2、建立完整的数据采集、解析、入库和监控流程,并不断优化迭代完善; 3、解决常见的反爬虫问题,并建立相关的系统化策略; 4、深入理解系统数据处理流程以及业务功能需求; 5、保证数据的完整性和准确性; 6、对高难度的技术问题的探索和解决有着极强的自我驱动力。 任职要求: 1、熟悉区块链数据挖掘,掌握Frida、Xposed、APKTOOI、JADX、IDA等常用逆向工具; 2、熟悉常见的Web和APP反爬手段和策略; 3、熟练掌握Python、Javascript或Go网络编程; 4、熟悉至少一种关系型数据库(如mysql等) 5、计算机基础扎实,对数据结构、操作系统计算机网络等技术技术有一定程度的掌握; 6、五年以上的爬虫开发经验,有丰富的Web及APP逆向工程经验。
  • 10k-15k 经验3-5年 / 本科
    移动互联网,消费生活 / A轮 / 15-50人
    岗位职责: 1、负责PDF/Word/Excel等格式图文识别、分类、入库; 2、负责内外部网页内容抓取、去除干扰数据、标准化入库; 3、负责图片中文字内容识别、排版、纠错、标准化入库; 4、编写公共接口,为公司其他项目提供 PDF解析、网页解析、图文解析 等接口服务; 5、跟进OCR、爬虫、NLP前沿技术,将其工程化应用到公司产品中; 6、支持公司相关产品的研发工作。 任职要求: 1、**本科及以上学历;计算机、数学、信息技术、自然语言处理、数据挖掘相关专业;3年以上工作经验; 2、熟练使用 Python,熟悉相关环境部署,熟悉Linux常用命令; 3、熟悉 PyPDF2、PyMuPDF、Borb 等开源库,在项目中有实际使用经验; 4、熟悉 PaddleOCR、EasyOCR、Chineseocr、Tesseract、OpenCV 等开源库,有实际使用经验; 5、熟悉 Scrapy、Pyppeteer、Selenium,有实际使用经验; 6、熟练使用SQL,熟悉MySQL等关系型数据库; 7、有Django、Docker经验者优先; 8、工作积极主动,富有学习精神,愿意挑战高难度任务,编码规范。
  • 9k-15k 经验3-5年 / 大专
    软件服务|咨询,IT技术服务|咨询,人工智能服务 / 天使轮 / 15-50人
    岗位职责: 1.负责维护现有数据源爬虫系统; 2.配合业务,负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析工作; 3.负责管理并持续优化数据结果,协助数据处理,配合完善基础数据库建设; 4.负责协助相关业务开发落地; 任职要求: 1.大专及以上学历,计算机软件相关专业,或数学相关专业,3年及以上Python相关岗位工作经验; 2.熟悉Linux系统,熟悉Python语言,熟悉常用爬虫框架,如Scrapy等,并有实际项目经验; 3.熟悉JavaScript/xpath/Ajax等web知识, 熟悉WebDriver,phantomjs等工具; 4.掌握网页抓取原理及技术,了解基于Cookie的登录原理,熟悉基于正则表达式、XPath、CSS等网页信息抽取技术; 5.熟悉mysql,redis,mongodb,ES等数据库,以及对应数据的抽取入库等;; 6.有解决封账号、封IP、网页抓取、信息抽取等问题的经验,可构建完善的网络信息收集平台; 7.熟悉整个爬虫的设计及实现流程,有从事网络爬虫、网页信息抽取开发经验,熟悉反爬虫技术,有分布式爬虫架构经验; 8.有数据分析、数据挖掘相关经验者优先,有良好的沟通能力和责任感,能够承担工作压力,独立分析和解决问题者优先; 9.有数据分析产品全生命周期经验的优先;
  • 25k-35k 经验5-10年 / 本科
    新媒体 / 不需要融资 / 150-500人
    负责为海外音乐项目搜索采集数据,为团队的海外运营提供决策支持(自有项目,非乙方)。 岗位职责∣Responsibilities: 1、熟练掌握Python,熟悉Linux开发环境; 2、负责设计和开发爬虫,精通海外网页(Youtube、Spotify、Google...)抓取原理及技术,从各种web页面、APP中获取目标信息; 3、负责爬虫团队的日常工作安排及管理。 4、解决技术疑难问题,包括各种反爬、压力控制等,提升网页抓取的效率和质量。有能力解决封账号、封IP、验证码识别、图像识别等问题,有能力解决复杂的反爬限制; 5、大规模爬虫系统的设计、数据REST API的设计、开发、维护、调优,第三方数据源的对接、预处理、入库; 6、分析结构化和非结构化数据,并对数据抓取、信息提取、去重、清洗;不限于使用代码规则类进行数据清理; 7、开发代码的维护更新,Linux服务器的维护,文档维护; 8、支持部门数据需求,包括但不限于搜索数据来源、数据清洗、数据挖掘、为团队提供决策支持; 履职要求∣Requirements: 1、大学本科及以上学历,计算机相关专业; 2、耐心、细心,有较强的逻辑思考能力,和良好的工作习惯。 3、有5-10年的爬虫、数据处理、数据分析经验; 有团队管理经验;有音乐行业经验优先; 4、掌握HTML,JS,及熟悉JS反扒破解;熟悉常见的反爬虫技术如文本混淆反爬虫、验证码等; 5、熟练掌握Python数据结构与常用算法;熟悉scrapy等爬虫框架,有scrapy-redis分布式爬虫经验;熟悉正则、xpath等提取方法; 6、了解pandas、numpy掌握网络爬虫开发原理,熟悉互联网各种类型数据交互模式; 7、熟悉MySQL部署、开发与维护; 8、熟悉Linux环境,使用脚本开发维护Linux服务器; 9、具有良好的表达能力,团队合作能力;具有很强的责任心,乐于挑战,有较强的深入学习理解业务的意愿。