【大数据研发工程师】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

大数据研发工程师-ROI方向
[北京·海淀区] 1天前发布

30k-60k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、综合收入和支出，预测用户生命价值，打造渠道投放和内容采买评估体系； 2、基于用户表现，建立用户衰减模型，打造DAU预测和多产品互导平台； 3、整合业务、财务、人力数据，提供一站式查询平台。职位要求： 1、强悍的编码、系统设计和troubleshooting能力； 2、熟悉至少一个分布式框架，如Hadoop、Hive、Spark、Storm、Kafka、Flink等； 3、有扎实的数据结构和算法功底，熟悉统计学习、机器学习、深度学习中一项或多项； 4、有数据挖掘、指导业务策略的经验（如渠道投放、内容采买和产品互导等）优先。
大数据研发工程师
[上海·浦东新区] 1天前发布

18k-24k 经验3-5年 / 本科

51JOB

工具类产品 / 上市公司 / 2000人以上

团队背景隶属于6767搜推工程策略组6767，是公司搜索与推荐业务的核心技术支撑团队。团队技术氛围开放，鼓励创新实践，团队成员具备丰富的分布式系统与海量数据处理经验。岗位职责作为大数据研发工程师，你将深度参与搜推业务链路的实时与离线数据处理体系建设，核心工作包括但不限于： 61基于Flink/Spark 构建用户行为数据的实时(或近实时)采集、清洗、聚合与特征计算链路，实现用户兴趣标签、行为序列、实时偏好等画像特征的更新与存储； 61设计高并发、低延迟的实时数据管道，对接搜索/推荐业务的实时请求，支撑个性化排序、精准召回等策略的实时反馈优化； 61通过Redis/Elasticsearch/OpenSearch实现画像特征的实时存储与高效检索，保障下游业务（如前端展示、策略调用）的低延迟访问。 61负责离线数据仓库的开发与维护（使用Spark/MaxCompute），完成海量用户行为数据的ETL、数仓分层建模与指标计算； 61基于阿里云Lindorm/MaxCompute/DataWorks等工具，优化数据存储成本与计算效率（如冷热数据分层、任务调度调优），支撑业务方的高效取数与分析需求； 61针对搜推业务中的复杂场景（如跨域数据关联、实时+离线特征一致性、大规模稀疏特征处理），设计可扩展的技术方案并推动落地；任职要求 61**本科及以上学历，计算机相关专业，大数据开发相关经验； 616767熟练掌握并使用6767（Flink，Spark Spark SQL/DataFrame、DataWorks调度等），有海量数据（TB级以上）的ETL与数仓开发经验； 61熟悉消息队列（Kafka必备）、搜索引擎（Elasticsearch/OpenSearch加分）、缓存（Redis等）及云原生大数据组件（阿里云Lindorm/MaxCompute/DataWorks优先）的原理与应用； 61具备扎实的编码能力（Java/SQL至少一种），熟悉Linux环境与常用脚本工具，有分布式系统调优经验（如JVM调优、任务并行度优化等）。 61具有良好的沟通能力和组织协调能 6767加分项：6767 61有实时画像/风控平台建设经验，熟悉用户行为特征工程、规则引擎或模型推理链路集成； 61理解搜索/推荐业务逻辑，了解排序策略、召回链路与数据特征的关联性； 61对数据敏感，具备较强的业务抽象能力与问题排查能力（如通过日志/指标定位数据延迟、丢失或不一致问题）。
大数据开发工程师
[上海·张江] 1天前发布

20k-35k·15薪经验3-5年 / 本科

信也科技

金融 / 上市公司 / 2000人以上

工作内容职位描述： 1. 参与数据仓库规划、架构及研发，包括离线、实时的数据模型规划，建设PB级的数据集市和数据平台。 2. 负责数据模型的规划、架构、开发以及海量数据下的性能调优，复杂业务场景下的需求交付。 3. 参与平台数据治理相关工作，负责数据质量、数据一致性及稳定性保障等建设。 4. 深入业务，与业务团队紧密合作，理解并合理抽象业务需求，发掘数据价值，以数据驱动业务不断发展。 5. 关注行业技术趋势，引入新技术和工具，持续优化大数据处理流程与性能，提升业务的数据处理效率和价值产出。岗位要求任职要求： 1. 本科及以上学历，计算机、软件工程、数据分析或相关专业出身，2-5年大数据开发经验。 2. 掌握Java, Python等至少一门语言，熟悉常用数据结构与算法。 3. 熟悉大数据生态技术栈，具备较丰富的Hadoop，Hive，Spark，Flink等开发经验。 4. 精通数据仓库理论体系，对分层设计、维度建模等有深刻的认识和实战经验，熟悉不同建模方法的优劣。 5. 积极主动贴近业务，有良好的沟通协调能力，数据敏感度高，能够快速理解业务模型及数据模型，从业务角度出发分析和解决数据问题。 6. 具备优秀的问题解决能力和团队协作精神，对大数据技术充满兴趣，学习能力和自我驱动力强 7. 有数据中台建设经验优先。有数据分析能力、指标体系搭建或BI相关经验优先。有互联网工作经验优先。 8. 加分项：英文沟通表达、云平台（如阿里云、AWS、Google Cloud）经验。
大数据高级研发工程师
[上海·徐汇区] 1天前发布

25k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、为大规模推荐系统设计和实现合理的数据系统； 2、生产系统的Trouble-shooting，设计和实现必要的机制和工具保障生产系统整体运行的稳定性； 3、打造业界领先的流式计算框架等分布式系统，为海量数据和大规模业务系统提供可靠的基础设施。职位要求： 1、对大数据系统有深入的了解，在生产环境有TB级别Flink实时计算系统开发经验，深入掌握Flink DataStream、FlinkSQL、Flink Checkpoint、Flink State等模块，有Flink源码阅读经验优先； 2、熟悉常见消息队列原理和应用调优，有Kafka、Plusar、RocketMQ等项目源码阅读经验优先； 3、熟悉Java、C++、Scala、Python等编程语言，有出色的编码和Trouble-shooting能力； 4、乐于挑战没有明显答案的问题，对新技术有强烈的学习热情，有PB级别数据处理经验加分； 5、有数据湖开发经验，熟悉Hudi、Iceberg、DeltaLake等至少一项数据湖技术，有源码阅读经验优先； 6、熟悉其他大数据系统经验者优先，YARN、K8S、Spark、SparkSQL、Kudu等；有存储系统经验加分，HBase、Casscandra、RocksDB等。
大数据平台运维开发
[上海·张江] 1天前发布

19k-28k·15薪经验3-5年 / 本科

信也科技

金融 / 上市公司 / 2000人以上

岗位职责： 1. 大数据平台组件运维及优化，进行必要的二次开发； 2. 数据湖、数据仓库技术研究及落地； 3. 实时、离线数据产品设计及开发。任职要求： 1. 本科及以上学历，计算机及相关专业； 2. 3-5年Java/Scala开发经验，熟悉多线程编程； 3. 熟悉大数据生态相关技术，有二次开发经验者优先； 4. 熟悉实时及离线数仓架构及开发流程，有Phoenix/StarRocks使用经验优先； 5. 熟悉常见设计模式，熟悉如Spring/SpringMVC/Mybatis等主流框架； 6. 有较强的学习能力与逻辑思维能力，良好的团队合作精神。
ai大数据开发主任
[南京·双龙大道] 1天前发布

40k-60k·15薪经验10年以上 / 本科

中国一汽

汽车丨出行 / 未融资 / 2000人以上

工作职责１.负责自动驾驶数据平台、仿真平台、标注平台、训练平台及相关工具链的架构设计和研发工作，打造符合前瞻、量产智驾技术研发需要的数据闭环２.负责大规模、可伸缩计算集群系统的解决方案的设计和搭建，以及核心技术的研究、开发和优化，负责平台长期运维支持和架构优化３.负责自动驾驶软件系统框架架构设计和开发，与硬件、算法和测试团队合作，持续集成并优化自动驾驶系统４.负责量产车型的数据驱动影子模式、数据记录等车端功能设计、系统架构和开发工作要求 1.学历要求：**本科及以上学历，英语CET-4及以上， 2.工作经验：具有6年及以上相关工作经验，特别优秀者可适当放宽 3.其他： ① 计算机科学与技术、软件工程专业、自动化控制专业、人工智能等相关专业优先 ② 满足以下条件之一： 1）熟悉软件开发流程、具备扎实的算法和数据结构、算法、操作系统、网络、数据库等知识 2）熟悉几何、计算机图形学、动态系统建模等理论和方法 3）精通C/C++/Go/Python/nodejs一种或多种编程语言，熟悉HTML/CSS/React/REST 4）熟悉Linux/RTOS环境下开发与调试，有嵌入式操作系统和实时操作系统的内核或驱动开发经验，有多进程多线程、中间件、计算机视觉应用（OpenCV）、CUDA、TensorRT等开发经验优先 5）有丰富的Gin/Pylons/Django Web框架开发经验 6）熟悉PyTorch，TensorFlow,TensorRT等深度学习框架，有模型训练、调优相关经验 7）熟悉Spark/K8S相关技术，有相关开发经验，有过海量数据系统开发经验优先，有过集群系统开发、部署和优化经验优先 8）熟悉软件开发流程以及DevOps完整流程，熟悉DevOps相关系统原理，有相关工具和使用经验、如Jenkins,Argo, K8S,Docker,Kubernetes等 ③ 工作认真负责，具有良好的团队合作能力、沟通协调能力和学习能力 ④ 有Tier 1或主机厂相关工作经验优先
智慧政务经营主管/大数据与人工智能经营主管
[郑州·金水区] 1天前发布

10k-15k 经验不限 / 本科

大河网数字

IT技术服务｜咨询,新媒体,文化传媒 / 不需要融资 / 150-500人

■岗位职责负责智慧政务、智慧城市业务国内、省内党政机关、企事业单位的市场开拓、活动策划和项目运维；负责大河智库（大数据与人工智能）业务国内、省内党政机关、企事业单位的市场开拓、营销策划和项目运维。 ■岗位条件（1）学历：普通高招大学本科及以上学历。（2）年龄：原则上本科生不超过28周岁，硕士研究生不超过30岁，特别优秀者可适当放宽。（3）专业：新闻与传播学、文学、法学、商学、经济学、统计学、管理学、马克思主义哲学、历史文化学、文化产业与旅游管理学、广播电视编导、摄影摄像、导演剪辑、市场营销学、经济金融、工业设计、电子商务、公共事业管理等相关专业。（4）基础能力：熟悉我国国体、政体，谙熟党政机关、企事业单位（包括金融保险证券投资、大型国企、上市公司等）的运行机制，了解智慧政务、智慧城市、智慧产业、大数字与人工智能在本行业的应用和运行规律，掌握政务、媒体行业信息化项目的发展趋势、业务流程和操作规范；具备2-3年项目管理经验，精通项目管理的知识体系，如项目启动、规划、执行、监控和收尾等各个阶段的工作流程和方法，熟悉项目管理工具和技术；具备优秀的协调沟通能力、团队管理能力、实践管理能力和问题解决能力；具备风险管理知识，能够识别、评估和应对项目中的风险；了解质量管理知识，确保项目交付成果符合质量标准。（5）放宽及优先条件具有符合本岗位特殊才能的，学历和年龄可适当放宽；具有相关从业经历、从业经验且业绩卓著的，或者有客户资源、媒体工作经验的，学历和年龄可适当放宽，并优先考虑；其他符合放宽或优先条件的。
大数据开发工程师
[上海·浦东新区] 1天前发布

18k-24k 经验不限 / 本科

51JOB

工具类产品 / 上市公司 / 2000人以上

岗位职责作为大数据研发工程师，你将深度参与搜推业务链路的实时与离线数据处理体系建设，核心工作包括但不限于： •基于Flink/Spark 构建用户行为数据的实时(或近实时)采集、清洗、聚合与特征计算链路，实现用户兴趣标签、行为序列、实时偏好等画像特征的更新与存储； •设计高并发、低延迟的实时数据管道，对接搜索/推荐业务的实时请求，支撑个性化排序、精准召回等策略的实时反馈优化； •通过Redis/Elasticsearch/OpenSearch实现画像特征的实时存储与高效检索，保障下游业务（如前端展示、策略调用）的低延迟访问。 •负责离线数据仓库的开发与维护（使用Spark/MaxCompute），完成海量用户行为数据的ETL、数仓分层建模与指标计算； •基于阿里云Lindorm/MaxCompute/DataWorks等工具，优化数据存储成本与计算效率（如冷热数据分层、任务调度调优），支撑业务方的高效取数与分析需求； •针对搜推业务中的复杂场景（如跨域数据关联、实时+离线特征一致性、大规模稀疏特征处理），设计可扩展的技术方案并推动落地；任职要求 •**本科及以上学历，计算机相关专业，大数据开发相关经验； •熟练掌握并使用（Flink，Spark Spark SQL/DataFrame、DataWorks调度等），有海量数据（TB级以上）的ETL与数仓开发经验； •熟悉消息队列（Kafka必备）、搜索引擎（Elasticsearch/OpenSearch加分）、缓存（Redis等）及云原生大数据组件（阿里云Lindorm/MaxCompute/DataWorks优先）的原理与应用； •具备扎实的编码能力（Java/SQL至少一种），熟悉Linux环境与常用脚本工具，有分布式系统调优经验（如JVM调优、任务并行度优化等）。 •具有良好的沟通能力和组织协调能加分项： •有实时画像/风控平台建设经验，熟悉用户行为特征工程、规则引擎或模型推理链路集成； •理解搜索/推荐业务逻辑，了解排序策略、召回链路与数据特征的关联性； •对数据敏感，具备较强的业务抽象能力与问题排查能力（如通过日志/指标定位数据延迟、丢失或不一致问题）。
风控定价岗（大数据方向）
[深圳·南山区] 1天前发布

22k-32k·16薪经验1-3年 / 本科

腾讯微保

科技金融 / 不需要融资 / 500-2000人

"职位描述： 1、负责保险业务风险管理，包含但不限于保险产品赔付率分析、逆选择及欺诈风险特征和模式梳理 2、基于大数据与机器学习、数据挖掘等方法构建风险识别模型，支撑保险业务全流程生命周期的风险管理与风险洞察； 3、建设公司内外的数据合作流程和规范，探索、建设及接入保险相关的风险画像及风险模型； 4、深入理解业务，探索业务经营和业务创新的需求洞察，并进行技术预研；职位要求： 1.本科及以上学历；计算机、数学、统计精算等相关专业背景，至少熟悉一门编程语言（python,SAS,R等); 2.有2年以上金融风控数据分析与建模经验、对金融业务的风险有比较深刻的理解，熟悉大数据建模方法和风控策略体系构建方法; 3.熟悉常用的特征工程、机器学习和数据挖掘相关算法，熟悉spark,hadoop等大数据平台优先; 4.有保险定价、核保、核赔、医疗健康业务的从业经验者优先；有对外大数据合作及联合建模经验者优先; 5.沟通协调能力强，性格开朗客观，积极主动，有较强的业务理解能力、抗压能力及主动性; 6.有一定的产品经理意识、与技术方向的独立思考及规划能力。"
AI大数据开发主管（前后端开发）
[长春·经济开发区] 1天前发布

12k-20k·17薪经验5-10年 / 本科

中国一汽

汽车丨出行 / 未融资 / 2000人以上

1、负责车联网大数据应用平台相关系统研发、优化、及系统架构等相关工作； 2、深入发掘和分析车联网大数据应用相关业务需求，提出技术及产品改进建议，输出技术方案和系统设计； 3、具有一定的技术架构思维，确保设计的技术方案、开发的代码有较高性能、质量保障、扩展性，前瞻性； 4、对技术有较强的钻研及学习精神，能够深入了解开源技术、现有系统技术等相关技术原理，出现问题时能够通过较强的技术手段较好的解决问题。 1.工作经验：5年以上Java全栈开发经验，有前端开发经验优先，有大型分布式、高并发、高负载、高可用型系统设计开发经验者优先，具有车联网大数据应用平台开发及架构相关经验优先 2.其他： ①、Java基础扎实，熟悉Java虚拟机原理、Java高级特性和类库、Java网络与服务器编程、Java多线程编程以及常见开源产品 ②、精通掌握Spring等开源框架，对spring boot、spring cloud等微服务开源框架有深入了解，熟练掌握主流的前端技术 ③、熟悉现有互联网常用的缓存、消息队列、数据库及中间件技术 ④、熟悉微服务设计与开发，有Docker/K8s相关经验 ⑤、熟练使用Linux系统，有CI/CD经验 ⑥、具备模块或子系统的架构设计能力，掌握常见的架构设计方法和模式，理解大型网站所需要用到的架构和技术 ⑦、熟悉敏捷开发，有良好的表达和沟通能力
Spark大数据组件专家（南京/深圳办公） (MJ013721)
[杭州·长河] 1天前发布

40k-60k·15薪经验5-10年 / 本科

SHEIN

电商平台 / C轮 / 2000人以上

（此岗位需要在南京或者深圳办公）岗位职责： 1.大数据新技术规划、调研、选型及推广落地。 2.负责大数据组件内核开发优化，推进组件容器化，进行组件二次开发与适配等工作。 3.日常负责大数据框架组件的性能优化，稳定性保障，异常监控及线上问题对接解决。 4.参与平台功能研发，提供业务系统化的解决方案。任职标准： 1.至少6年以上相关经验，有扎实的计算机编程基础，精通java/scala,熟悉jvm的原理和调优。 2.精通spark/hive/flink组件原理和内核优化，有超大规模数据计算的架构设计和优化经验。 3.掌握大数据行业趋势，熟悉Kubernetes/Docker，有组件容器化相关经验。 4.具备较强的问题解决能力，能独立分析和攻坚复杂的技术难题。 5.有公有云使用经验者优先。 6.有良好的服务意识、沟通能力和团队协作精神。
智慧政务经营主管/大数据与人工智能经营主管
[郑州·金水区] 1天前发布

5k-10k 经验1-3年 / 本科

大河网数字

IT技术服务｜咨询,新媒体,文化传媒 / 不需要融资 / 150-500人

■岗位职责负责智慧政务、智慧城市业务国内、省内党政机关、企事业单位的市场开拓、活动策划和项目运维；负责大河智库（大数据与人工智能）业务国内、省内党政机关、企事业单位的市场开拓、营销策划和项目运维。 ■岗位条件（1）年龄：原则上本科生不超过28周岁，硕士研究生不超过30岁，特别优秀者可适当放宽。（2）专业：新闻与传播学、文学、法学、商学、经济学、统计学、管理学、马克思主义哲学、历史文化学、文化产业与旅游管理学、广播电视编导、摄影摄像、导演剪辑、市场营销学、经济金融、工业设计、电子商务、公共事业管理等相关专业。（3）基础能力：熟悉我国国体、政体，谙熟党政机关、企事业单位（包括金融保险证券投资、大型国企、上市公司等）的运行机制，了解智慧政务、智慧城市、智慧产业、大数字与人工智能在本行业的应用和运行规律，掌握政务、媒体行业信息化项目的发展趋势、业务流程和操作规范；具备2-3年项目管理经验，精通项目管理的知识体系，如项目启动、规划、执行、监控和收尾等各个阶段的工作流程和方法，熟悉项目管理工具和技术；具备优秀的协调沟通能力、团队管理能力、实践管理能力和问题解决能力；具备风险管理知识，能够识别、评估和应对项目中的风险；了解质量管理知识，确保项目交付成果符合质量标准。（4）放宽及优先条件具有符合本岗位特殊才能的，学历和年龄可适当放宽；具有相关从业经历、从业经验且业绩卓著的，或者有客户资源、媒体工作经验的，学历和年龄可适当放宽，并优先考虑；其他符合放宽或优先条件的。
大数据开发工程师
[广州·天河北] 1天前发布

12k-20k 经验3-5年 / 本科

广州南天

数据服务 / 上市公司 / 500-2000人

【岗位职责】 1、负责基于hive、spark、flink技术的大数据平台需求分析、设计及开发工作； 2、负责基于datax、HQL、传统ETL 或基于spark、flink的大数据平台数据抽取、清洗、转换、加工等入仓的开发，优化大数据平台跑批作业； 3、负责使用Dolphinscheduler（海豚调度）批量配置跑批调度任务及调度优化工作； 4、负责使用flink采集并加工kafka、binlog等数据源。【岗位要求】 1、能熟练使用大数据基础组件，不限于hdfs/kudu、hive、impala、yarn、Tez/spark、flink、hbase、sqoop、flume、datax、elasticsearch、kafka等，熟悉相关架构和原理，有一定的组件性能调优能力； 2、有CDH/CDP平台使用经验，熟悉基于Cloudera Manager的平台使用管理； 3、具有airflow/azkaban/xxl-job/Dolphinscheduler等一种基几种调度工具的开发使用经验，有Dolphinscheduler使用经验优先； 4、具备海量数据采集、加工、分析处理、高并发查询等数据平台的开发设计能力，并有具体的构建海量数据存储、离线/实时数仓等项目实施经验； 5、具有金融行业大数据平台实施项目经验； 6、了解常见的大数据产品和技术路线，如：ClickHouse、Doris、GBase、Kylin、Linkis、Flink CDC、Hudi/Iceberg等更优； 7、学习能力强，适应能力好，有强烈的责任心，主动关注数据发现问题并提出解决方案，具备良好的沟通能力及团队合作精神。
大数据运维岗
[北京·永顺] 1天前发布

15k-22k 经验不限 / 本科

阳光保险集团

金融 / 不需要融资 / 2000人以上

岗位描述： 1.负责大数据平台调度作业的日常监控、维护及协助优化； 2.负责建立大数据开发规范并持续完善，能够对技术风险、技术交付质量进行管控； 3.负责常规需求中底层数据开发及数据服务封装开发； 4.深入理解数据平台架构，发现并协助解决性能屏障； 5.新技术研究和应用，并推动适合的技术应用于生产。任职要求： 1.本科及以上学历，计算机及软件工程相关专业； 2.2年以上大数据系统开发或运维经验，熟悉hadoop生态圈、CDH大数据平台； 3.熟悉数据规范流程及数据维度模型，精通sql、shell，了解spark、python、scala、flink； 4.具有较强的计算机网络、系统运维专业基础，熟悉掌握常用linux命令； 5.有体系化大数据平台运维工作经验优先考虑。
大数据工程师
[东莞·塘厦镇] 1天前发布

25k-35k·13薪经验3-5年 / 本科

嘉佰达科技

硬件,物联网,电商 / 未融资 / 500-2000人

岗位职责： 1.承担建设基于Hadoop/Spark生态的大数据离线/实时处理平台； 2.参与业务数据.生产日志的抽取.转储.检索等相关工作； 3.跟进大数据前沿技术的发展，将合适的技术方案适时引入业务场景。任职要求： 1.3年以上计算机.统计.数学等相关本科或以上学历； 2.掌握Hadoop.HBae.Hive.Kafka.Flume.Spark等大数据技术； 3.掌握数据挖掘，python，机器学习经验者优先； 4.有较强的学习能力，勤奋踏实，责任心强，有较强的沟通协调能力，有一定创新能力；