【大数据工程师】-招聘求职信息-拉勾招聘

推荐职位排序方式：默认最新
月薪：
不限
- 不限
- 2k以下
- 2k-5k
- 5k-10k
- 10k-15k
- 15k-25k
- 25k-50k
- 50k以上
工作性质：
不限
- 不限
- 全职
- 兼职
- 实习

大数据工程师（数据治理）-抖音电商
[杭州·余杭区] 1天前发布

25k-50k 经验不限 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责抖音电商数据治理工作，包括不限于成本、质量、效率，提升数据易用性、安全性及稳定性； 2、深入理解数据业务，发现并总结数据研发、数据成本、数据质量、数据安全等方面数据问题，提炼数据治理方法论，推动数据治理方法实施； 3、孵化并持续迭代优化数据治理产品，以系统化、智能化能力高效支撑数据业务快速发展。职位要求： 1、熟练使用SQL、Python、Java等工具进行大型数据分析及建模； 2、熟练使用Hadoop、Hive、Spark、Flink等组件进行大数据场景数据开发； 3、有较强的逻辑分析、沟通及工作推进能力，具备优秀的技术与业务结合能力； 4、对数据治理有一定的实践经验，有良好业务意识，对数据业务场景敏感，能够横向协同、跨团队整合资源，形成完整的方案解决业务/产品的问题； 5、有良好数据治理产品经验者、有实时数据研发经验者优先。
大数据开发工程师
[上海·张江] 2天前发布

20k-35k·15薪经验3-5年 / 本科

信也科技

金融 / 上市公司 / 2000人以上

工作内容职位描述： 1. 参与数据仓库规划、架构及研发，包括离线、实时的数据模型规划，建设PB级的数据集市和数据平台。 2. 负责数据模型的规划、架构、开发以及海量数据下的性能调优，复杂业务场景下的需求交付。 3. 参与平台数据治理相关工作，负责数据质量、数据一致性及稳定性保障等建设。 4. 深入业务，与业务团队紧密合作，理解并合理抽象业务需求，发掘数据价值，以数据驱动业务不断发展。 5. 关注行业技术趋势，引入新技术和工具，持续优化大数据处理流程与性能，提升业务的数据处理效率和价值产出。岗位要求任职要求： 1. 本科及以上学历，计算机、软件工程、数据分析或相关专业出身，2-5年大数据开发经验。 2. 掌握Java, Python等至少一门语言，熟悉常用数据结构与算法。 3. 熟悉大数据生态技术栈，具备较丰富的Hadoop，Hive，Spark，Flink等开发经验。 4. 精通数据仓库理论体系，对分层设计、维度建模等有深刻的认识和实战经验，熟悉不同建模方法的优劣。 5. 积极主动贴近业务，有良好的沟通协调能力，数据敏感度高，能够快速理解业务模型及数据模型，从业务角度出发分析和解决数据问题。 6. 具备优秀的问题解决能力和团队协作精神，对大数据技术充满兴趣，学习能力和自我驱动力强 7. 有数据中台建设经验优先。有数据分析能力、指标体系搭建或BI相关经验优先。有互联网工作经验优先。 8. 加分项：英文沟通表达、云平台（如阿里云、AWS、Google Cloud）经验。
白盒测试资深工程师(大数据)
[上海·张江] 2天前发布

20k-35k·15薪经验3-5年 / 本科

信也科技

金融 / 上市公司 / 2000人以上

岗位职责 1.数据质量监控:负责监控金融信贷相关业务域数仓数据的准确性、一致性和完整性，确保数据质量符合业务需求。 2.数据质量测试:设计并执行数据质量测试用例，验证数据计算逻辑、数据转换规则和数据存储的正确性 3.数据质量问题跟踪:跟踪测试中发现的数据质量问题，协调研发团队进行问题修复，并验证修复效果. 4.数据质量工具开发:参与数据质量管理平台的功能设计与开发，提升数据质量测试的自动化水平。岗位任职要求 1.学历要求:本科及以上学历，计算机科学、软件工程、数据科学或相关专业。 2.工作经验:3年以上数据测试或数据质量测试经验，有金融信贷行业经验者优先。 3.大厂背景:具有阿里、腾讯、字节跳动、百度等大厂数据测试或数据质量测试经验者优先,。 4.技术能力: a).熟悉大数据技术栈(如Hadoop、Spark、Hive、Flink等)。 b).熟悉数据质量监控工具(如Apache Griffin、Great Expectations等)。 c).具备一定的编程能力(如Python、Java、SaL等),能够编写自动化测试脚本。 d).熟悉数据治理相关工具(如数据血缘、元数据管理等)者优先。 5.业务理解:对金融信贷业务有深入理解，能够根据业务需求设计数据质量测试方案 6.问题解决能力:具备较强的逻辑思维和问题解决能力，能够快速定位数据质量问题的根本原因。 7.沟通协作:具备良好的沟通能力和团队协作精神，能够与研发、业务团队高效协作。加分项 1.有金融信贷行业数据质量测试经验者优先。 2.熟悉金融行业数据标准和监管要求者优先。 3.具备数据治理或数据资产管理经验者优先。
大数据工程师—数据平台方向（抖音风控）
[深圳·南山区] 2天前发布

30k-60k 经验3-5年 / 本科

字节跳动

内容资讯,短视频 / D轮及以上 / 2000人以上

职位职责： 1、负责字节跳动相关产品线（抖音、头条等）风控方向的数据产品开发； 2、负责数据质量，数据安全，元数据的监控，整合； 3、面向超大规模数据问题，每天处理千亿增量的用户数据； 4、设计和实现高并发关键数据服务，用数据衡量产品并驱动产品演进。职位要求： 1、熟悉互联网产品和服务的开发过程，熟悉后端技术架构，具备良好的系统设计能力； 2、善于沟通，对业务敏感，能快速理解业务背景，具备优秀的技术与业务结合能力； 3、熟悉Kafka/Flink/HBase/Doris 等实时计算引擎的开发和使用优先； 4、有大规模实时数据平台落地经验者优先。
0281S7-大数据开发工程师
[深圳·福田区] 00:00发布

10k-20k 经验1-3年 / 本科

平安人寿

金融业 / 上市公司 / 2000人以上

工作职责 1、负责大数据相关系统的开发、测试、部署及上线工作，参与代码评审，确保开发质量； 2、参与业务部门临时数据分析需求，合作开展专项数据分析工作； 3、协助运营人员处理生产问题并提供技术支持，解答业务部门反馈的数据问题及各类咨询； 4、参与公司数据分析需求调研、评估、系统分析及架构设计工作。任职要求 1、本科及以上学历，计算机、数学、统计学、管理信息类相关专业； 2、熟悉关系型数据库如Oracle、Postgresql等的使用、可熟练编写SQL实现业务逻辑，了解SQL性能调优； 3、熟悉Hadoop生态圈组件，包括但不限于Hive、Spark、HBase、Kylin、Flink、ES、Kafka等； 4、具备良好数据分析及处理能力，熟悉常见的数据处理工具，如ETL、BI工具、Python等； 5、具有较强的责任心和服务意识，良好问题分析及处理能力。
cdh大数据平台运维工程师
[北京·永顺] 23:25发布

12k-20k 经验1-3年 / 本科

阳光保险集团

金融 / 不需要融资 / 2000人以上

岗位职责: 1.负责CDH大数据平台的安装和部署； 2.负责CDH大数据平台各组件的性能优化； 3.负责CDH大数据平台各组件的运行维护和状态监控； 4.负责新技术调研，并能在团队内进行推广应用。任职资格: 1.理解大数据计算原理，精通Hadoop/Spark体系，了解大数据平台运营基本思路； 2.熟悉HDFS、HBASE、KUDU、SPARK、HIVE等hadoop核心组件，具有两年以上hadoop/Spark技术的运维经验； 3.理解MapReduce计算框架的思想，熟悉分布式计算模型； 4.至少精通一种大数据开发语言，如JAVA、scala等； 5.至少熟练使用一种脚本语言，如Shell、Python等； 6.热爱技术，工作认真、严谨，有团队精神。
大数据开发工程师
[广州·越秀区] 16:43发布

18k-35k·14薪经验5-10年 / 本科

龙腾出行

生活服务,旅游｜出行 / 上市公司 / 150-500人

岗位职责： 1、数据仓库和数据处理‌：负责大数据平台的数据仓库、数据治理和数据模型的设计与开发工作。进行日常数据报表开发，理解业务需求，发挥数据价值‌。 2‌、数据服务开发‌：负责离线和实时数据服务的设计、开发、性能调优和效果优化。构建和维护数据管道，处理ETL过程，确保数据质量和准确性‌。 3、技术研究和应用‌：参与相关项目的数据需求的实现，设计和编码工作。参与开发过程中相关技术的研究和验证‌。 ‌4、平台运维和质量管理‌：负责大数据平台的数据及相关的应用开发、调优及维护。完成日常数据质量的监控，参与大数据平台的日常运维工作‌。 5、针对数据一致性、准确性、及时性，制定数据管理与治理机制，提升数据易用性、可用性及稳定性；任职要求： 1、本科及以上学历，计算机相关专业，3-5年以上数据开发经验； 2、具备至少一个完整的大数据平台和BI系统实施经验，熟知平台建设各环节工作，包括数据采集、数据落地、仓库建设、数据平台搭建、数据应用产品开发 3、熟悉基于推荐系统的数据仓库建设方法论,有数仓模型设计及ETL开发经验；有数据仓库分层架构设定经验者优先; 4、熟悉Hadoop生态相关技术,如Hive、HDFS、Impala、Spark、Presto、Flink、Hudi、Elasticsearch、HBase、Druid、Kylin等,有基于分布式数据存储与计算平台应用开发经验,有较为系统的海量数据性能处理经验； 5、熟悉java、scala、python等语言，熟悉微服务，分布式架构，熟悉springcloud,springboot等技术开发； 6、熟悉数据仓库原理，有离线数仓、实时计算、数据挖掘、ETL、用户画像、数据可视化等设计与开发经验； 7、熟悉MySQL、PostgreSQL、NoSQL等数据库中至少一种数据中心建设方案，可以进行产品的独立部署、高可用架构和性能优化，熟悉开源社区解决方案； 8、熟悉阿里云大数据组件E-MapReduce、Dataworks、MaxCompute和国际AWS的EMR相关数据产品等，市场常见BI产品（superset、FineBI、神策数据）等相关组件者优先； 9、较强的学习能力和技术钻研能力、有自我驱动意识，对数据采集、数据治理、数据开发、数据分析、数据建模、算法等有深刻认识和实战经验。期待您的加入哟，我们为您准备丰厚福利待遇：【法定福利】：公司按国家规定购买五险一金+商业保险（员工本人及子女商业保险）+带薪年假；【节日关怀】：节日福利礼品，以及节日礼金；【公司福利】：机场及高铁的贵宾服务（龙腾卡权益）+年度员工健康体检+平安360服务（在线问诊、VIP挂号及重疾紧急入院服务）+年度2次免费洁牙服务公司提供咖啡、零食、下午茶员工活动、旅游及团建，不定期举办聚餐、唱K、电竞赛、篮球赛、拓展、旅游、生日Party等【学习与培训】：助力职业发展与提升，内外训双引擎发力助你高速发展【晋升机会】：公司设立良好的晋升机制和广阔的发展空间。
高级大数据工程师
[深圳·南山区] 1天前发布

25k-40k·14薪经验5-10年 / 本科

AfterShip

软件服务｜咨询 / B轮 / 150-500人

if (your_passions.includes('BigData')) { switch(your_stacks) { case 'Java': case 'Scala': case 'Python': console.log('Join AfterShip'); break; } } 岗位职责 1、负责公司级通用语义层 Semantic Layer 的整体架构设计、技术选型与核心模型构建，从源头解决数据孤岛和口径不一的问题，确保指标和业务口径在全公司的统一性与权威性； 2、与数据仓库团队、BI 团队建立并推行公司的数据建模与指标管理规范与流程，推动数据治理策略的执行，推广语义层的价值和使用方法，提升全公司的数据消费效率与体验； 3、持续监控和优化语义层的查询性能、数据时效性和系统稳定性，保障服务质量。同时，跟踪业界前沿（如 Headless BI、Data Fabric），结合业务发展，持续推动数据架构的演进与创新。岗位要求 1、**本科及以上学历，3 年及以上数据平台或数据架构相关经验，拥有参与或者主导构建企业级数据建模体系或指标平台的成功经验； 2、精通数据仓库建模理论（如 Kimball 的维度建模、Inmon 的范式建模）和范式理论，具备将复杂业务场景抽象和范式化为可复用数据模型的能力，拥有丰富的 SQL 调优经验； 3、熟悉主流的大数据技术栈（如 Spark、 Flink、 Iceberg），对至少一种主流 OLAP 引擎（如 ClickHouse、StarRocks、Apache Doris）有深入的实践经验； 4、熟悉 Apache Calcite、Antlr4 等 SQL 解析与优化框架，对 dbt、Cube、LookML、 AtScale 等至少一种语义层/指标平台框架或工具有深入理解或实际应用经验； 5、具备出色的业务理解和沟通协调能力，能够与数据参考、数据分析师和产品经理等不同角色进行高效协作，准确地将业务需求转化为可落地的技术方案。加分项 1、熟悉至少一种主流云平台（AWS、GCP）的数据产品生态（如 Redshift、 BigQuery等），有云上数据架构设计经验者优先； 2、对 Headless BI、 Data Fabric 等现代数据架构理念有深入研究和独到见解者优先。为什么加入我们 1、朝阳行业：国际电商 SaaS 服务赛道，国际一线投资机构加持； 2、稳健发展：团队稳健扩张，业务规模及营收每年持续稳健增长； 3、多元文化：团队来自全球 20 多个不同城市，国际化视角、扁平化管理； 4、极客氛围：拥抱开源技术，实践敏捷开发，崇尚通过工具和自动化来解决问题； 5、特色福利：AI 学习基金、一对一帮带、内部商城、提供 MacBook 及可升降办公桌。
大数据工程师
[东莞·塘厦镇] 2天前发布

25k-35k·13薪经验3-5年 / 本科

嘉佰达科技

硬件,物联网,电商 / 未融资 / 500-2000人

岗位职责： 1.承担建设基于Hadoop/Spark生态的大数据离线/实时处理平台； 2.参与业务数据.生产日志的抽取.转储.检索等相关工作； 3.跟进大数据前沿技术的发展，将合适的技术方案适时引入业务场景。任职要求： 1.3年以上计算机.统计.数学等相关本科或以上学历； 2.掌握Hadoop.HBae.Hive.Kafka.Flume.Spark等大数据技术； 3.掌握数据挖掘，python，机器学习经验者优先； 4.有较强的学习能力，勤奋踏实，责任心强，有较强的沟通协调能力，有一定创新能力；
大数据开发工程师
[上海·浦东新区] 1天前发布

18k-24k 经验不限 / 本科

51JOB

工具类产品 / 上市公司 / 2000人以上

岗位职责作为大数据研发工程师，你将深度参与搜推业务链路的实时与离线数据处理体系建设，核心工作包括但不限于： •基于Flink/Spark 构建用户行为数据的实时(或近实时)采集、清洗、聚合与特征计算链路，实现用户兴趣标签、行为序列、实时偏好等画像特征的更新与存储； •设计高并发、低延迟的实时数据管道，对接搜索/推荐业务的实时请求，支撑个性化排序、精准召回等策略的实时反馈优化； •通过Redis/Elasticsearch/OpenSearch实现画像特征的实时存储与高效检索，保障下游业务（如前端展示、策略调用）的低延迟访问。 •负责离线数据仓库的开发与维护（使用Spark/MaxCompute），完成海量用户行为数据的ETL、数仓分层建模与指标计算； •基于阿里云Lindorm/MaxCompute/DataWorks等工具，优化数据存储成本与计算效率（如冷热数据分层、任务调度调优），支撑业务方的高效取数与分析需求； •针对搜推业务中的复杂场景（如跨域数据关联、实时+离线特征一致性、大规模稀疏特征处理），设计可扩展的技术方案并推动落地；任职要求 •**本科及以上学历，计算机相关专业，大数据开发相关经验； •熟练掌握并使用（Flink，Spark Spark SQL/DataFrame、DataWorks调度等），有海量数据（TB级以上）的ETL与数仓开发经验； •熟悉消息队列（Kafka必备）、搜索引擎（Elasticsearch/OpenSearch加分）、缓存（Redis等）及云原生大数据组件（阿里云Lindorm/MaxCompute/DataWorks优先）的原理与应用； •具备扎实的编码能力（Java/SQL至少一种），熟悉Linux环境与常用脚本工具，有分布式系统调优经验（如JVM调优、任务并行度优化等）。 •具有良好的沟通能力和组织协调能加分项： •有实时画像/风控平台建设经验，熟悉用户行为特征工程、规则引擎或模型推理链路集成； •理解搜索/推荐业务逻辑，了解排序策略、召回链路与数据特征的关联性； •对数据敏感，具备较强的业务抽象能力与问题排查能力（如通过日志/指标定位数据延迟、丢失或不一致问题）。
大数据研发工程师
[上海·浦东新区] 1天前发布

18k-24k 经验3-5年 / 本科

51JOB

工具类产品 / 上市公司 / 2000人以上

团队背景隶属于6767搜推工程策略组6767，是公司搜索与推荐业务的核心技术支撑团队。团队技术氛围开放，鼓励创新实践，团队成员具备丰富的分布式系统与海量数据处理经验。岗位职责作为大数据研发工程师，你将深度参与搜推业务链路的实时与离线数据处理体系建设，核心工作包括但不限于： 61基于Flink/Spark 构建用户行为数据的实时(或近实时)采集、清洗、聚合与特征计算链路，实现用户兴趣标签、行为序列、实时偏好等画像特征的更新与存储； 61设计高并发、低延迟的实时数据管道，对接搜索/推荐业务的实时请求，支撑个性化排序、精准召回等策略的实时反馈优化； 61通过Redis/Elasticsearch/OpenSearch实现画像特征的实时存储与高效检索，保障下游业务（如前端展示、策略调用）的低延迟访问。 61负责离线数据仓库的开发与维护（使用Spark/MaxCompute），完成海量用户行为数据的ETL、数仓分层建模与指标计算； 61基于阿里云Lindorm/MaxCompute/DataWorks等工具，优化数据存储成本与计算效率（如冷热数据分层、任务调度调优），支撑业务方的高效取数与分析需求； 61针对搜推业务中的复杂场景（如跨域数据关联、实时+离线特征一致性、大规模稀疏特征处理），设计可扩展的技术方案并推动落地；任职要求 61**本科及以上学历，计算机相关专业，大数据开发相关经验； 616767熟练掌握并使用6767（Flink，Spark Spark SQL/DataFrame、DataWorks调度等），有海量数据（TB级以上）的ETL与数仓开发经验； 61熟悉消息队列（Kafka必备）、搜索引擎（Elasticsearch/OpenSearch加分）、缓存（Redis等）及云原生大数据组件（阿里云Lindorm/MaxCompute/DataWorks优先）的原理与应用； 61具备扎实的编码能力（Java/SQL至少一种），熟悉Linux环境与常用脚本工具，有分布式系统调优经验（如JVM调优、任务并行度优化等）。 61具有良好的沟通能力和组织协调能 6767加分项：6767 61有实时画像/风控平台建设经验，熟悉用户行为特征工程、规则引擎或模型推理链路集成； 61理解搜索/推荐业务逻辑，了解排序策略、召回链路与数据特征的关联性； 61对数据敏感，具备较强的业务抽象能力与问题排查能力（如通过日志/指标定位数据延迟、丢失或不一致问题）。
数据运维(大数据平台SRE工程师)
[北京·太平桥] 1天前发布

15k-30k·14薪经验3-5年 / 本科

中华财险创新研发中心

金融软件开发 / 不需要融资 / 2000人以上

职责描述： 1、负责公司大数据平台的运维保障工作，保障平台的正常运行和相应数据服务的稳定高效； 2、对接数据开发侧团队，主动优化和完善服务巡检、监控工具、脚本等，减少人工操作提高运维效率；负责数据平台的故障处置、推动性能优化。如平台产品技术问题，提交给平台产品技术组进行后台处理，并及时反馈. 3、负责数据平台二线运维支撑保障，响应运维/服务台一线请求：处置生产事件，跟踪问题处理； 4、定期组织团队人员开展大数据平台的技术知识积累和移交； 5、负责设计日常运维相关的自动化工具或系统，并完成相应需求收集和需求管理；任职要求： 1. 具有1年以上金融行业数据类项目运维经验，熟悉保险业务操作与管理。具有大数据平台相关技术进行数据仓库、数据中台开发、维护、优化等项目经验的人员，或长期在类似的运维项目上承担运维工作优先； 2. 具备较强的数据开发分析能力，熟练掌握SQL等技能，熟练掌握大数据平台、UNIX、LUNIX和中间件的技能。有java或Python开发基础优先； 3. 具备较强的数据分析，问题分析，逻辑思维能力，团队协作能力，有良好的沟通能力和责任感，能够承担工作压力，独立分析和解决问题者优先； 4. 强烈的自驱力和责任感，面对复杂业务问题，可以从业务和技术多角度推进，最终达成目标。
大数据开发工程师
[广州·天河北] 1天前发布

12k-20k 经验3-5年 / 本科

广州南天

数据服务 / 上市公司 / 500-2000人

【岗位职责】 1、负责基于hive、spark、flink技术的大数据平台需求分析、设计及开发工作； 2、负责基于datax、HQL、传统ETL 或基于spark、flink的大数据平台数据抽取、清洗、转换、加工等入仓的开发，优化大数据平台跑批作业； 3、负责使用Dolphinscheduler（海豚调度）批量配置跑批调度任务及调度优化工作； 4、负责使用flink采集并加工kafka、binlog等数据源。【岗位要求】 1、能熟练使用大数据基础组件，不限于hdfs/kudu、hive、impala、yarn、Tez/spark、flink、hbase、sqoop、flume、datax、elasticsearch、kafka等，熟悉相关架构和原理，有一定的组件性能调优能力； 2、有CDH/CDP平台使用经验，熟悉基于Cloudera Manager的平台使用管理； 3、具有airflow/azkaban/xxl-job/Dolphinscheduler等一种基几种调度工具的开发使用经验，有Dolphinscheduler使用经验优先； 4、具备海量数据采集、加工、分析处理、高并发查询等数据平台的开发设计能力，并有具体的构建海量数据存储、离线/实时数仓等项目实施经验； 5、具有金融行业大数据平台实施项目经验； 6、了解常见的大数据产品和技术路线，如：ClickHouse、Doris、GBase、Kylin、Linkis、Flink CDC、Hudi/Iceberg等更优； 7、学习能力强，适应能力好，有强烈的责任心，主动关注数据发现问题并提出解决方案，具备良好的沟通能力及团队合作精神。
AI大数据开发主管工程师
[长春·经济开发区] 2天前发布

12k-20k·17薪经验5-10年 / 本科

中国一汽

汽车丨出行 / 未融资 / 2000人以上

1、负责车联网大数据标准化接入、整车产品体验洞察、整车健康监测平台等数据应用平台的设计、开发及优化，保障数据应用服务的稳定性与可用性 2、负责车联网大数据的离线、实时数据仓库建设，负责数据的生产、建模、应用及质量体系建设 3、搭建面向数据驱动整车产品闭环的数据指标体系和BI平台 4、负责车联网数据质量、数据资产、数据治理相关的开发工作，提升数据质量及易用性 5、积极探索大数据及人工智能技术的深度应用，并落地到智能网联产品业务 1.工作经验：5年以上数据仓库经验，具备优秀的数据架构和业务抽象能力，参与过中、大型数据仓库从0到1建设的优先，具有智能网联汽车、数据治理、埋点相关经验优先 2.其他： ①、掌握大数据生态技术栈，深入了解数据平台、BI、画像、分析等方向中的一项或多项 ②、熟练使用Hadoop生态相关技术并有相关实践经验，包括Hdfs、Mapreduce、Hive、Hbase、Spark、Kafka、Flink、StarRocks等，具备海量数据加工处理（ETL）相关经验 ③、深入了解常用的数据建模理论，具有丰富的实际模型设计及ETL开发经验，可独立把控数据仓库各层级的设计，有数据治理相关经验者优先 ④、对数据敏感，有较强的逻辑分析能力，有丰富的数据处理和分析经验，有复杂业务和算法的数据平台建设经验优先 ⑤、工作认真、负责、仔细，有良好的团队合作精神，良好的分析及沟通能力
大数据开发工程师
[上海·徐汇区] 2天前发布

20k-30k·15薪经验3-5年 / 本科

关爱通

电商,企业服务 / 未融资 / 150-500人

岗位职责： 1.负责ETL相关开发工作，深度参与数据仓库的建设与优化，保障数据存储的高效性与稳定性，支撑公司战略级数据项目的落地。 2.主导复杂数据处理流程的开发与优化，基于 Python 编写高性能的数据处理脚本，结合 spark、pandas、duckdb等进行大规模数据清洗、转换与分析，实现数据挖掘与机器学习模型开发，推动数据价值的深度挖掘。 3.设计和维护基于 Airflow 的工作流调度系统，实现数据处理任务的自动化调度与监控，确保数据处理任务按时、准确执行，提升数据开发与运维效率。 4.与业务部门紧密协作，深入理解业务需求，将业务逻辑转化为数据解决方案，通过数据驱动业务决策，助力业务增长。 5.研究大数据领域的前沿技术，持续优化数据开发技术栈与流程。任职资格： 1.具备 3 年及以上大数据开发相关工作经验，拥有丰富的大数据项目实战经验，能够独立承担复杂数据开发任务。 2.熟练掌握 Python 编程，具备基于 Python 的大数据开发工作经验，能够运用 Python 进行高效的数据处理与算法实现。 3.熟悉数仓建设方法论 1)熟悉etl分层建设方法 2）熟悉主题建设方法，能独立抽象主题，建设主题，并且物理化和性能调优 3）熟悉常用的BI系统建设方法，理解实现原理，理解各个工具使用场景 4.精通大数据开发相关技术栈，包括但不限于 Hadoop、Spark、Hive 等，能够熟练运用这些技术进行数据处理与分析。 5.熟练掌握 Airflow，能够基于 Airflow 进行工作流设计、调度与监控；熟练使用相关技术进行数据处理与分析并能够运用其实现常见的数据挖掘与机器学习算法。 6.熟练掌握sql和调优。 7.熟练掌握python。加分项 1.具备统计学、数学建模等相关知识，能够运用统计方法进行数据分析与模型构建。 2.有分布式系统开发、数据可视化开发经验者优先。薪资待遇 ****，我们提供具有竞争力的薪酬体系与广阔的职业发展空间，期待优秀的你加入！